Primeiros passos com Bootstrap

Bootstrap é uma técnica útil quando é necessário fazer inferências sobre estatísticas “não usuais”, como  por exemplo, na estimação dos erros dos modelos, dos intervalos de confiança ou até mesmo do R-quadrado proveniente de modelos de regressão.


Fundamento da técnica bootstrap : Uma vez que não se dispõe de toda a população de amostras (observações) faça-se o melhor com o que se dispõe que é o conjunto amostral X = (X1, X2,…Xn).


O pacote boot do R oferece algumas opções para desenvolver a técnica de bootstrap e métodos de reamostragem.


Este post apresenta um exemplo básico de bootstrap não-paramétrico (ou seja, assumindo a distribuição uniforme na geração das amostras), para estimar o R-quadrado de um modelo de regressão linear.

O modelo de regressão prevê a quantidade de milhas por galão (mpg), dado o peso do carro (wt) e o deslocamento (DISP).  A base de dados é a mtcars e o intervalo de confiança bootstrap é de 95%, baseado em 1000 repetições.


Script no R

# Bootstrap 95% CI para o R-Quadrado
library(boot)
# Função para obter o R-Quadraro a partir de uma base de dados
rsq <- function(formula, data, indices)
{
d <- data[indices,] # permite boot para selecionar amostra
fit <- lm(formula, data=d)
return(summary(fit)$r.square)
}
# bootstrapping com 1000 repetições
results <- boot(data=mtcars, statistic=rsq,
R=1000, formula=mpg~wt+disp)
# Apresenta os Resultados
results
plot(results)
# intervalo de confiança de 95%
boot.ci(results,)



Resultados


 

Bootstrap Statistics :

original         bias               std. error
t1*        0.781             0.0112         0.049

BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS

Based on 1000 bootstrap replicates

Intervals :

Level       BCa
95%   ( 0.6336,  0.8524)
 
Plot
grafico
 
Maiores informações sobre o pacote acesse:

http://cran.r-project.org/web/packages/boot/

 
 

Tags:

Deixe um comentário

Você precisa fazer o login para publicar um comentário.