Bootstrap é uma técnica útil quando é necessário fazer inferências sobre estatísticas “não usuais”, como por exemplo, na estimação dos erros dos modelos, dos intervalos de confiança ou até mesmo do R-quadrado proveniente de modelos de regressão.
Fundamento da técnica bootstrap : Uma vez que não se dispõe de toda a população de amostras (observações) faça-se o melhor com o que se dispõe que é o conjunto amostral X = (X1, X2,…Xn).
O pacote boot do R oferece algumas opções para desenvolver a técnica de bootstrap e métodos de reamostragem.
Este post apresenta um exemplo básico de bootstrap não-paramétrico (ou seja, assumindo a distribuição uniforme na geração das amostras), para estimar o R-quadrado de um modelo de regressão linear.
O modelo de regressão prevê a quantidade de milhas por galão (mpg), dado o peso do carro (wt) e o deslocamento (DISP). A base de dados é a mtcars e o intervalo de confiança bootstrap é de 95%, baseado em 1000 repetições.
Script no R
library(boot)
# Função para obter o R-Quadraro a partir de uma base de dados
rsq <- function(formula, data, indices) {
d <- data[indices,] # permite boot para selecionar amostra
fit <- lm(formula, data=d)
return(summary(fit)$r.square)
}
# bootstrapping com 1000 repetições
results <- boot(data=mtcars, statistic=rsq,
R=1000, formula=mpg~wt+disp) # Apresenta os Resultados
results
plot(results) # intervalo de confiança de 95%
boot.ci(results,)
Resultados
Bootstrap Statistics :
original bias std. error t1* 0.781 0.0112 0.049BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates
Intervals :
Level BCa 95% ( 0.6336, 0.8524) Plot
Maiores informações sobre o pacote acesse:
http://cran.r-project.org/web/packages/boot/
Tags: Bootstrap
