Arquivo de outubro de 2009

Carreira em alta para os profissionais que atuam com métodos analíticos.

quinta-feira, 8 de outubro de 2009

Hal Varian, economista-chefe do Google, disse: “Eu tenho dito que o trabalho dos estatísticos é o “sexy  job” dos próximos 10 anos. E eu não estou brincando”.

A carreira dos profissionais que atuam com métodos analíticos esta em alta e agora mais do que  nunca é um momento fundamental, para aproveitar as oportunidades e se preparar para os atuais e futuros desafios.

Veja a capa da última revista públicada  pela Associação Americana de Estatística (ASA).

stst

Em breve disponibilizaremos em nosso Blog, este artigo em português.


Segundo esta matéria, publicada pela ASA,  o relacionamento interpessoal é fundamental para o crescimento profissional. Bom, isso já não é segredo, mas o grande desafio é como colocar isso em prática  no nosso dia-a-dia.

Dada a relevância deste assunto, em breve a Estanislao promoverá um evento de Networking, especificamente, para os profissionais que atuam com métodos analíticos.

Fique de olho no nosso Blog para se manter atualizado.

Fique por dentro dos pacotes do R que foram lançados em Setembro/2009

quarta-feira, 7 de outubro de 2009

Esta é uma lista de pacotes novos ou atualizados que foram lançadas para o R em Setembro. Para obter uma lista completa de todas as atualizações no CRAN, consulte o site  Cranberries para setembro de 2009.

Amer, o pacote permite ajustar modelos aditivo generalizados mistos através do algoritmo de modelagem implementado no lme4.
Ant, facilita a utilização do  ant dentro do R
MICE, este pacote desenvolve métodos de imputação uni e multivariada de dados.
MLCM, este pacote contém funções para estimar a contribuição das escalas medidas por um procedimento psicofísico. As estimativas são realizadas por máxima verossimilhança.
QCA , Atualização e melhorias no pacote que desenvolve análise comparativa qualitativa (QCA)
Pacote em Java que integra o R com o Hadoop.
rms , este pacote substitui o pacote Design e fornece uma variedade de ferramentas de regressão para acompanhar o livro Regression Modeling Strategies.
SOS, substitui o pacote RSiteSearch e torna mais fácil a busca aos tópicos de ajuda.
survey,  foi atualizado, este  pacote desenvolve uma série de métodos de amostragens complexas.
tikzDevice, este novo pacote permite o Látex ler ao gráficos proveniente de outputs do R.

Rio sediará as Olimpíadas em 2016. Vitória para o Brasil e boas expectativas para os estatísticos!

sexta-feira, 2 de outubro de 2009

Os atletas têm buscado veementemente a competitividade e a alta performance. Para atingir estes objetivos, são necessários estudos e avaliações tanto dos atletas, quanto dos adversários. Neste contexto os métodos estatísticos são uma ferramenta fundamental para analisar os dados provenientes destes estudos.

Nos EUA não é novidade os estatísticos atuarem na área esportiva, Arthur Friedman trabalhou como estatístico de várias equipes esportivas, entre elas o New York Mets,  New York Rangers e Monday Night Football. Friedman em 1978 escreveu o livro intitulado The World of Sports Statistics, onde neste livro o autor já falava sobre a atuação na área esportiva.

No Brasil ainda temos muito que percorrer, então… que venham os jogos Olímpicos, a busca da  competitividade e da alta performance. Como fruto, serão geradas boas oportunidades para os profissionais aplicarem a estatística na área esportiva.

O presidente do Comitê Olímpico, Jacques Rogge, anuncia o Rio como cidade vencedora

O presidente do Comitê Olímpico, Jacques Rogge, anuncia o Rio como cidade vencedora

Rio Ganha2

imagem 3

Vamos Lá Brasil! Rio 2016.

sexta-feira, 2 de outubro de 2009

Vídeo institucional do Comitê Rio 2016, para sediar as Olimpiadas, no Brasil.

Primeiros passos com Bootstrap

quinta-feira, 1 de outubro de 2009

Bootstrap é uma técnica útil quando é necessário fazer inferências sobre estatísticas “não usuais”, como  por exemplo, na estimação dos erros dos modelos, dos intervalos de confiança ou até mesmo do R-quadrado proveniente de modelos de regressão.


Fundamento da técnica bootstrap : Uma vez que não se dispõe de toda a população de amostras (observações) faça-se o melhor com o que se dispõe que é o conjunto amostral X = (X1, X2,…Xn).


O pacote boot do R oferece algumas opções para desenvolver a técnica de bootstrap e métodos de reamostragem.


Este post apresenta um exemplo básico de bootstrap não-paramétrico (ou seja, assumindo a distribuição uniforme na geração das amostras), para estimar o R-quadrado de um modelo de regressão linear.

O modelo de regressão prevê a quantidade de milhas por galão (mpg), dado o peso do carro (wt) e o deslocamento (DISP).  A base de dados é a mtcars e o intervalo de confiança bootstrap é de 95%, baseado em 1000 repetições.


Script no R

# Bootstrap 95% CI para o R-Quadrado
library(boot)
# Função para obter o R-Quadraro a partir de uma base de dados
rsq <- function(formula, data, indices)
{
d <- data[indices,] # permite boot para selecionar amostra
fit <- lm(formula, data=d)
return(summary(fit)$r.square)
}
# bootstrapping com 1000 repetições
results <- boot(data=mtcars, statistic=rsq,
R=1000, formula=mpg~wt+disp)
# Apresenta os Resultados
results
plot(results)
# intervalo de confiança de 95%
boot.ci(results,)



Resultados


 

Bootstrap Statistics :

original         bias               std. error
t1*        0.781             0.0112         0.049

BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS

Based on 1000 bootstrap replicates

Intervals :

Level       BCa
95%   ( 0.6336,  0.8524)
 
Plot
grafico
 
Maiores informações sobre o pacote acesse:

http://cran.r-project.org/web/packages/boot/