====== CE-003 Turma AMB/K/O - Primeiro semestre de 2014 ======
No quadro abaixo será anotado o conteúdo dado em cada aula do curso. \\
São indicados os Capítulos e Sessões correspondentes nas referências bibliográficas,
bem como os exercícios sugeridos.
Veja ainda depois da tabela as **Atividades Complementares**.
\\
**Referências**\\
* **B & M**: BUSSAB, W.O. & MORETTIN, P.A. (2010) Estatística Básica. **6a Edição**, Editora Saraiva
* **WEB** [[http://onlinestatbook.com/2/index.html|Online Statistics: An Interactive Multimedia Course of Study]]: Material online sobre estatística
**Observação sobre exercícios recomendados** os exercícios indicados são compatíveis com o nível e conteúdo do curso. \\
Se não puder fazer todos, escolha alguns entre os indicados.
===== Conteúdos das Aulas =====
^ ^^ B & M ^^ Online ^
^ Data ^ Conteúdo ^ Leitura ^ Exercícios ^ Tópico ^
| 10/02 Seg |Informações sobre o curso. Percepções e aplicações da estatística. |Cap 1 | -- | [[#10/02|Ver abaixo]] |
| PARTE I: PROBABILIDADES ^^^^^
| 12/02 Qua |Fundamentos das três partes deste curso: (i) probabilidades, (ii) estatística descritiva e (iii) inferência estatística.Informações sobre o curso. Percepções e aplicações da estatística. Introdução a probabilidades: definições e conceitos básicos. Experimentos aleatórios, eventos, espaços amostrais, espaços de probabilidades, definições de probabilidades. Propriedades. |Cap 5, 5.1, 5.2 |Cap 5: 1 a 14 | |
| 17/02 Seg |Probabilidades (cont). Exemplos. Probabilidade Condicional, Independência |Cap 5: 5.3 |Cap 5: 15 a 22 | [[#17/02|Ver abaixo]] |
| 19/02 Qua |Probabilidades (cont). Teorema de Bayes. Exemplos e exercícios. O problema dos aniversários, o problema de Monty Hall. Códigos e uso de simulações para estimar probabilidades. |Cap 5: 5.5 a 5.6 |Cap 5: 23 a 25 | |
| 24/02 Qua |1a avaliação semanal. Probabilidades (cont). Exemplos e introdução a variáveis aleatórias (discretas). Distribuições binomial, binomial negativa (Pascal) e geométrica |Cap 6: 6.1, 6.2, 6.6 (6.6.1, 6.6.2, 6.6.3) |Cap 6: 1 a 5, 20 e 21, 57 | |
| 03/03 Seg |Feriado Carnaval | | |
| 05/03 Qua |Feriado Carnaval | | |
| 10/03 Seg |2a avaliação semanal. Revisão e continuação - Distribuições discretas de probabilidade: Binomial, Hipergeométrica, Geométrica, Pascal (Bin. Negativa), Uniforme, Multinomial e Poisson (+ processo de Poisson) |Cap 6, Sec 6.6 e 6.7 |Cap 6: 20 a 28, 31 a 38 |
| 12/03 Qua |Valor esperado, variância, distribuição acumulada e quantis de variáveis discretas. Exercícios. |Cap 6: 6.3, 6.4, 6.5 e 6.8. |Cap 6: 7 a 19, 29, 30, 39, 40 |
| 17/03 Seg |3a avaliação semanal. Introdução a v.a. contínuas. |Cap 7: 7.1 e 7.2 |Cap 7: 1 a 4 |
| 19/03 Seg |v.a. contínuas. Cálculo de probabilidades, esperança (média), mediana e quantis (quartis, decis, percentis etc), função acumulada |Cap 7: 7.1, 7.2, 7.3, 7.8 |Cap 7: 5 a 12 (exceto 11) |
| 24/03 Seg |4a avaliação semanal. Casos especiais de v.a. contínuas. Uniforme e exponencial. A ideia de utilizar outras distribuições e as formas de cálculo de probabilidades |Cap 7.4: 7.4.1, 7.4.3, 7.7 |Cap 7: 13, 21, 28, 29, 31 |
| 26/03 Qua |v.a. contínuas: distribuição normal |Cap 7.4: 7.4.2 |Cap 7: 14 a 20, 34 a 38 |
| 31/03 Seg |v.a. contínuas: distribuição normal (cont) |Cap 7.4: 7.4.2 |Cap 7: 14 a 20, 34 a 38 |
| 02/04 Qua |1a prova |Cap 5, 6 e 7 | |
| 07/04 Seg |Outras v.a's contínuas (Beta, Gama, Weibull, t, etc). Convergência e aproximação normal à Binomial e Poisson. Transformação de variáveis. Introdução a estatística descritiva: uni e bi(multi)variada, tipos de variáveis (qualitativa: nominal e ordinal, quantitativa: discreta e contínua) |Cap 7: 7.5, 7.6 e 7.7. Cap 2: 2.1, 2.2 e 2.3 |Cap: 7: 25, 26, 39. |[[#07/04|Ver abaixo]] |
| 09/04 Qua |Estatística descritiva. Exemplos e interpretações de gráficos, tabelas e medidas. Gráficos: barras (1 e 2 variáveis), histogramas, histogramas suavizados, ramo-e-folhas, //box-plot// |Cap 1-3 | |
| 14/04 Seg |sem aula presencial | | |
| 16/04 Qua |Avaliação semanal. Medidas estatísticas - medidas de posição, dispersão, assimetria e curtose. Dados atípicos |Cap 3 |Cap 3: 1 a 41 | [[#16/04|Ver abaixo]] |
| 21/04 Seg |feriado - Tiradentes | | |
| 23/04 Qua |análises descritivas bi-dimensionais. gráficos, tabelas e medidas de associação |Cap 4 |Cap 4: 1 a 15. |[[http://onlinestatbook.com/2/describing_bivariate_data/bivariate.html|Material online]]: \\ Describing Bivariate Data |
| 28/04 Seg |Avaliação semanal. Introdução a inferência estatística |Cap 10 | |
| 30/04 Seg |Inferência estatística |Cap 10 |Cap 10: 1, 3, 7 a 13 |[[#30/04|Ver abaixo]] códigos utilizados na aula |
| 05/05 Seg |Avaliação semanal. Discussão sobre a avaliação e esquemas de amostragem. Inferência estatística |Cap 10 |Cap 10: 21 a 28 |[[#30/04|Ver abaixo]] códigos utilizados na aula |
| 07/05 Seg |Distribuições amostrais, intervalos de confiança e cálculo de tamanho de amostra. Métodos de estimação: momentos, mínimos quadrados e máxima verossimilhança |Cap 11 |Cap 11: 7, 8, 12, 13 | |
| 12/05 Seg |Avaliação semanal. Discussão sobre a avaliação e outras distribuições amostrais (variância, diferença de médias de duas populações e variâncias de duas populações) |Cap 11 |Cap 11: 14 a 21 |[[http://onlinestatbook.com/stat_sim/sampling_dist/|Material online para revisão]] |
| 14/05 Qua |Outras distribuições amostrais e resultados delas derivados. Intervalos de confiança. Exemplos e exercícios. |Cap 11 |Cap 11: 27, 29, 30 | |
| 19/05 Seg |Avaliação semanal. | | | |
| 21/05 Qua |sem aula presencial | | | |
| 26/05 Seg |Testes estatísticos de hipótese. Testes aleatorizados e baseados em distribuições amostras teóricas. Fundamentos, passos e interpretações. Exemplos. |Cap 12 |Cap 12: 6 a 12 | |
| 28/05 Qua |Testes de hipótese (cont). Mais exemplos, tipo de erros e nível descrivico (valor-p) |Cap 12: 1 a 5, 16, 17, 19, 20, 22, 24, 25, 28 a 35, 38, 39 | | |
| 02/06 Qua |Testes de hipótese (cont): testes para duas amostras. Comentários sobre transformação de dados, testes não paramétricos e aleatorizados. Testes de aderência e chi-quadrado de independência. |Cap 13 e 14 |Cap 13: 5 a 9, 16, 19, 20 a 34 | |
=== 10/02 ===
* Pesquisar exemplos de aplicações de estatística na sociedade em geral e em sua área de interesse. Trazer para discussão em sala
* Assistir e debater o vídeo: Educação estatística e sua importância: uma opinião em apenas 3 minutos! ([[http://www.ted.com/talks/lang/eng/arthur_benjamin_s_formula_for_changing_math_education.html|Um vídeo rápido para reflexão]])
=== 17/02 ===
* Resolver o problema dos aniversários: Considere uma turma de 30 alunos, qual a probabilidade de haver uma coincidência qualquer de aniversários neste grupo? Quantos pessoas são necessárias no grupo para que esta probabilidade ultrapasse 0,50?
- **Problemas para discussão:**
- Desejamos saber a probabilidade de um casal ter duas filhas (meninas) em três situações distintas:
* apenas sabendo que eles tem duas crianças
* depois que o pai comenta que tem uma filha (sem dar mais detalhes, sem indicar se é a mais velha ou mais nova etc)
* você encontra os amigos e eles estão com uma das crianças com eles que é uma menina
=== 19/02 ===
- Dois jogadores (A e B) vão jogar um jogo que consiste no lançamento de dois dados. Ambos começam com R$ 10,00. Se a soma dos dados for um número ímpar, A paga R$ 1,00 para B. Se a soma for par, B paga R$ 1,00 para A.
* quais os possíveis valores em dinheiro que os jogadores podem ter após 2 rodadas? A chance é a mesma para todos esses possíveis valores?
* quais os possíveis valores em dinheiro que os jogadores podem ter após 3 rodadas? A chance é a mesma para todos esses possíveis valores?
* o jogo é honesto?
- Considere os problemas a seguir e resolva cada uma deles de duas formas:
* Solução formal (analítica)
* Solução (aproximada) por alguma rotina computacional
- Um comitê de 12 pessoas é escolhido por sorteio de um grupo de 100 pessoas. Calcule a probabilidade dos indivíduos **A** e **B** pertencerem ao grupo escolhido.
- Um baralho de 52 cartas contém 4 cartas do tipo //ás//. Se as cartas são embaralhadas e 13 cartas são divididas entre 4 indivíduos, qual a probabilidade de que algum deles fique com todas as cartas //ás//.
- Se //n// pessoas terão seus assentos atribuídos ao acaso em uma linha com //2n// assentos, qual a probabilidade que não haja pessoas em assentos adjacentes?
- **Agulha de Buffon**: procurar sobre o problema da agulha de Buffon e programar em alguma linguagem de sua escolha. Portar o código na página Espaço Aberto do curso. Verificar a relação do problema com as definições de probabilidades.
- Assista o vídeo a seguir, relaciona com os temas discutidos em aula, reflita, discuta com os colegas e/ou em sala.
* [[http://www.ted.com/talks/peter_donnelly_shows_how_stats_fool_juries.html|Peter Donelly]] no TED Talks - como estatística e probabilidade podem ser usadas e ... abusadas
* ** note que voce pode habilitar legendas em inglês, português ou outras línguas, se desejar **
* ** procure anotar as principais mensagens da apresentação **
* ** se voce tivesse que destacar a descrever 2 (dois) pontos principais da apresentação, quais seriam? **
=== 07/04 ===
- Veja [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/|no link exemplos de análises uni e bivariadas]] para um conjunto de dados em B&M
=== 16/04 ===
- Fazer uma pesquisa sobre o conceito e usos de médias geométrica e harmônica.
=== 30/04 ===
##
## Exemplo 1:
##
## definindo uma pequena população
POP1 <- c(34, 45, 28, 29, 35, 38, 41, 36, 33, 40)
POP1
## tamanho da amostra:
n <- 3
## uma amostra
(am1 <- sample(POP1, size=n))
## estatísticas
(t1 <- mean(am1))
(t2 <- min(am1))
(t3 <- diff(range(am1)))
(t4 <- (min(am1) + max(am1))/2)
## outra amostra
(am2 <- sample(POP1, size=n))
## estatísticas
mean(am2)
min(am2)
diff(range(am2))
(min(am2) + max(am2))/2
## PARAMETRO
(theta1 <- mean(POP1))
## estimadores:
## das estatistica acima: t1 e t4 são possíveis estimadores para theta1
##
## Exemplo 2:
##
## definindo uma população "grande"
POP2 <- round(rbeta(1000000, 6, 9)*100, dig=1)
THETA <- mean(POP2)
## tamanho de amostra
n <- 20
## uma amostra
(am1 <- sample(POP2, size=n))
(t1 <- mean(am1))
## obtendo agora 10 amostra e as estimaticas em cada uma delas:
(ams <- replicate(10, sample(POP2, size=n)))
apply(ams, 2, mean)
## 10 amostras agora de tamanho 50. as estimativas variam menos
ams50 <- replicate(10, sample(POP2, size=50))
apply(ams50, 2, mean)
## agora 500 amostras de tamanho 20
## as estimativas formam a "distribuição amostral"
ams <- replicate(500, sample(POP2, size=n))
mds <- apply(ams, 2, mean)
mean(mds)
hist(mds, prob=T)
lines(density(mds))
## ... e 500 amostras de tamanho 50
ams50 <- replicate(500, sample(POP2, size=50))
mds50 <- apply(ams50, 2, mean)
mean(mds50)
hist(mds50, prob=T)
lines(density(mds50))
curve(dnorm(x, m=mean(POP2), sd=sd(POP2)/sqrt(50)), from=30, to=50, col=2, add=T)
## qual estimador? no exemplo t1 t4
## pode-se comparar caracteristicas das distribuições amostrais para escolher
## o estimador mais eficiente (menos variabilidade)
## para o t1
plot(density(mds))
minmax <- apply(ams, 2, function(x) (min(x) + max(x))/2)
## para o t4
mean(minmax)
lines(density(minmax), col=2)
## Na prática se utiliza apenas uma amostra.
## Em certos casos (como média amostral)
## a distribuição amostral pode ser obtida por resultados teóricos
##
## distribuições amostrais obtidas: por multiplas amostras e teórica
plot(density(mds))
curve(dnorm(x, m=mean(POP2), sd=sd(POP2)/sqrt(20)), from=30, to=50, col=2, add=T)
## decisão baseada na distribuição amostral
## os valores abaixo seriam considerados "incompatíveis" com a distribuição
abline(v=38)
abline(v=32)
## Exemplo 3:
## Simulando uma pesquisa eleitoral
## para intencao de voto de um unico candidato
## armazenando o valor (populacional e desconhecido) da intenção de voto
set.seed(123456)
THETA <- runif(1, 0, 1)
## tirando uma amostra de tamanhos 2500
am <- sample(c(0,1), size=2500, prob=c(1-THETA, THETA), rep=T)
## estimativa baseada na amostra
(est <- mean(am))
## Margem de erro (baseada na distribuição amostra "teórica"
(ME <- 1.96 * sqrt((est*(1-est))/2500))
##
curve(dnorm(x, m=est, sd=sqrt((est*(1-est))/2500)), from=0.75, to=0.85)
abline(v=est)
abline(v=est + c(-1, 1)*ME, lty=2)
abline(v=THETA, col=2)
## margem de erro "conservadora" (usando theta=0,5 na expressão da variancia do estimador)
(MEcons <- 1.96 * sqrt(1/(4*2500)))