====== CE-003 Turma O - Primeiro semestre de 2011 ====== No quadro abaixo será anotado o conteúdo dado em cada aula do curso. \\ São indicados os Capítulos e Sessões correspondentes nas referências bibliográficas, bem como os exercícios sugeridos. Veja as **Atividades Complementares**abaixo da tabela. \\ **Referências**\\ * **B & M**: BUSSAB, W.O. & MORETTIN, P.A. Estatística Básica. 5a Edição, Editora Saraiva * **M & L**: MAGALHÃES, M.N.; LIMA, A.C.P. [[http://www.ime.usp.br/~noproest|Noções de Probabilidade e Estatística]]. IME/SP. Editora EDUSP. * **B,R & B**: BARBETTA, P.A, REIS, M.M. & BORNIA, A.C. (2004) Estatística para cursos de engenharia e informática. Editora da Atlas. * **WEB** [[http://onlinestatbook.com/|Online Statistics: An Interactive Multimedia Course of Study]]: Material online sobre estatística \\ ===== Conteúdo das Aulas ===== ^^ ^^ B & M ^^ M & L ^^ B, R & B ^^ Online ^ ^ Data ^ Conteúdo ^ Leitura ^ Exercícios ^Leitura ^ Exercícios ^Leitura ^ Exercícios ^ Tópico ^ | 28/02 |Informações sobre o curso. Introdução e organização à disciplina. Chances e probabilidades. Alguns problemas e paradoxos (o problema do aniversário, o teste de diagnóstico, o problema das sequências). Demonstração computacional. |Cap 1 | -- |Cap 1 | --- |Cap 1 | --- | --- | | 02/03 |Probabilidades: definições de probabilidades (clássica, frequentista, subjetiva) conceitos: espaço de probabilidades, espaço amostral, eventos. Espaços discretos e contínuos. sigmaálgebra. Definição axiomática de probabilidades. Propriedades. Probabilidade de união, intercecção e condicional. Exemplos. |Cap 5, Sec 5.1 e 5.2 |Cap 5: 1 a 14 |Cap 2, Sec 2.1 |Cap 2: Sec 2.1: 1 a 5, Sec 2.3: 1 a 7 |Cap 4, Sec 4.1 e 4.2 |Cap 4: 1 a 7 |[[http://onlinestatbook.com/chapter5/probability.html|Online Statistics (Itens A, B, C, D, E)]] | | 14/03 |Probabilidades (cont): probabilidades marginais, conjuntas e condicionais. Probabilidade total e Teorema de Bayes. Probabilidade condicional e independência |Cap 5 |Cap 5: 15 a 25 |Cap 2 |Cap 2: Sec 2.2: 4 a 7, Sec 2.3: 8 a 15|Cap 4 |Cap 4: 8 a 21 | [[http://onlinestatbook.com/chapter5/probability.html|Online Statistics (Itens H, I, J, K)]] | | 16/03 |Probabilidades: Exemplos adicionais. Variáveis Aleatórias - introdução, definição. Distribuição de Probabilidades. Função de (massa de) probabilidade. Distribuição Binomial. Distribuição Hipergeométrica |Cap 6, Sec 6.1, 6.2, 6.6.3, 6.6.4 |Cap 6: 1 a 6, 20, 22 |Cap 3, Sec 3.1 e 3.2 |Cap 3: Sec 3.1: 1 a 6, Sec 3.2: 1 a 7 | | | [[http://onlinestatbook.com/chapter5/probability.html|Online Statistics (Itens E, F e M)]] | | 21/03 |Variáveis aleatórias discretas: definições, valor médio, variância, propriedades, quantis |Cap 6, Sec 6.1 a 6.5 e 6.8 |Cap 6: 7 a 19, 29 e 30 |Cap 3 |Cap 3, Sec 3.1 e 3.2 (ver tb B&M): 1 a 6, Sec 3.4: 1 a 10 | | | [[http://onlinestatbook.com/chapter5/probability.html|Curso online (Itens E, F e M)]] | | 23/03 |Variáveis aleatórias discretas: distribuições uniforme, binomial, geométrica hipergeométrica, Poisson, binomial negativa (Pascal), multinomial |Cap 6 |Cap 6: 20 a 28 |Cap 3 |Cap 3, Sec 3.3: 1 a 6, Sec 3.4: 11 a 27 | | | | | 28/03 |Probabilidades e Variáveis aleatórias discretas: revisão. Introdução a v.a. contínuas: definição, função de densidade de probabilidade |Cap 5, 6 e 7 (Sec 7.1) |Cap 7: 1 a 4 |Cap 6, Sec 6.1 |Cap 6, Sec 6.1: 1 a 3 | | | | 30/03 |Variáveis aleatórias contínuas: Introdução a v.a. contínuas: definição, função de distribuição de probabilidades, exemplos, função acumulada (de distribuição), esperança, variância. |Cap 7, Sec 7.1 a 7.3 |Cap 7: 1 a 12 |Cap 6: Sec 6.1 |Cap 6, Sec 6.1: 1 a 5 | | | | 04/04 |Variáveis aleatórias contínuas: algumas funções de densidade de probabilidade: uniforme, exponencial |Cap 7, Sec 7.4 |Cap 7: 13 e 21, 28, 29, 3140, 41 |Cap 6: Sec 6.2 |Cap 6, Sec 6.2: 1 a 6, SEc 6.3: 16 a 24 | | | | 06/04 |Distribuição normal, aplicações e aproximação à binomial e Poisson |Cap 7, 7.4 e 7.5 |Cap 7: 14 a 24 |Cap 6, Sec 6.2 |Sec 6.2: 7 a 9, Sec 6.3: 25 a 33 | | | [[http://onlinestatbook.com/2/normal_distribution/normal_distribution.html|Material online]] | | 11/04 |Exercícios de revisão. Aproximação normal da binomial. Outras distribuições: Erlang e Gamma. Outras distribuições Weibull, chi^2, t de Student e F de Snedecor |Cap 7 |Cap 7, Sec |Cap 6 |Cap 6 (ver tb B&M) | | | Prob no R: [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase12.html#x14-8600012|Parte I]], [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase13.html#x15-8800013|Parte II]], [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase14.html#x16-9600014|Parte III]] | | 13/04 |Usando o computador para cálculos de probabilidade: programas **''(wx)maxima''** e **''R''** | | | | | | |{{:disciplinas:ce003e:aula2011-04-13.r|Arquivo de comandos do R}} | | 18/04 |Funções da variáveis aleatórias. Variáveis bi(multidimensionais) |Cap 7, Sec 7.6, Cap 8 |Cap 7: 25 a 27, 39, Cap 8: 1, 2, 3, 6, 7, 18, 19, 20 |Cap 5 |Cap 5: Sec 5.1: 2 a 5 Sec 5.2: 2, 3, 5 e 6 | | | | | 20/04 |Prova 1 | | | | | | | | 25/04 |Noções de processos estocáticos: exemplos e definição, tempos e estados (discretos e contínuos), modelo probabilístico. Processos de tempo e estados discretos: Cadeia de Markov. Cadeias Finitas, probabilidades de transição, estacionaridade. Matrizes de transição e matrizes estocásticas, transição em M passos, vetor inicial, probabilidades marginais e estados absorventes. |ver sessão de complementos desta página |-- |-- |-- |-- |-- |**ver abaixo** | | 27/04 |Estatística descritiva. Fontes de dados: estudos experimentais e observacionais. Tipos de variáveis: quantitativas (nominais e ordinais) e qualitativas (discretas e contínuas). Análises uni e bivariadas. Tabelas, gráficos e medidas adequadas para cada tipo de variáveis. Visualização de múltiplas variáveis. Tabelas: dados categóricos e agrupados. Frequencias easolutas e relativas. Gráficos: setores, barras, histograma, box-plot, de densidade (empírica). Medidas: moda, mediana média, quartis, variância e amplitude |Cap 2, 3 e 4 |ver materiais online e sessão de complementos desta página |Cap 1, 4 e 5 |ver materiais online | | |[[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase9.html#x11-570009|Material online com exemplos de análise de dados]] | | 02/05 |Estatística descritiva univariada: tipos de variáveis: qualitativas (nominais e ordinais) e quantitativas (discretas e contínuas). Gráficos. (histograma, pol. frequências, densidade empírica, ramo-e-folhas, box-plot |Cap 2, 3, Sec 3.4 (box-plot) |Cap 2: 4 a 7, 11, 12, 15; Cap 3: 11, 12, 13 |Cap 1 |Cap 1, Sec 1.2: 4, 5, Sec 1.4: 3, 4, 5, 6, 12,15, 20, 21, 22 | | |Ver complementos abaixo!!! | | 04/05 |Estatística descritiva: medidas resumo. Medidas de posição, variabilidade e associação |Cap 3 e 4 |Cap 3: |Cap 4 e 5 | | | |**Ver complementos abaixo!!!** | | 11/05 |Inferência estatística: população e amostra, amostragem e amostra aleatória simples, estatística e parâmetros, estimadores e estimativas. Distribuições amostrais. Distribuição amostral da média e proporção |Cap 10 |Cap 10: 1, 3, 7 a 10, 11 a 13 |Cap 7 |Cap 7, Sec 7.1: 1, 2; Sec 7.3: 1 a 7, Cap 7.4: 1 a 5 | | | | | 16-18/05 | PF-15 |Inferência estatística (revisão e continuação). Dsicussão da 1a prova |Cap 10 |Cap 10: 4, 14, 17 a 20, 21 a 28 |Cap 7 |Cap 7, Sec 7.5: 1, 3, 6, 9, 14, 17, 20 | | | | | 23/05 |Inferência estatística: propriedades dos estimadores (não tendenciosidade, consistência, eficiência), intervalo de confiança e tamanho da amostra |Cap 10 |Cap 10: |Cap 7 |Cap 7, Sec 7.5: 1 a 5, 21 a 29 | | | | | 25/05 |2a prova | --- | --- | --- | --- | | | | | 30/05 |Discussão da 2a prova. Métodos de Estimação: método de mínimos quadrados, dos momentos e da máxima verossimilhança | Cap 11, 11.3, 11.4 e 11.5 |Cap 11: 6 a 13 |Ver B&M |Ver B&M | | | | | 01/06 |Inferẽncia: revisão e exercícios: intervalos de confiança, tamanho de amostra, estimadores e estimativas de máxima verossimilhança | | | | --- | | | | | 06/06 |Inferência: intervalos de confiança para variância, Outros intervalos: diferenças de médias, proporções e quociente de 2 variâncias. Introdução a teste de hipóteses: conceitos introdutórios, passos de um teste de hipóteses, ex com teste de hipótese de uma média |Cap 12 |Cap 12: 3, 5, 6 a 13, 22 a 24 |Cap 8 |Cap 8: Sec 8.1: 1 a 5, Sec 8.2: 1 a 3 | | |[[http://onlinestatbook.com/2/logic_of_hypothesis_testing/logic_hypothesis.html|Material online]] | | 08/06 |Teste de hipóteses: revisão, exemplos e diferentes tipos de testes. Erros tipo I e II. Região crítica, valor-P |Cap 12 |Cap 12: 1, 2, 4, 14, 15, 16 a 20 |Cap 8 |Cap 8: Sec 8.1: 1 a 5, Sec 8.2: 1 a 3 | | |[[http://onlinestatbook.com/2/logic_of_hypothesis_testing/logic_hypothesis.html|Material online]] | | 13/06 |Teste de hipóteses: revisão, exemplos/exercícios e diferentes tipos de testes. |Cap 12 e 13 |Cap 12: 21 a 24, 25 a 40; Cap 13: 1 a 3, 5 a 9, 16, 19 |Cap 8 |Cap 8: Sec 8.3: 1 a 6, Sec 8.4: 1 a 4 | | | | | 15/06 |Teste de hipóteses: revisão, exemplos/exercícios. Testes chi^2 aderência e independência |Cap 14 |Cap 14: 3, 5 a 9, 13, 14 |Cap 8, Sec 8.5 |Cap 8: Sec 8.8: 1 a 7 | | | | \\ \\ \\ ===== Complementos ===== ==== 28/02/2011 ==== - Assista o vídeo a seguir, reflita, discuta com os colegas e/ou em sala. * [[http://www.ted.com/talks/peter_donnelly_shows_how_stats_fool_juries.html|Peter Donelly]] no TED Talks - como estatística e probabilidade podem ser usadas e ... abusadas * **note que voce pode habilitar legendas em inglês, português ou outras línguas, se desejar ** * ** procure anotar as principais mensagens da apresentação ** * **se voce tivesse que destacar a descrever 2 (dois) pontos principais da apresentação, quais seriam?** - **Problemas para discussão:** - Desejamos saber a probabilidade de um casal ter duas filhas (meninas) em três situações distintas: * apenas sabendo que eles tem duas crianças * depois que o pai comenta que tem uma filha (sem dar mais detalhes, sem indicar se é a mais velha ou mais nova etc) * você encontra os amigos e eles estão com uma das crianças com eles que é uma menina - Quantas pessoas devem haver em um grupo para que a chance de haver ao menos uma coincidência de aniversários supere 50% ? - Dois jogadores (A e B) vão jogar um jogo que consiste no lançamento de dois dados. Ambos começam com R$ 10,00. Se a soma dos dados for um número ímpar, A para R$ 1,00 para B. Se a soma for par, B para R$ 1,00 para A. * quais os possíveis valores em dinheiro que os jogadores podem ter após 2 rodadas? A chance é a mesma para todos esses possíveis valores? * quais os possíveis valores em dinheiro que os jogadores podem ter após 3 rodadas? A chance é a mesma para todos esses possíveis valores? * o jogo é honesto? ==== 14/03/2011 ==== * Além dos exercícios indicados nos livros veja [[http://www.matematicadidatica.com.br/ProbabilidadeExercicios.aspx|neste link execícios (com resolução)]] que voce pode tentar * Assista novamente o vídeo de Peter Donnelly e concentre-se no exemplo do teste de diagnóstico. Estruture o problema e a solução utilizando notação adequada de probabilidades ==== 16/03/2011 ==== * [[http://onlinestatbook.com/2/probability/base_ratesM.html|Veja um vídeo]] com ainda uma outra explicação para o problema do tese de diagnóstico. * Escreva uma rotina em alguma linguagem de programação para o problema do teste de diagnóstico. Considere as possíveis entradas e possíveis saidas. Use o programa para investigar o efeito da taxa básica (prevalência) nos resultados, bem como a acurácia dos testes, representando os resultados de alguma forma adequada (e.g. um gráfico). Use a página de [[disciplinas:ce003o-2011-01:aberto|Espaço Aberto]] para postar seu código. * [[http://onlinestatbook.com/2/probability/ch5_exercisesM.html|Exercícios propostos em material online]] ==== 28/03/2011 ==== * Considere o problema da distribuição de probabilidades da soma do resultado do lançamento de dois dados. Encontre uma função de probabilidade adequada ao problema e utilize esta função para calcular E(X) e V(X) * Considere um tipo dado especial onde cada face tem uma probabilidade de cair proporcional ao seu valor. Considere lançar dois destes dados. Monte o espaço amostra e obtenha a probabilidade de cada ponto. Defina uma v.a. como a soma dos valores das faces e monte a distribuição de probabilidades. * Considere avaliar a probabilidade de ter uma "mão" de cinco cartas com exatamente 2 ases em duas situações: a) sabendo que possui um ás de copas, (b) sabendo que possui algum ás na mão. Voce acha que as probabilides am a) e b) sao iguais ou diferentes, e se diferentes qual é maior? Obtenha as probabilidades e verifique sua intuição ==== 04/04/2011 ==== * Obtenha as expressões de E(X), V(X), F(X), md(X), q_{0,05} e q_{0,95} para a distribuição uniforme contínua. * Obtenha as expressões de E(X), V(X), F(X), md(X), q_{0,05} e q_{0,95} para a distribuição exponencial. ==== 12/04/2011 e 14/04/2011 ==== **Usar os programas (wx)maxima e R para resolver os exercícios a seguir** - Fazer gráficos das diversas distribuições de probabilidades vistas nas aulas, variando os valores dos parâmetros e verificando como fica o comportamento da função. - Estudar a distribuição de Weibull, fazer gráficos para diferentes valores dos parâmetros. - Seja uma variável aleatória com distribuição Weibul W(\alpha=2, \beta=20) - Obtenha a expressão e o gráfico da função de densidade f(x) e de distribuição (acumulada) F(x). - Calcule as probabilidades: * P[X > 40] * P[X < 50] * P[10 < X < 45] * P[X < 5 ou X > 40] - Calcule os quantis * q tal que P[X > q] = 0.90 * q tal que P[X < q] = 0.10 * q_1 e q_2 tal que P[q_1 < X < q_2] = 0.50, com 0,25 de probabilidade abaixo de q_1 e acima q_2. - Seja uma variável aleatória com distribuição Gamma G(\alpha=3, \beta=10) - Obtenha o gráfico da função de densidade f(x) e de distribuição (acumulada) F(x). - Verifique como obter as probabilidades: * P[X > 50] * P[X < 10] * P[20 < X < 80] * P[X < 5 ou X > 90] - Verifique como obter os quantis * q tal que P[X > q] = 0.90 * q tal que P[X < q] = 0.10 * q_1 e q_2 tal que P[q_1 < X < q_2] = 0.50, com probabilidades abaixo de q_1 e acima q_2 de 0,25. - Verifique como obter os quartis da distribuição - Verificar as expressões das distribuições t, chi^2 e F (ver sessão 7.7 em Bussab e Morettin) e como obter probabilidades q quantis utilizando as tabelas. \\ - Seja X uma variável aleatória com distribuição t_(8) (tStudent com \nu=8 graus de liberdade). Obtenha usando a tabela da distribuição: - P[X > 1.5] - P[-2 < X < 2] - k tal que P[|X| < k ] = 0.80 - k tal que P[X < k ] = 0.10 - os quartis da distribuição - Seja X uma variável aleatória com distribuição \chi_(12) (qui-quadrado com \nu=12 graus de liberdade). Obtenha usando a tabela da distribuição: - P[X > 20] - P[X < 5] - P[10 < X < 25] - k tal que P[|X| < k ] = 0.80 - k tal que P[X < k ] = 0.10 - os quartis da distribuição \\ \\ **Usando o programa R para calcular probabilidades - Uma introdução**\\ Para iniciar o R na linha de comando do Linux basta digitar: $ R * [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase12.html#x14-8600012|Prob no R - I]] * [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase13.html#x15-8800013|Prob no R - II]] * [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase14.html#x16-9600014|Prob no R - III]] Alternativamente a utilizar diretamente na linha de comandos, é possível utilizar o R de dentro de alguns editores como o ''[[http://sourceforge.net/projects/rgedit/|gedit]]'', ''[[http://www.vim.org/scripts/script.php?script_id=2628|vim]]'' ou ''[[http://stat.ethz.ch/ESS/|(x)emacs]]'', além de IDE's específicas como o ''[[http://rkward.sourceforge.net|RKward]]'' e ''[[http://www.rstudio.org|Rstudio]]''. Para mais detalhes sobre interfaces gráficas para o R consulte a página de [[http://www.r-project.org/GUI/|R GUI projects]] ==== 25/04/2011 ==== === Parte 1 === - Considere a matriz de transição do exemplo 2 da aula. Escreva um programa para simular realizações desta cadeia (mostre resultados em um gráfico).\\ P = \left[\begin{array}{cc} 1/3 & 2/3 \\ 2/3 & 1/3 \end{array}\right] - Considere agora uma matriz de transição mais geral dada a seguir. Generalize seu programa do exemplo anterior e obtenha simulações para diferentes valores de ''p''. Escreva ainda uma rotina que receba os dados de uma cadeia e retorne uma estimativa de ''p''. Use esta rotina para obter valores estimados de ''p'' para suas diferentes simulações (com o mesmo ''p'' e variando ''p'') \\ P = \left[\begin{array}{cc} p & 1-p \\ 1-p & p \end{array}\right] - Idem anterior com \\ P=\left[\begin{array}{cc} p_1 & 1-p_1 \\ 1-p_2 & p_2 \end{array}\right] - Escreva agora uma rotina que calcule as probabilidades dos estados da cadeia em um passo (tempo) qualquer, a partir da matriz de transição e de um vetor \nu de probabilidades iniciais. Experimente (por simulação) com diferentes valores de ''P'' e \nu - Idem anterior para um determinado inicial. - Resuma as conclusões que podem ser obtidas analisando os resultados das simulações anteriores === Parte 2 === - Estude o comportamento da cadeia definida pelo exemplo 1 visto em aula. \\ P=\left[\begin{array}{cccccc} 0,1 & 0,4 & 0,2 & 0,1 & 0,1 & 0,1 \\ 0,2 & 0,3 & 0,2 & 0,1 & 0,1 & 0,1 \\ 0,1 & 0,2 & 0,3 & 0,2 & 0,1 & 0,1 \\ 0,1 & 0,1 & 0,2 & 0,3 & 0,2 & 0,1 \\ 0,1 & 0,1 & 0,1 & 0,2 & 0,3 & 0,2 \\ 0,1 & 0,1 & 0,1 & 0,1 & 0,4 & 0,2 \\ \end{array}\right] - Modificar a matriz P dada colocando na ultima linha: ''(0 0 0 0 0 1)''. Estude o comportamento da cadeia. - Estude o comportamento da cadeia com matriz de probabilidade de transição dada por\\ P=\left[\begin{array}{ccccc} 0,5 & 0,3 & 0,2 & 0,0 & 0,0 \\ 0,2 & 0,3 & 0,3 & 0,2 & 0,0 \\ 0,1 & 0,2 & 0,3 & 0,2 & 0,2 \\ 0,0 & 0,1 & 0,2 & 0,3 & 0,4 \\ 0,0 & 0,0 & 0,0 & 0,0 & 1,0 \\ \end{array}\right] === Parte 3 === - Monte a matriz de transição ''P'' e estude as características da cadeia para o exemplo genético onde os pais tem genótipos ''AA'', ''Aa'' ou ''aa''. Analise e inspecione (tb por simulação) o comportamento para diferentes valores iniciais. ==== 27/04/2011 ==== - Ver Sessões 9, 10 e 11 [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/|neste material online]] - Exemplos mostrados/usados e discutidos em aula (com comandos do R) - Exemplo **''CO2''** data(CO2) str(CO2) head(CO2) ?CO2 names(CO2) ## acessando os dados mean(CO2$uptake) with(CO2, mean(uptake)) ## resumos de uma variável attach(CO2) mean(uptake) summary(uptake) ## gráficos boxplot(uptake) ## relacionando uptake com outra variável (categórica) boxplot(uptake ~ Treatment) tapply(uptake, Treatment, mean) tapply(uptake, Treatment, summary) ## relacionando uptake com outras 2 variáveis (categóricas) tapply(uptake, list(Type, Treatment), mean) interaction.plot(Type , Treatment, uptake, type="b") interaction.plot(Type , Treatment, uptake, fun=median, type="b") ## mais visualizações, relacionando com outra variável numérica plot(uptake ~ conc) m1 <- tapply(uptake, conc, mean) points(as.numeric(names(m1)), m1, col=2, pch=19) by(CO2, Plant, function(x) with(x, lines(uptake ~ conc, col=gray))) coplot(uptake ~ conc|Plant) coplot(uptake ~ conc|Plant,show.given=FALSE) coplot(uptake ~ conc|Plant, panel=lines, type="b",show.given=FALSE) coplot(uptake ~ conc|Plant, panel=panel.smooth,show.given=FALSE) require(lattice) xyplot(uptake ~ conc|Plant) detach(CO2) - Dados **''mtcars''** ## obtendo informações sobre os dados (metadados) data(mtcars) str(mtcars) head(mtcars) dim(mtcars) attach(mtcars) ## analises de uma variável quantitativa summary(mpg) boxplot(mpg) hist(mpg) rug(mpg) hist(mpg, prob=T) rug(mpg) lines(density(mpg)) h1 <- hist(mpg, prob=T) h1[1:2] table(cut(mpg, br=seq(10, 35, by=5))) ## um gráfico **totalmente inadequado** !!! pie(table(cut(mpg, br=seq(10, 35, by=5)))) ## análises de uma variável qualitativa (nominal) table(am) prop.table(table(am)) pie(table(am)) which.max(table(am)) ## analises de uma variável qualitativa (ordinal) table(cyl) prop.table(table(cyl)) barplot(table(cyl)) which.max(table(cyl)) ## "cruzando" variáveis qualitativas table(cyl, am) plot(table(cyl, am)) barplot(table(cyl, am)) barplot(table(cyl, am), beside=T) prop.table(table(cyl, am)) prop.table(table(cyl, am), mar=1) prop.table(table(cyl, am), mar=2) # ## tabela table(am) ## grafico pie(table(am), main="Câmbio", lab=c("automático" , "manual")) pie(table(am), main="Câmbio", lab=c("automático" , "manual")) , col=1:2, rad=1) ## medida (moda) am.t <- table(am) names(am.t) <- c("automático","manual") names(which.max(am.t)) ## em porcentagens prop.table(table(am)) ## agora para numero de marchas table(gear) barplot(prop.table(table(gear))) names(which.max(table(gear))) ## e agora relacionando as duas variáveis table(am, gear) plot(table(am, gear), main="Marchas vs Câmbio") barplot(table(am, gear), legend=T) barplot(table(gear, am), legend=T) prop.table(table(am, gear), mar=1) barplot(prop.table(table(am, gear), mar=1)) ## relacionando qualitativa e quantitativa tapply(mpg, am, mean) tapply(mpg, am, sd) tapply(mpg, am, summary) tapply(mpg, am, function(x) table(cut(x, br=seq(10, 30, by=5)))) boxplot(mpg ~ am) plot(am, mpg) boxplot(mpg ~ am) ## relacionando variáveis quantitativas plot(mpg ~ qsec) lines(lowess(mpg ~ qsec)) cor(mpg, qsec) plot(mpg ~ wt) lines(lowess(mpg ~ wt)) cor(mpg, wt) cor(mpg, wt, meth="sp") plot(qsec ~ wt) lines(lowess(qsec ~ wt)) cor(qsec, wt) cor(qsec, wt, meth="sp") plot(mtcars[,c(1,4,6,7)]) pairs(mtcars[,c(1,4,6,7)], panel=panel.smooth) cor(mtcars[,c(1,4,6,7)]) cor(mtcars[,c(1,4,6,7)], meth="sp") detach(mtcars) ==== 02/05/2011 ==== * [[http://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html|Hans Rosling]] no TED Talks - como os dados podem nos ajudar a compreender e destruir mitos sobre a realidade. Procure identificar ao menos cinco pontos importantes na apresentação para discussão ==== 04/05/2011 ==== **Tópicos:** * Análise univariada * Medidas de posição: média, mediana, moda, média aparada, quantis * Medidas de dispersão: amplitude, variância, desvio padrão, desvio médio, amplitude interquartílica, coeficiente de variação * Cálculo das medidas para dados brutos e dados agrupados * Análise bivariada * medidas de associação: variáveis qualitativas e quantitativas * chi^2, coeficiente de contingência, comparação de medidas resumo, covariâncas e coeficientes de correlação **Referências adicionais e vídeos:** * [[http://www.khanacademy.org/?video=statistics--the-average#statistics|Vídeos sobre estatística da Khan Academy]]. Vídeos relacionados com esta parte do curso (estatística descritiva) * Statistics: The Average * Statistics: Sample vs. Population Mean * Statistics: Variance of a Population * Statistics: Sample Variance * Statistics: Standard Deviation * Statistics: Alternate Variance Formulas * [[http://onlinestatbook.com/2/index.html|Online Statistics]] * [[http://onlinestatbook.com/2/graphing_distributions/graphing_distributions.html|Gráficos]] * [[http://onlinestatbook.com/2/summarizing_distributions/summarizing_distributions.html|Resumos]] * [[http://onlinestatbook.com/2/describing_bivariate_data/bivariate.html|Bivariado]]