====== CE-083: Estatística Computacional I ======
//"The purpose of computing is insight, not numbers."// (Richard Hamming)
EXAME FINAL no dia 17/07, 17h30 no LABEST.
Todo o conteúdo da disciplina.
O aluno pode usar computador próprio.
Toda prova será baseada no conjunto de dados de
{{http://www.leg.ufpr.br/~walmes/data/euro_football_players.txt|jogadores de futebol da liga européia}}.
{{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}}
==== Detalhes da oferta da disciplina ====
* Professor: [[http://www.leg.ufpr.br/~walmes|Walmes Marques Zeviani]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]])
* Curso: Estatística.
* Período: 2014/1.
* Local: LABEST, LAB C.
* Horário: Terça e Quinta, 17:30-19:00h.
* Atendimento: Quinta, 19:00-20:30h.
* Cartão de referência: {{http://www.leg.ufpr.br/~walmes/cursoR/guia_rapido_R.pdf|Guia rápido do usuário R}} - tradução por Conrado Oliveira (ex-aluno).
* Ementa: {{http://www.leg.ufpr.br/~walmes/ensino/CE083-fichas-2013-05-03.pdf}}
----
==== Scripts, notas e documentos ====
{{url>http://www.leg.ufpr.br/~walmes/ensino/ce083-2014-01/ 800px, 600px center}}
----
/* ==== Histórico das Aulas do Curso ==== */
/*
Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas.
- 11/02:
* Download e instação do R;
* Editores de script;
* Primeira sessão com o RStudio;
* Operações elementares com escalares;
* Salvando script e área de trabalho;
- 13/02:
* Vetores nomeados;
* Regras lógicas;
* Seleção a partir de regras lógicas;
* Classificação de valores em intervalos;
* Sequencias regulares;
- 18/02:
* Matrizes;
* Data frames;
- 20/02:
* Ordenar vetores e data.frames;
* Reordenar e renomear fatores;
* Arredondar e truncar números;
- 25/02:
* Medidas descritivas para uma amostra;
* Distribuições de frequência;
* Tarefas por grupo/estrato;
* Tarefas por margem;
- 27/02:
* Leitura de dados a partir de aquivos de texto;
* Tratamento de valores após leitura;
- 11/03:
* Download e leitura de dados em aquivos de texto;
* Seleção dos carros e cálculo separado de estatísticas descritivas;
- 13/03:
* Análise descritiva tabular e gráfica;
* Tarefas separadas por grupo e por resposta;
* Cálculo de múltiplas estatísticas para a amostra;
* Exportando gráficos;
- 18/03:
* Expressões regulares;
* Captura de informações por meio de expressões regulares;
- 20/03:
* Fusão de tabelas de dados por chave comum;
* Aglutinar/combinar níveis de fatores.
- 25/03:
* Revisão de distribuição de probabilidades;
* Como fazer funções.
- 27/03:
* Geração de números aleatórios;
* Método da congruência;
* Geração de números aleatórios de distribuições discretas de suporte finito;
* Método da transformação integral da probabilidade para gerar números aleatórios de outras distribuições. -
- 01/04:
* Cálculo de probabilidades;
* Visualização de distribuições de probabilidade.
- 03/04:
* Pesquisa reproduzível;
* Relatórios dinâmicos com R+Markdown.
- 08/04:
* Fundamentos de testes de hipótese;
* Erros de decisão;
- 10/04:
* Teste t para a média de uma população;
* Teste t para a diferença de médias de duas populações independentes;
* Teste t para a diferença de médias de duas populações pareadas.
- 15/04:
* Teste F para variâncias de duas populações normais;
* Teste chi-quadrado para aderência;
* Teste chi-quadrado para independência.
- 22/04:
* Avaliação do desempenho de teste de hipótese com desvio nos pressupostos;
* Significância e cobertura nominais via estudo de simulação;
* Curva de poder do teste de hipótese.
- 24/04
- 29/04
- 01/05
- 06/05
- 08/05
- 13/05
- 15/05
- 20/05
- 22/05
- 27/05
- 29/05
- 03/06
- 05/06
- 10/06
- 12/06
- 17/06
- 19/06
- 24/06
- 26/06
*/
----
==== Links úteis ====
* {{http://www.rstudio.com/ide/docs/authoring/using_markdown|Usando markdown com o RStudio}};
* {{https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet|Markdown: guia de sintaxe (1)}};
* {{http://support.iawriter.com/help/kb/general-questions/markdown-syntax-reference-guide|Markdown: guia de sintaxe (2)}};
----
==== Avaliações ====
=== Trabalho 1 - Análise comparativa de modelos de carros ===
- Cada dupla ou trio deve escolher dois modelos de carros para avaliar (ex: Fiat Palio vs Volkswagen Gol, Renault Clio vs Fiat Uno);
- O contexto do trabalho é orientar clientes na escolher entre os modelos de interesse via uma análise exploratória de dados baseada nos dados disponíveis de satisfação dos clientes;
- As tabelas sobre a nota dada por donos desses modelos com relação à uma série de características serão extraídos do site [[http://www.carrosnaweb.com.br/|carros na web]] e disponibilizados via arquivo de texto;
- Os dados devem ser lidos e uma análise exploratória com emprego de gráficos e tabelas deve ser feita;
- A análise deve considerar comparações entre modelos, entre anos de fabricação e as diversas características votadas;
- Cada grupo deve entrar no site [[http://www.carrosnaweb.com.br/opiniao.asp]] e consultar seus carros, anotar o número total de páginas de resultados e informar para o acadêmico Milton, responsável por reunir e enviar as informações de cada grupo: nomes dos acadêmicos, marcas, modelos, totais de páginas.
- Os grupos e pares de carros a serem comparados seguem na tabela abaixo:
^Acadêmicos^Carros^
|Bruna, Jonivan e Lucas |Gol vs Onix |
|Luiz, Maurício e Ana Laura |Gol vs HB20 |
|Danilo, Josafa e Francielle |HB20 vs Onix |
|Milton, Nathalie e Andressa |Ka vs Celta |
|Damiane e Cintia |Punto vs Polo |
|Adenmilson |Fluence vs Jetta |
| |S-10 vs Ranger |
| |Crossfox vs Idea |
| |Voyage vs Siena |
| |Uno vs Clio |
| |Sandero vs Gol |
| |Saveiro vs Strada |
| |Duster vs Ecosport |
| |Focus vs Fluence |
| |Fluence vs Cruze |
| |J3 vs Agile |
| |Punto vs City |
| |Logan vs Voyage |
| |Bravo vs Focus |
- Os arquivos de texto a serem lidos são:
- [[http://www.leg.ufpr.br/~walmes/data/aval_carros_nota.txt|Tabela]] com as notas no formato longo;
- [[http://www.leg.ufpr.br/~walmes/data/aval_carros_info.csv|Tabela]] como as informações de origem e condição do carro;
- [[http://www.leg.ufpr.br/~walmes/data/aval_carros_fwf.txt|Tabela]] com as notas no formato amplo, em comprimento fixo de campo;
- [[http://www.leg.ufpr.br/~walmes/data/aval_carros_dic.txt|Tabela]] de dicionário para ler a tabela de comprimento fixo de campo;
-
Algumas escolhas de carros para comparação foram alteradas por não serem consideradas adequadas. Acadêmicos não listados devem escolher uma das opções disponíveis na tabela. Na aula de terça-feira (11/03) deve-se ler/importar os quarto arquivos fornecidos para download, selecionar/filtrar das tabelas os carros escolhidos e obter estatísticas descritivas para cada carro (tarefas por grupo/margem). Serão avaliados quanto a isso.
=== Trabalho 2 - Distribuições de probabilidade ===
- Resolver os exercícios selecionados do livro de {{http://www.leg.ufpr.br/~walmes/ensino/ce083-2014-01/exerc_bussabmoretin.pdf|Estatística Básica do Bussab e Moretin (5ª edição)}}, destacados com um X vermelho ao lado. Usar o R como calculadora e as funções p, d, q e r dos modelos de probabilidade.
- Entregar a solução usando 1) [[http://www.rstudio.com/ide/docs/authoring/using_markdown|R+Markdown]], 2) [[http://cran.r-project.org/web/packages/odfWeave/vignettes/odfWeave.pdf|R+LibreOffice]], 3) [[http://www.r-statistics.com/2010/05/exporting-r-output-to-ms-word-with-r2wd-an-example-session/|R+MSWord]] ou 4) [[https://www.rstudio.com/ide/docs/authoring/overview|R+Latex]]. Instruções de como integrar o R aos sistemas de edição de texto serão passadas em sala de aula.
- Instruções para envio do trabalho em [[http://www.leg.ufpr.br/doku.php/disciplinas:datafilehost]].
=== Trabalho 3 - Testes de hipótese ===
- Aplicar cada um dos testes de hipótese abaixo com dados retirados de livros, dados reais, dados disponíveis na internet ou qualquer outra fonte. Evitar dados simulados.
* Em medidas de posição:
- Teste t para a média de uma v.a. normal;
- Teste t para a diferença de médias entre duas v.a. normais por amostras independentes;
- Teste t para a diferença de médias entre duas v.a. normais por amostras pareadas;
- Teste exato para proporção de uma v.a. binomial;
- Teste aproximando pela normal para proporção de uma v.a. binomial;
- Teste para a diferença de proporções de duas ou mais v.a. binomiais;
- Teste do sinal para a mediana de uma v.a.;
- Teste de Wilcox para a diferença de médias de duas v.a. por amostras independentes;
- Teste de Wilcox para a diferença de médias de duas v.a. por amostras pareadas;
* Em medidas de dispersão:
- Teste F para a igualdade de variâncias entre duas v.a. normais;
* Aderência:
- Teste chi-quadrado para aderência de uma distribuição à uma v.a.;
- Teste de Shapiro-Wilk para a normalidade de uma v.a.;
- Teste de Kolmogorov-Smirnov para a aderência de uma distribuição à uma v.a.;
* Associação:
- Teste chi-quadrado para independência de duas v.a. em tabelas de contingência;
- Teste de correlação de Pearson entre duas v.a. normais;
- Teste de correlação de Spearman entre duas v.a.;
- Entregar a solução usando [[https://www.rstudio.com/ide/docs/authoring/overview|R+Latex]]. Instruções de como integrar o R aos sistemas de edição de texto serão passadas em sala de aula.
- Instruções para envio do trabalho em [[http://www.leg.ufpr.br/doku.php/disciplinas:datafilehost]].
- Prazo de entrega: 15/05/2014 até às 23h59.
{{threads>pessoais:walmes:ce083-2014-01:discussion_tb2}}
~~DISCUSSION~~