====== CE-083: Estatística Computacional I ======
{{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}}
===== Detalhes da oferta da disciplina =====
* Professor: [[http://www.leg.ufpr.br/~walmes|Walmes Marques Zeviani]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]])
* Curso: Estatística.
* Período: 2013/2.
* Local: LABEST, LAB A.
* Horário: Terça, 19:00-20:30h e Quinta, 20h45-22:00h.
* Atendimento: Quinta, 19:00-20:30h.
* Cartão de referência: {{http://www.leg.ufpr.br/~walmes/cursoR/guia_rapido_R.pdf|Guia rápido do usuário R}} - tradução por Conrado Oliveira (ex-aluno).
* Ementa: {{http://www.leg.ufpr.br/~walmes/ensino/CE083-fichas-2013-05-03.pdf}}
===== Scripts, notas e documentos ======
Quando não estiver disponível os arquivos baixe os mesmos por [[http://dl.dropboxusercontent.com/u/48140237/ce083.zip|aqui]].
Apostilas e textos úteis: [[http://dl.dropboxusercontent.com/u/48140237/ce083_livros.zip|ce083_livros.zip (84 MB)]]
{{url>http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ 800px, 600px center}}
===== Histórico das Aulas do Curso ======
Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas.
- 27/08:
* Introdução à Estatística Computacional I;
* Download, instalação e fundamentos iniciais do aplicativo R;
* Mecanismos de busca e consulta à documentação;
* Atribuição de escalares à objetos;
* Operações fundamentais com escalares.
- 29/08:
* Criação e operações com vetores;
* Regra da reciclagem;
* Seleção por posição em vetores;
* Sequências regulares.
- 03/09 (Paulo Justiniano):
* Distribuições de probabilidade;
* Cálculo de probabilidades de forma explicita;
* Cálculo de probabilidades usando funções próprias.
- 05/09:
* Sabatina 01;
* Gráficos de distribuições de probabilidades.
- 10/09:
* Seleção em vetores pelo nome e regras de lógica;
* Regras de lógica, operações e aplicações;
* Criação e seleção de tabelas de dados (data.frame).
- 12/09:
* Criação, seleção e ordenação de tabelas (data.frame);
* Criação de novas variáveis;
* Operações com fatores (renomeação e reordenação).
- 17/09:
* Ordenação, filtragem, tranformações, e tarefas por grupo para dados em tabelas (data.frame).
- 19/09:
* Operações com fatores, ordenação e nomeação dos níveis;
* Agrupamento de valores em classes;
* Gráficos de barras para estatísticas por estrato/grupo.
- 24/09:
* Importação de dados no formato texto;
* Manipulação dos dados, reordenação de níveis de fator;
* Gráficos de caixas, histogramas, desidade empírica e acumulada.
- 24/09:
* Importação de dados no formato texto;
* Análise exploratória de dados;
* Análises marginais e condicionais para variáveis quali e quantitativas.
- 01/10:
* Tarefas por grupo e por margem;
* Função para obter esatísticas para uma amostra;
* Objetos do tipo lista, criação e atributos;
* Aplicar funções para elementos de uma lista;
* Exportar tabelas no formato texto;
* Salvar gráficos;
* Salvar a imagem da sessão.
- 03/10:
* Matrizes e arranjos, criação, seleção e operações fundamentais;
* Estatísticas/tarefas por margem em matrizes;
* Gráficos de mosaico;
* Listas, criação, seleção;
* Estatísticas/tarefas por elementos em listas;
* Introdução às expressões regulares;
* Estatísticas/tarefas por grupo em data.frames.
- 08/10:
* Importados de dados em arquivos com comprimento fixo de campo (fwf);
* Funções para manipular strings;
* Introdução às expressões regulares;
- 10/10:
* Junção de tabelas de dados por identificador comum (merge);
* Verificação de registros duplicados;
* Criação de idendificador comum;
* Mais sobre legenda e anotações no gráfico.
- 15/10:
* Criação de funções;
* Formas de passar argumentos, argumentos default;
* Mensagens de erro, aviso e notificação;
- 17/10:
* Formas de passar os argumentos para uma função;
* Formas de retornar o resultado de uma função;
* Funções genéricas, classes e métodos.
- 22/10:
* Visualizando distribuições de probabilidade.
- 24/10:
* Implementando funções de probabilidade e de densidade de probabilidade;
* As funções d*, p*, q*, e r*.
- 29/10:
* Cálculo de probabilidades;
* Esperança matemática e variância;
* Gerando números aleatórios;
* Distribuição amostral da média.
- 01/11:
* Geração automática de relatórios de análises de dados;
* Integrando o R ao editor de textos do Open Office (Writer).
- 05/11:
* Mais detalhes sobre geração automática de relatórios usando OpenOffice e R, OdfWeave;
* Sorteio dos exercícios aos grupos de alunos.
===== Trabalhos ======
=== Trabalho 1 ===
- Pegar dados na web para fazer um relatório de análise de dados. Alguns sites recomendados:
* http://www.lib.ncsu.edu/data/socialscienceandhumsets.html
* http://www.thejanuarist.com/9-fascinating-datasets-available-online-for-free/
* http://rdatamining.wordpress.com/2011/09/16/datasets-to-practice-your-data-mining/
* http://www.statsci.org/datasets.html
* http://www.rdatamining.com/resources/data
* http://www.datawrangling.com/some-datasets-available-on-the-web
* http://www.economicsnetwork.ac.uk/links/data_free
* http://www.stata.com/links/examples-and-datasets/
* http://people.stern.nyu.edu/adamodar/New_Home_Page/data.html
* http://mathforum.org/library/topics/data_sets/
* http://lemire.me/blog/archives/2012/03/27/publicly-available-large-data-sets-for-database-research/
* http://www.20kmparis.com/web/resultats_precedents.asp
- Encontrar dados que tenham pelo menos uma v.a. qualitativa e uma quantitativa com número de registros superior à 30. Fazer o download dos dados e importar para o R;
- Fazer a análise exploratória dos dados com o R. Considerar:
* tabelas com medidas de frequência, posição, dispersão;
* gráficos de frequência, tendência, dispersão;
- Escrever um relatório sobre os dados. Considerar:
* origem (endereço) e significado de cada variável;
* inserir as tabelas/gráficos com comentários e interpretação sobre o que eles indicam;
* concluir sobre as impressões que as análise deram à respeito dos dados;
- O documento deve conter:
* figuras/tabelas com legendas, Ex: Figura 1. histograma da variável x.
* figuras com dimensão apropriada, com texto legível, de tamanho e tipo de fonte compatível com o texto e próprio para leitura.
* adotar um padrão de cores para os gráficos (P&B, tons cinza, tons azuis);
* todo elemento informativo (gráfico/tabela) deve ser comentado no texto.
- deve ser entregue:
* o relatório de análise impresso (para avaliação);
* o script (.R) e a imagem da sessão (.RData) (para disponibilizar na página da disciplina);
* o script deve conter o nome dos membros do grupo e ser salvo com o GRR de um destes. Ex: //grr20139999.R//, para a imagem da sessão também, //grr20139999.RData//.
* o script deve estar devidamente comentado pois será disponibilizado para outros alunos, inclusive das próximas turmas.
- Prazo para entrega e envio do trabalho é o dia 10/10/2013. O relatório impresso deve ser entregue na aula e os arquivos digitais enviados para walmesufpr.br. O título da mensagem (subject do email) deve ser //ce083 2013 trabalho 1//;
- O trabalho pode ser feito em grupos de no máximo 3 pessoas.
- Não são aceitos trabalhos entregues após o prazo.
- O trabalho vale 2.0 pontos;
=== Trabalho 2 ===
- No arquivo [[http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ce083-2013-02-aula21.R|ce083-2013-02-aula21.R]] estão os grr e os respectivos grupos de exercícios;
- No arquivo [[http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ce083-2013-02-aula21-exerc.odt|ce083-2013-02-aula21-exerc.odt]] estão os livros e os exercícios correspondentes;
- No arquivo [[http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ce083-2013-02-aula21-guia.odt|ce083-2013-02-aula21-guia.odt]] estão instruções de formatação do documento;
- O trabalho vale 3.0 pontos;
- Os arquivos odt de input e output devem ser enviados com o seguinte nome "grr20002000-input.odt" e "grr20002000-output.odt". Use o grr de um representante o grupo ao invés de 20002000;
- Usuários de LaTex não precisam fazer o trabalho em OdfWeave caso queiram usar o LaTex com Sweave ou knitr. Nesse caso enviar o *.Rnw e o *.pdf com prefixo sendo o grr.
- Entrega no dia 28/11;