Essa é uma revisão anterior do documento!
CE083: Estatística Computacional I
Detalhes da oferta da disciplina
- Curso: Estatística
- Período: segundo semestre de 2015
- Professor Responsável: Fernando de Pol Mayer, (LEG: Laboratório de Estatística e Geoinformação)
- Horários e Locais:
- Terça, 19:00 - 20:30h, Lab. C - LABEST.
- Sexta, 20:40 - 22:00h, Lab. C - LABEST.
- Horários de atendimento do professor:
- Quartas e sextas, 14:00-17:30. Outros horários podem ser agendados previamente por email.
- Datas importantes: De acordo com a Resolução 57/14 - CEPE, alterada pela Resolução 43/15 - CEPE:
Data | Evento |
---|---|
03/08 | Início do semestre letivo |
11/08-16/09 | Período de greve |
22/12 | Exame final |
24/12 | Final do semestre letivo |
Programa/objetivos da disciplina
O objetivo desta disciplina é capacitar os alunos em uma linguagem de programação para estatística, onde terão a capacidade de desenvolver suas análises em qualquer disciplina. Neste curso usaremos a linguagem R que é livre, de código aberto, e já se tornou a linguagem "padrão" para análises estatísticas. O objetivo também é ensinar os alunos sobre o conceito de ciência reproduzível, e como utilizar o R para gerar documentos dinâmicos, misturando código e texto, facilitando e tornando clara a difusão do conhecimento.
O curso compreende os seguintes tópicos:
- Filosofia e conceitos iniciais sobre software livre e R
- Uma primeira sessão com o R
- R: essencial
- Instalação, interfaces gráficas
- Funções e argumentos
- Objetos e suas classes
- Valores perdidos e especiais
- Manipulação de dados: indexação e seleção condicional
- R: dados
- Importação e exportação de dados
- Lendo dados de uma URL
- R: análise exploratória de dados
- Funções para resumo de dados
- Gráficos exploratórios
- Sistemas gráficos
- Gráficos básicos
- Sistemas de cores
- Gráficos com o pacote Lattice
- Gráficos com o pacote ggplot2
- R: estatística
- Geração de números aleatórios
- Distribuições de probabilidade
- Intervalos de confiança e teste de hipótese
- Regressão linear e ANOVA
- R: programação
- Estruturas de controle e repetição
- Criando funções
- A família de funções *apply()
- Linguagens de marcação
- LaTeX
- Markdown (Rmarkdown)
- Documentos dinâmicos com knitr e rmarkdown
Materias do curso
Aqui serão disponibilizados todo material que for utilizado em sala de aula, além de materias adicionais.
- Matéria sobre instalação do R no Linux no Blog do LEG.
Histórico das Aulas do Curso
Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas.
- 04/08: Apresentação da disciplina
- 06/08: Conceitos de programação, software livre e instalação do R
- Material referente a aula 01
- Ver o guia de instalação do R
- Ler o artigo Users, programmers, and statistical software (Chambers, 2000)
- 11/08: Utilização básica do R e RStudio. Configurando o diretório de trabalho. Entrando com comandos, salvando scripts e workspace.
- Material referente a aula 01
- Script construído em aula: script_aula_2015-08-11.R
- 22/09: Funções e argumentos. Mecanismos de ajuda. Criando uma função. Material referente a aula 02
- 24/09: Objetos. Programação orientada a objetos. Gerenciamento da área de trabalho. Material referente a aula 02
- 29/09: Classes de objetos e regra da reciclagem. Material referente a aula 02
- 01/10: Valores perdidos e especiais. Classes especiais: matriz, lista e data frame. Material referente a aula 02
- 06/10: Recesso na UFPR devido ao SIEPE.
- 08/10: Aula especial com o convidado Prof. Paulo Justiniano Ribeiro Jr.
- 13/10: Exercícios sobre matriz, lista e data frame. Material referente a aula 02
- 15/10: Primeira sabatina
- 20/10: Indexação de vetores e matrizes. Material referente a aula 03
- 22/10: Indexação de listas e data frames. Material referente a aula 03
- 27/10: Indexação através de seleção condicional. Material referente a aula 03
- 29/10: Segunda sabatina
- 03/11: Entrada de dados: via teclado e leitura de arquivos de texto. Material referente a aula 04
- 05/11: Saída de dados em arquivos de texto. Carregando dados de pacotes do R. Dados no fomato textual e binário. Material referente a aula 04
Referências Bibliográficas
- Referências básicas
- Dalgaard, P. Introductory statistics with R. New York: Springer, 2008.
- Murrell, P. Introduction to data technologies. Boca Raton: Chapman & Hall/CRC, 2009. Disponível em HTML e PDF.
- Peng, RD. R programming for data science. Leanpub, 2015. (Gratuito)
- Peng, RD. Exploratory data analysis with R. Leanpub, 2015. (Gratuito)
- Ribeiro Jr., PJ. Introdução ao ambiente estatístico R. (on-line)
- Referências complementares
- Adler, J. R in a nutshell. O'Reilly, 2010.
- Leek, J. The elements of data analytic style. Leanpub, 2015. (Gratuito)
- Matloff, N. The art of R programming: A tour of statistical software design. No Starch Press, 2011.
- Mello, MP; Peternelli, LA. Conhecendo o R: uma visão mais que Estatística. Viçosa: Editora UFV, 2013.
- Peng, RD. Report writing for data science in R. Leanpub, 2015. (Gratuito)
- Rizzo, ML. Statistical computing with R. Boca Raton: Chapman & Hall/CRC, 2008.
- Teetor, P. R cookbook. O'Reilly, 2011.
- Venables, WB; Ripley, BD. Modern applied statistics with S. New York: Springer, 2002.
- Referências on-line
- Horton, NJ; Pruim, R; Kaplan, DT. A student's guide to R. 2015.
- Jonge, E; Loo, M. An introduction to data cleaning with R. 2013.
- Maindonald, JH. Using R for data analysis and graphics. 2008.
- Paradis, E. R for beginners. 2005.
- Torgo, L. Introdução à programação em R. 2006.
Recursos computacionais
- The R project for Statistical Computing: página do programa R
- Curso sobre o uso do R no LEG
- R-rautu uma introdução ao uso do R
- R-Studio um ambiente para facilitar uso do R
- R-br é a lista de discussão em português sobre o uso do R