Não foi possível enviar o arquivo. Será algum problema com as permissões?
Essa é uma revisão anterior do documento!
CE-223: Estatística Computacional
Detalhes da oferta da disciplina
- Período: primeiro semestre de 2011
- Professor Responsável: Walmes Marques Zeviani, (LEG: Laboratório de Estatística e Geoinformação)
- Horários e Locais:
- As aulas estão programadas para a sala PC-04 entretanto serão ministradas no LABEST (sala C). Quando não o forem, será dado aviso previamente.
- Horários:
- Terça, 17:30 - 19:00h.
- Sexta, 20:45 - 22:15h.
- Data importantes:
- 28/08/2011 - Início das aulas.
- 26/06/2011 - Último dia letivo do 2o semestre.
- 04/07 a 09/07/2011 - Período de exames finais.
- Calendário completo: Resolução 71/10 do CEPE que estabelece o calendário para ano de 2011 (formato PDF).
- Avaliação: método de avaliação, conteúdo e datas à definir.
- Horários de atendimento do professor : Segundas e quartas, 16:30 - 17:30, LEG (Laboratório de Estatística e Geoinformação), prédio anexo ao prédio da administração do centro politécnico, andar superior (espaço do antigo salão de provas).
Programa da Disciplina
O objetivo desta disciplina é capacitar os alunos para o uso de recursos computacionais para computação estatística. O curso dará ênfase e capacitará os participantes no uso do (ambiente R de computação estatística). Será assumido conhecimento:
- do conteúdo correspondente à disciplina Estatística Descritiva e Exploratória
- do sistema operacional LINUX
EMENTA da disciplina
Referências Bibliográficas
- [2010, book]
- Bussab, W. O., & Morettin, P. A. (2010). Estatística Básica (6 ed.) Saraiva.
- [200?, book]
- Magalhães, M. N., & Lima, A. C. P. (200?). Noções de Probabilidade e Estatística (1 ed.) Edusp.
- [2009, techreport | www]
- Ribeiro Júnior, P. J. (2009). Introdução ao Ambiente Estatístico R.
- [2002, book | www]
- Venables, W. N., & Ripley, B. D. (2002). Modern applied statistics with S Birkhäuser.
- [2009, book | www]
- Everitt, B. S., & Hothorn, T. (2009). A Handbook of Statistical Analyses Using R, Second Edition (2 ed.) Chapman \& Hall.
- [2008, book | www]
- Dalgaard, P. (2008). Introductory Statistics with R (2nd ed.) Springer.
- [2008, book | www]
- Sarkar, D. (2008). Lattice: Multivariate Data Visualization with R (1 ed.) Springer.
- [2005, book | www]
- Murrell, P. (2005). R Graphics (1 ed.) Chapman and {Hall/CRC}.
Histórico das Aulas do Curso
Abaixo o histórico de atividades realizadas em classe e atividades extra classe sugeridas.
Data | Classe | Extra |
---|---|---|
ter 01/Mar | Sobre o R, definição de objeto, criação, acesso e modificação de vetores, matrizes, data.frame e listas. | Visitar página da disciplina, instalar o R no computador pessoal, ver o toṕico 6 do material de apoio e rodar o arquivo aula1.R. |
sex 04/Mar | Instalação e introdução ao RStudio, geração de sequências/repetições, entrada de dados no R via uso das funções scan() , textConnection() , edit() , read.table() . | Fazer uma cópia impressa do Cartão de referência do R, instalar o RStudio, ver o tópico tópico 8 do material de apoio e rodar o arquivo aula2.R. |
ter 08/Mar | Recesso de Carnaval | Navegar/explorar o conteúdo dos links: Quick-R, R Graph Gallery e R Graphical Manual. |
sex 11/Mar | Apresentação da lista nacional R_STAT, dos gerenciadores de listas internacionais markmail e nabble, importação de dados a partir de arquivos externos, arquivos *.txt , *.csv , *.xls , uso da função read.table() e gdata::read.xls() , uso de medidas descritivas de posição e dispersão de dados. | Praticar a importação com os arquivos usados em sala (ana.txt, ipeadata[11-03-2011-09-24].csv, ana.xls) e aplicar as medidas de posição e dispersão. Conferir o que foi feito em sala rodando o arquivo aula3.R. |
ter 15/Mar | Estatística descritiva, cálculos das e uso de funções para medidas de posição e dispersão, gráficos exploratórios, medidas descritivas para subconjuntos dos dados. | Associar-se a lista de discussão Brasileira de R, a R-br, instruções em R-br. Entrar nos sites de arquivamento das mensagens mail-archive e nabble. Rodar o arquivo aula4.R. |
sex 18/Mar | Informações sobre a [R-br] , introdução sobre o editor Emacs, aplicação de funções para subconjuntos dos dados, tratando valores não disponíveis (NA ), separando por categoria, por valores, por ocorrência de padrões textuais, verificando os valores únicos e duplicados. | Inscrever-se na [R-br] , procurar o Valdeci e criar conta nas máquinas do LAB-C, ler no R Reference Card os tópicos Slicing and extracting data e Advanced data processing, rodar o arquivo aula5.R |
ter 22/Mar | Aplicação de funções para colunas e linhas do data.frame (médias por ano, medias por município), tratamento dos valores não disponíveis (NA ), como obter o registro de maior e menor valor, como fazer gráficos para colunas. | Ler no R Reference Card o tópico Distributions, baixar o arquivo analfabetos15anos.xls e importar esses dados a partir de um arquivo *.txt , rodar o arquivo aula6.R. |
sex 25/Mar | Foi preparado o arquivo aula7.R com exercícios para serem resolvidos em sala de aula, com a presença do professor. | Preencher o arquivo aula7.R com os comandos para responder o que se pede. Salvar o script e enviar para o e-mail walmes@ufpr.br (não enviar no corpo da mensagem do e-mail e nem em arquivo *.doc). Usar no título do e-mail "[ce223] - trabalho 1". Identificar-se no texto do e-mail e no cabeçalho do script com nome completo e GRR. Sinalizar dúvidas com comentários dentro do script. Enviar os arquivos de dados que usar. Serão considerados scripts enviados até às 15:30h de terça (29/03). A solução será dada na aula de 29/03. |
ter 29/Mar | Foi dada a solução para os exercícios da passados na aula anterior, disponível no arquivo aula8.R. Primeira prova foi marcada para 26/04/11. Conteúdo: todos os tópicos apresentados até a aula 8. | Rodar o arquivo aula8.R e levantar dúvidas. |
sex 01/Abr | Não houve aula devido a falta de energia elétrica no campus. | |
ter 05/Abr | Revisão de distribuição de probabilidades, uso das funções {d}{p}{q}{r}distribution() para obter densidades, probabilidades, quantis e números aleatórios de distribuições discretas e contínuas, confecção de gráficos, adição de curvas, pontos, linhas, texto, cores, legenda, obtenção de histograma, medidas de resumo, gráfico de distribuição acumulada empírica. | Rodar arquivo aula9.R e baixar o arquivo cria-caixa.R. |
sex 08/Abr | Criação de uma função de densidade {d}, obtenção de densidades, probabilidades, esperança matemática e variância por integração numérica, criação da função de distribuição acumulada {p} e cálculo de probabilidades, criação da inversa da função de distribuição acumulada {q} e obtenção dos quantis, geração de números aleatórios dessa distribuição {r} pelo método da transformada inversa, cálculo da média, variância amostral e gráficos de distribuição de frequência. | Rodar o arquivo aula10.R e ler o documento gervaral.pdf sobre métodos de geração de variáveis aleatórias. |
ter 12/Abr | Importação de aquivos *.xls , justaposição de bases de dados (merge() ), gráficos de duas variáveis contínuas, destaque de pontos para categorias de interesse, atribuição de rótulos à pontos, gráficos de dispersão separados por categoria, gráficos do pacote lattice (xyplot() , histogram() , densityplot() , bwplot() ), criação de categorias a partir de variáveis contínuas (com mesma amplitude de classe e com mesmo número de elementos por classe), obtenção de correlações separado por categorias. | Entrar na página http://www.leg.ufpr.br/doku.php/temp, clicar na aba editar essa página e preencher o seu endereço de e-mail, que será usado para divulgações de horários, trabalhos, notas e informações em geral. Navegar pela página do pacote de gráficos lattice. Rodar o arquivo aula11.R. |
sex 15/Abr | Foi preparado o script aula12.R para ser resolvido (iniciado) em sala de aula e entregue em forma de trabalho. As instruções então dentro do próprio arquivo. | Resolver o que se pede no próprio script; enviar arquivo de soluções com extensão .R e não em .doc, .txt, ou outros!; enviar para o e-mail ; usar a palavra "ce223" no título da mensagem, ex "ce223 trabalho 2"; não usar CE223, nem ce 223, nem ce-233, você receber uma notificação de recebimento; enviar o trabalho até dia 29/04/11 às 22:00 horas; sinalizar as suas dúvidas com comentários dentro do script. |
ter 19/Abr | Aula de revisão do conteúdo previsto para a primeira avaliação. | Estudar para a prova. |
sex 22/Abr | Não haverá aula devido ao feriado. | Instruções para a prova: a prova é individual; pode-se consultar a internet e o cartão de referência do R; não se pode consultar o caderno e fazer trocas de informação/material com colegas; a prova será no multiterminal de 17:30 às 19:15 e será aplicada pelo Professor Paulo Justiniano; as questões devem ser respondidas na folha de prova com transcrição dos códigos R usados para obter os resultados; você tem que devolver o a folha de questões junto com as folhas de prova com sua identificação em ambos; é recomendável que você faça a prova no computador do laboratório; caso faça a prova no seu computador pessoal, a total e correta importação dos dados é de sua responsabilidade. |
ter 26/Abr | Primeira avaliação. Conteúdo: todos os tópicos apresentados até a aula 8. | Caprichar na resolução da lista de exercícios do conteúdo referente à segunda avaliação para recuperar a nota tirada na primeira avaliação. |
sex 29/Abr | Não haverá aula. | Gabarito da primeira avaliação. |
ter 03/Mai | Foi discuto o gabarito da primeira avaliação e o gabarito do segundo trabalho, solução disponível no arquivo aula13.R. | Estudar o gabarito da prova. |
sex 06/Mai | Intervalo de confiança e teste de hipótese para média de dados normais, ilustração com construção dessas funções. | Rodar o arquivo aula14.R. Ler o conteúdo do tópico 16 - Intervalos de confiança - I do Paulo Justiniano - Embrapa. Resultado do desempenho na primeira avaliação disponível. |
ter 10/Mai | Teste de hipótese e intervalo de confiança para a diferença de duas médias, ilustração com construção dessas funções e combinação de funções para aplicação do teste t após o teste de igualdade de variâncias. | Rodar o arquivo aula15.R. Ler o conteúdo do tópico 22 - Intervalos de confiança e testes de hipótese do Paulo Justiniano - Embrapa. |
sex 13/Mai | Aprimoramento da função para intervalo de confiança e teste de hipótese de uma média normal com a inclusão de opções para teste bilateral e unilateral, uso das funções dentro de lapply() e sapply() . | Rodar arquivo aula16.R. Ler a documentação das funções apresentadas. |
ter 17/Mai | Aplicando estatísticas descritivas usando lapply() , do.call() e exportando resultados write.table() . | Rodar o arquivo aula17.R. Ler a documentação das funções apresentadas. |
sex 20/Mai | Construção de funções de verossimilhança e estimação de parâmetros usando a optim() . | Rodar o arquivo aula18.R. Ler o tópico 17 - funções de verossimilhança do Paulo Justiniano - Embrapa. |
ter 24/Mai | Estimação de parâmetros por máxima verossimilhança e mínimos quadrados de um modelo de regressão usando a optim() . | Rodar o arquivo aula19.R. |
sex 27/Mai | Expressões regulares: definição, metacaracteres, uso da função grep() para busca e gsub() para substuições. | Rodar o arquivo aula20.R. |
ter 31/Mai | Segunda avaliação. Conteúdo: todos os tópicos apresentados da aula 9 à 16. | Instruções para a prova: a prova é individual; pode-se consultar a internet e o cartão de referência do R; não se pode consultar o caderno e fazer trocas de informação/material com colegas; a prova será no LAB C do Labest de 17:30 às 19:15; as questões devem ser respondidas na folha de prova com transcrição dos códigos R usados para obter os resultados; você tem que devolver o a folha de questões junto com as folhas de prova com sua identificação em ambos; é recomendável que você faça a prova no computador do laboratório; caso faça a prova no seu computador pessoal, a total e correta importação dos dados é de sua responsabilidade. |
sex 03/Jun | Expressões regulares: alternância, quantificação. Partir strings (strsplit() ), concatenar strings (paste() ) e formatar strings (formatC() ). | Rodar o arquivo aula21.R. |
ter 07/Jun | Operações com datas: conversão de strings e números para datas, uso das funções as.Date() , ISOdate() , as.POSIXct() , formatação de string de datas com format() , confecção de gráficos dados orientados no tempo, uso da função axis.POSIXct() . | Rodar o arquivo aula22.R. |
sex 10/Jun | Confecção de documentos em Sweave. Preâmbulo e corpo do documento. Classes de documentos e pacotes do Latex. Como compilar arquivos Sweave (*Rnw ) e Latex (*tex ). | ? |
ter 14/Jun | Confecção de documentos em Sweave. Inserção de equações, tabelas e figuras. Uso de referência cruzada em equações, tabelas e figuras. | Rodar o arquivo aula23.Rnw. |
sex 17/Jun | Confecção de documentos em Sweave. Usando as opções do chunk. | Rodar arquivo aula24.Rnw. |
ter 21/Jun | Terceira avaliação. Conteúdo: todos os tópicos apresentados da aula 17 à 22. | Instruções para a prova: a prova é individual; pode-se consultar a internet e o cartão de referência do R; não se pode consultar o caderno e fazer trocas de informação/material com colegas; a prova será no LAB C do Labest de 17:30 às 19:15; as questões devem ser respondidas na folha de prova com transcrição dos códigos R usados para obter os resultados; você tem que devolver o a folha de questões junto com as folhas de prova com sua identificação em ambos; é recomendável que você faça a prova no computador do laboratório; caso faça a prova no seu computador pessoal, a total e correta importação dos dados é de sua responsabilidade. |
sex 24/Jun | ? | ? |
ter 28/Jun | ? | ? |
sex 01/Jul | ? | ? |
ter 05/Jul | Exame final. Conteúdo: toda à disciplina, tópico da aula 1 à 22. | ? |
sex 08/Jul | ? | ? |
ter 12/Jul | ? | ? |
sex 15/Jul | ? | ? |
#------------------------------------------------------------------------------------------ # como fiz a tabela acima usando o R? datas <- c(seq(as.Date("2011/3/1"), as.Date("2011/7/31"), by="week"), seq(as.Date("2011/3/4"), as.Date("2011/7/31"), by="week")) datas <- sort(datas) write.table(data.frame(x=paste("| ", c("ter","sex"), format(datas, "%d/%b"), "| ? | ? |")), file="datas.txt", quote=FALSE, row.names=FALSE) #------------------------------------------------------------------------------------------
Avaliações
Data | Conteúdo | Prova | Gabarito | Notas |
---|---|---|---|---|
(26/04/2011) | Importação, manipulação e descrição de dados. | prova-1.pdf | gabarito-1.pdf | notas.pdf |
(31/05/2011) | Probabilidades, variáveis aleatórias e inferência estatística. | prova-2.pdf | gabarito-2.pdf | notas.pdf |
(??/??/2011) |
Programas computacionais
- Programa básico do curso
- The R project for Statistical Computing: página do programa R
- Recursos auxiliares
- Recursos sobre o R
- [R-br] é uma lista de discussão em português sobre o uso do R.
- Uma página interessante com um introdução ao R
- Rseek é uma página de procura de recursos do R
- Alguns materiais sobre o uso o
- Editor de texto : O MiKTeX disponibiliza arquivos de instalação para ambiente Windows
- Tex-BR uma excelente página em portugês brasileiro sobre o
- Diversos outros links neste material
- O TeXniccenter é um editor para ambiente windows que facilita a edição de documentos do
- About Latex no site Art of problem solving
- Versão WIKI e atualizada do link acima
- O Xemacs é uma outra opção de editor que facilita a edição de arquivos do e R e disponível para plataformas Linux e Windows.
- A página de Fernando Ferraz tem uma série de recursos de interesse para estatísticos