CE-092 -- Segundo semestre de 2018

CE-092 -- Segundo semestre de 2018

No quadro abaixo será anotado o conteúdo dado em cada aula do curso.
São indicados os Capítulos e Sessões correspondentes nas referências bibliográficas, bem como os exercícios sugeridos.

Veja ainda depois da tabela as Atividades Complementares.

Observação sobre exercícios recomendados os exercícios indicados são compatíveis com o nível e conteúdo do curso.
Se não puder fazer todos, escolha alguns entre os indicados.

Conteúdos das Aulas

Data Conteúdo Leitura Tópico
31/07 Ter Informações sobre o curso. Uma discussão sobre algumas possíveis extensões do modelo de regressão: GLM's, modelos com respostas transformadas. Modelos heterocedásticos e com covariância não nula entre observações. Cap 1 - Introdução
Livro do Faraway
Ver abaixo
02/08 Qui Discussão sobre o exercício do cálculo de média, incluindo uma revisão sobre estimação e métodos de estimação. Média como resultado de estimação por mínimos quadrados. Média como resultado de estimação por verossimilhança. Construção da verossimilhança para o problema proposto. Solução computacional. Ver abaixo
07/08 Ter Comentários adicionais sobre ajustes com dados intervalares. Modelos com transformação da variável resposta. Família (Box-Cox) de transformação. Outras distribuições para respostas. Regressão: média, por partes, regressão linear por partes e segmentada. Ver abaixo
09/08 Qui Regressão com variáveis transformadas e regressão por partes: detalhamento e códigos Ver abaixo
14/08 Ter Ajuste de diferentes médias. Parametrizações e reparametrizações. Matrizes dos modelos. Interpretação dos parâmetros. De regressão segmentada à regressão por partes. Restrição de continuidade. Expressão do modelo e número de parâmetros Ver abaixo
16/08 Qui Comandos para exemplos de regressão com transformação e segmentada. Funções polinomiais locais - o caso cúbicas. Restrições de continuidade e suavidade. O conceito de funções base. splines, Exemplos. Ver abaixo
21/08 Ter Ilustração de conceitos vistos com "scripts" computacionais. Fundamento para escolha do(s) nó(s) em regressão segmentada/splines Ver abaixo
23/08 Qui 1a avaliação intermediária
28/08 Qui Discussão da 1a avaliação intermediária. Ver abaixo
30/08 Qui Atividade de estudo. Sem aula expositiva Ver abaixo
04/08 Ter Outros métodos de suavização: KNN, kernel, suavização por splines, lowess Cap 14: 14.1 a 14.4
06/08 Qui Outros métodos de suavização: KNN, kernel, suavização por splines, lowess (cont.) Cap 14: 14.1 a 14.4
11/08 Ter Uma discussão sobre recursos computacionais e estatística. Introdução aos efeitos aleatórios Ver abaixo
13/08 Qui Efeitos aleatórios - um modelo particular e generalizações. Predição dos efeitos aleatórios Ver abaixo
18/08 Ter Efeitos aleatórios - Efeitos aleatórios por grupos de observações. Predição dos efeitos aleatórios. Especificação geral do modelo Gaussiano e casos vistos até aqui como particulares do modelo geral. Ver abaixo
20/08 Qui Estimação em efeitos aleatórios. Obtenção das expressões. Estimação por verossimilhança e métodos numéricos.
27/08 Ter Não houve aula.
29/08 Qui Computação em modelos de efeitos aleatórios Ver abaixo
02/10 Ter SIEPE - dia não letivo
04/10 Qui SIEPE - dia não letivo
09/10 Qui Discussão/interpretação do artigo de Singer et. al. Ver abaixo
22/10 Ter Simulação de dados em modelos de efeitos aleatórios. Modelos para respostas não gaussianas - introdução Ver abaixo
24/10 Qui Inferência em GLMM Ver abaixo
30/10 Ter Sem aula presencial. Atividade recomendada: discussão em grupo dos exercícios propostos nas últimas aulas
01/11 Qui Discussão de exemplo de análise da dados de contagem com efeitos aleatórios (Ex no livro de Faraway). glmmPQL() e glmer()
06/11 Ter Introdução às árvores. Faraway, Cap 16: 16.1 e 16.2 Ver abaixo
08/11 Qui Um pouco mais sobre árvores. Avaliação do ajuste. Características e limitações do método. Critérios para poda de árvores Analisar via árvores dados vistos em alguma outra disciplina (reg/gamlss, …_
13/11 Ter Ajustando árvores de regressão e classificação. (Prof. Cesar) Ver abaixo
15/11 Qui Feriado.
20/11 Ter Árvores inferenciais - ctrees (prof. Cesar, continuação)
22/11 Qui Fundamentos de regressão heterocedástica (estrutural e correção de erros padrão) e regressão quantílica Ver abaixo
27/11 Ter Prova: modelos de efeitos aleatórios
29/11 Qui Introdução aos modelos não lineares. slides\\Exemplo
03/12 Seg Prova: árvores, modelos heterocedásticos, regressão quantílica, modelos não lineares

31/07

  1. Calcular a média entre os três dados nas seguintes situações:
    1. As observações são: 22, 25, 32
    2. As observações são: <24, [23, 28] , >30
    3. As observações são: >24, [23, 28] , <30
    4. De todas as observações: pontuais e intervalares
    5. Generalizar o arquivo de comandos anterior para incluir a estimação da variância
  2. De forma semelhante ao problema anterior, deseja-se calcular a média os casos a seguir, sabendo-se agora que se referem a dados de contagem.
    1. As observações são: 2, 0, 5, 3, 1, 3, 1, 2
    2. As observações são: > 0, 0, [3-7], >= 1, 1, 3, < 3, ⇐ 4

02/08

  1. Seja uma variável (resposta) Y e uma covariável X com valores dados conforme abaixo. Ajuste um modelo de regressão linear simples.
    X 0.4 1.2 1.8 1.9 2.0 6.8 7.6 8.3 8.7 9.3 10.7 11.3 13.0 13.4 14.2
    Y 0.8 2.4 1.8 2.4 2.4 2.9 3.6 3.7 3.1 4.9 3.6 3.2 4.1 4.6 3.8
  2. Repita agora o ajusta porém supondo a seguinte tabela de dados (com algumas respostas intervalares)
    X 0.4 1.2 1.8 1.9 2.0 6.8 7.6 8.3 8.7 9.3 10.7 11.3 13.0 13.4 14.2
    Y 0.8 < 1.8 [1,5; 20] 2.4 > 2 2.9 3.6 < 4 [2,5; 4] > 4.5 < 4 3.2 4.1 [4; 5] < 5

07/08

  1. Utilizando este arquivo de dados, efetue as análises das regressões de Y1 vs x e Y2 vs x, cada uma delas com os modelos de regressão linear simples inicialmente e depois com:
    1. transformação (log) da variável resposta,
    2. transformação (raiz quadrada) da variável resposta,
    3. transformação (Box-Cox) da variável resposta
    4. distribuição Gama para a resposta.
    5. Compare as verossimilhanças dos modelos ajustados lembrando de torná-las comparáveis se necessário.
  2. Ainda utilizando os mesmos dados, ajuste modelos:
    1. de média constante,
    2. de médias constantes por partes/intervalos
    3. de regressão linear simples
    4. de regressão segmentada. Defina (arbitrariamente) um "ponto de corte" em 1,2

Copie o arquivo para um diretório (pasta), aponte o R para esta pasta e importe os dados com:

df <- read.table("df02.txt", head=TRUE)

09/08

  1. derivar e implementar modelos por partes para 3 ou mais partes
  2. derivar o modelo e escrever o código para o modelo de regressão segmentada (conectado no(s) nó(s))
  3. refazer os Exemplos 1 e 5 do arquivo de comandos porém agora estimando o "nó".

14/08

  1. (computacional) Ajuste o modelo de (3) médias sob as diferentes vistas na aula (.. e pode propor outras), discuta a interpretação dos parâmetros e verifique que as medidas de ajuste são iguais.
  2. Defina e ajuste um modelo de regressão segmentada para o exemplo (arquivo de dados da aula de 07/08) com um ponto de corte (nó) fixado.
  3. Idem fixando 2 nós.
  4. Discuta nos casos anteriores como devem ser interpretados os parâmetros de seu modelo.
  5. Procure explorar diferentes parametrizações.
  6. Proponha um ajuste de regressão segmentada para os dados:
    MASS::mcycle
    with(MASS::mcycle, plot(accel ~ times))

16/08

  1. arquivo de comandos visto em aula - splines (nova versão, atualizado em 23/08 19:30)
  2. Refaça o exemplo com os dados MASS::mcycle mas agora ajustando splines cúbicos
  3. Considere o problema de regressão por splines cúbicos com 1 ponto de corte e derive as expressões das restrições para continuidade e suavidade
  4. verifique as funções do pacote splines para construir splines. Refaça o exemplo de splines cúbicos do arquivo visto em aula utilizando tais funções.

21/08

  1. Arquivo de comandos visto em aula (atualizado de 09/08)

28/08

Tópico para discussão: e estimação da média (esperança) a partir de um conjunto de dados depende da escolha da distribuição de probabilidades assumida para os dados?
Atividade computacional sugerida

  1. Gere um conjunto de dados pontuais e estime a média por verossimilhança assumindo diferentes distribuições. Verifique se as estimativas mudam.
  2. Idem anterior com dados (todos ou parte deles) intervalares

30/08

  1. Explorar detalhadamente este arquivo de comandos

11/09

  1. Explorar o material (shiny) preparado pela Jhenifer e Lineu

13/09

  1. Explorar o arquivo de comandos visto em aula.
  2. Procure mudar termos e opções para verificar os efeitos
  3. Escrever um código para estimar os parâmetros do modelo discutido em aula

18/09

  1. O arquivo de comandos visto na aula passada foi atualizado.
  2. Procure mudar termos e opções para verificar os efeitos
  3. Montar a matriz adequada para ajustar uma regressão linear para cada grupo, com os coeficientes da regressão considerados como aleatórios. Contraste com a regressão ajustada para cada grupo.

18/09

  1. O arquivo de comandos visto na aula passada foi novamente atualizado incluindo agora estimação de parâmetros.

29/09

  1. Um outro exemplo de códigos com uma análise similar. Modificar os códigos se necessário para nova versão da lme4. Interpretar os resultados e extrair resumos interessantes da análise.
  2. Estudar o artigo de Singer et.al. Confiabilidade e Precisão na Estimação de Médias
    Julio M. Singer, Carmen Diva Saldiva de André, Clóvis de Araújo Peres
    Confiabilidade e Precisão na Estimação de Médias
    Revista Brasileira de Estatística, v73, n. 236, jan./jun. 2012.
  3. Escrever códigos que reproduzam as análises do artigo
    Local Concentra 
    1     170,6 
    1     154,7 
    1     136,4 
    1     153,1 
    2      68,0 
    2      66,4 
    2      70,3 
    2      71,1 
    3     151,5 
    3     138,0 
    3     128,4
    3     118,1
    4     153,9
    4     149,1
    4     147,5
    4     103,8
    5      83,9
    5     101,4
    5     117,3
    5     114,1

09/10

22/10

Simular dados para cada uma das situações a seguir. Em cada caso fazer gráficos adequados dos dados simulados. Considerar diferentes cenários na simulação.

  1. Simular dados do modelo para grupos de observações, semelhante utilizado no artigo de Singer et al.
  2. Simular dados do modelo longitudinal com efeito linear no tempo e intercepto aleatório.
  3. Simular dados do modelo longitudinal com efeito linear no tempo e intercepto e inclinação aleatórios.

24/10

  1. Simular dados para cada uma das situações anteriores porém agora resposta Poisson. Em cada caso fazer gráficos adequados dos dados simulados. Considerar diferentes cenários na simulação.
  2. Ajustar modelos aos dados simulados usando a lme4:::lmer()
  3. Escrever a expressão da verossimilhança para o modelo Poisson con efeito aleatório em grupos de observações (situação 1 das simulações)
  4. Desafio: escrever um código para estimar os parêmetros no primeiro caso e comparas suas estimativas com a da lme4:::glmer()

07/11

  1. Arquivo de comandos visto em aula

22/11

  1. Artigo sobre modelos heterocedásticos
  2. Documentação do pacote (excelente texto explicativo)
  3. arquivo de comandos sobre regressão quantílica visto em aula

27/11