Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
disciplinas:ce225-2012-02:historico [2013/02/07 15:53]
paulojus
disciplinas:ce225-2012-02:historico [2013/03/04 08:09] (atual)
paulojus [22/02]
Linha 24: Linha 24:
 | 14/12 | LABEST | Estimação:​ Algoritmo IWLS - exemplos (**[[http://​leg.ufpr.br/​~elias/​ensino/​ce225/​bernoulli2.R|script]]**)| ​  ​| ​ |  | | | |  ​ | 14/12 | LABEST | Estimação:​ Algoritmo IWLS - exemplos (**[[http://​leg.ufpr.br/​~elias/​ensino/​ce225/​bernoulli2.R|script]]**)| ​  ​| ​ |  | | | |  ​
 | 23/01 | PA-03 |Modelagem estatística:​ de LM's a GLM'​s ​ |   ​| ​ |  | | | |  ​ | 23/01 | PA-03 |Modelagem estatística:​ de LM's a GLM'​s ​ |   ​| ​ |  | | | |  ​
-| 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Avaliação e comparação de ajustes de modelos. ​ |   ​| ​ |  | | | |   +| 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? ​Modelos lineares, linearizáveis,​ não lineares, normais e não normais. ​Avaliação e comparação de ajustes de modelos. ​ |   ​| ​ |  | | | |   
-| 30/01 | LABEST ​(VER ABAIXO) ​|Exemplos de problemas sob a forma de GLM'​s ​ |   ​| ​ |  | | | |   +| 30/01 | LABEST |Exemplos de problemas sob a forma de GLM'​s  ​(VER ABAIXO) ​|   ​| ​ |  | | | |   
-| 01/02 | LABEST ​(VER ABAIXO) ​|Interpretações de resultados das análises ​  ​| ​  ​| ​ |  | | | |   +| 01/02 | LABEST ​ |Interpretações de resultados das análises ​(VER ABAIXO) ​  |   ​| ​ |  | | | |   
-| 06/02 | PA-03 (VER ABAIXO)|Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance ​ |   ​| ​ |  | | | |   +| 06/02 | PA-03 |Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance  ​(VER ABAIXO)|   ​| ​ |  | | | |   
-08/02 | LABEST (VER ABAIXO) |  |   ​| ​ |  | | | |  ​+15/02 | LABEST ​| Análise de tabelas de contingência. Distribuições e modelos alternativos e equivalências em análise ​ via GLM|  |   ​| ​ |  | | | |   
 +| 20/02 |atividades de estudo |(ver abaixo ​| ​  |  ​|  | | | |   
 +| 22/02 |atividades de estudo |(ver abaixo) ​ |   ​| ​ |  | | | |   
 +| 27/02 |PA-03 | Outros GLM's - estendendo GLM usuais - modelos com dispersão, modelagem de média e variância, quasi verosimilhança,​ superdispersão e efeitos aleatórios ​ |   ​| ​ |  | | | |   
 +| 01/03 | LABEST |exemplos de "​outros"​ GLM's. Ex: Escolha da modelo, modelo binomial negativo e quasipoisson (ver abaixo) ​|   ​| ​ |  | | | |  ​
  
  
Linha 213: Linha 217:
  
 ==== 06/02 e 08/02 ==== ==== 06/02 e 08/02 ====
 +**Exemplo 1** \\
 A tabela abaixo apresenta dados de um estudo sobre "​Acreditar em Vida Após a Morte" retirados de Wood (2006). A tabela abaixo apresenta dados de um estudo sobre "​Acreditar em Vida Após a Morte" retirados de Wood (2006).
 O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo. O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo.
Linha 220: Linha 224:
 interpretando as quantidades de interesse nas análises e ainda comparando com resultados de outro(s) procedimento(s). interpretando as quantidades de interesse nas análises e ainda comparando com resultados de outro(s) procedimento(s).
 <​code>​ <​code>​
-#             Acredita +             Acredita 
-       ​------------------- +        ------------------- 
-#Sexo      Sim        Não +Sexo      Sim        Não 
-#------------------------------ +------------------------------ 
-#F         435       ​147 +F         435      147 
-#M         375       ​134 +M         375      134 
-#​------------------------------+------------------------------ 
 +</​code>​ 
 + 
 +<code R> 
 + 
 +M <- cbind(c(435,​ 375), c(147, 134)) 
 +dimnames(M) <- list(c("​F",​ "​M"​),​ c("​S",​ "​N"​)) 
 +
 + 
 +chisq.test(M) 
 + 
 +addmargins(M) 
 +Mesp <- outer(rowSums(M),​ colSums(M))/​sum(M) 
 +Mesp 
 + 
 +(Chi2 <- sum(((M - Mesp)^2)/​Mesp)) 
 +chisq.test(M,​ correct=F) 
 + 
 + 
 +vam <- data.frame(Y=as.vector(M),​ Sexo = rownames(M),​ Acredita=rep(colnames(M),​ each=2)) 
 +vam 
 + 
 +## Modelo 0 
 + 
 +## Modelo 1: (independência) 
 +## E(Y) = mu = n * Sexo * Acredita  
 +## log(mu) ​ = log(n) + log(Sexo) + log(Acredita)  
 +mod1 <glm(Y ~ Sexo + Acredita, family=poisson(link="​log"​),​ data=vam) 
 +model.matrix(mod1) 
 +mod1 
 + 
 +fitted(mod1) 
 +Mesp 
 + 
 +resid(mod1, type="​pearson"​) 
 +(M Mesp)/​sqrt(Mesp) 
 + 
 +sum(resid(mod1,​ type="​pearson"​)^2) 
 + 
 + 
 +resid(mod1, type="​deviance"​) 
 +sum(resid(mod1,​ type="​deviance"​)^2) 
 + 
 + 
 +## Modelo 2: não independência 
 +mod2 <glm(Y ~ Sexo * Acredita, family=poisson,​ data=vam) 
 +model.matrix(mod2) 
 +mod2 
 + 
 +fitted(mod2) 
 +
 + 
 +anova(mod1, mod2, test="​Chisq"​) 
 + 
 +## extensível a várias dimensões ​modelos log-lineares 
 + 
 +# sob link canônico X'y = X'​\hat{mu} 
 +#  ​marginais preditas iguais a observadas em mod1 
 +</​code>​ 
 + 
 + 
 +**Exemplo 2**\\ 
 +Novos casos de AIDS na Bélgica de 1981 a 1993.\\ 
 +Modelo Epidêmico (Venables & Ripley, MASS). \\ 
 +//​Interesse://​ A taxa de novos casos está reduzindo?​ 
 + 
 +<code R> 
 +aids <data.frame( 
 +        y = c(12,​14,​33,​50,​67,​74,​123,​141,​165,​204,​253,​246,​240),​ 
 +        ano = 1:13 
 +
 +aids 
 +with(aids, plot(y ~ I(1980 + ano))) 
 +</​code>​ 
 + 
 +Considere um modelo em que o número esperado de novos casos por ano seja: 
 +<​latex>​ 
 +\mu_i = \gamma \exp(\delta t_i) 
 +</​latex>​ 
 + 
 +Ajuste o modelo fazendo suposições necessárias e adequadas.\\ 
 +Procure avaliar a qualidade de ajuste e possíveis formas de tentar melhorar o ajuste com os dados disponíveis.\\ 
 +Represente o(s) modelo(s) ajustados graficamente (na escala das observações) procurando incluir no gráfico a incerteza das previsões 
 + 
 +<code R> 
 +# mu_i = a . exp(b*ano_i) 
 +# log(mu_i) = log(a) +  b*ano_i ​ = \beta_0 +  \beta_1 * ano_i 
 + 
 +m1 <glm(y ~ ano, family=poisson,​ data=aids)  
 +m1 
 +summary(m1) 
 + 
 +plot(resid(m1) ~fitted(m1)) 
 +lines(lowess(resid(m1) ~fitted(m1))) 
 + 
 +par(mfrow=c(2,​2)) 
 +plot(m1) 
 +par(mfrow=c(1,​1)) 
 + 
 +## tentando melhorar o ajuste 
 +m2 <glm(y ~ ano + I(ano^2), family=poisson,​ data=aids)  
 +m2 
 +summary(m2) 
 +anova(m1,​m2,​ test="​Chisq"​) 
 + 
 +# nao faz sentido aqui mas é util com variaveis diferentes  
 +drop1(m2) 
 +drop1(m2, test="​Chisq"​) 
 + 
 +ano.seq <seq(1,13, l=100) 
 +ypred <predict(m2, data.frame(ano=ano.seq),​ se=TRUE) 
 +str(ypred) 
 +with(aids, plot(y ~ I(1980 + ano), ylim=c(0,​280))) 
 +lines(exp(ypred$fit) ~ I(ano.seq+1980)) 
 +lines(exp(ypred$fit ​2*ypred$se.fit) ~ I(ano.seq+1980),​ lty=2) 
 +lines(exp(ypred$fit + 2*ypred$se.fit) ~ I(ano.seq+1980),​ lty=2) 
 +</​code>​ 
 + 
 +=== 20/02 === 
 +   Obter as funções de verossimilhança para os quatro modelos discutidos em aula para tabelas de contingência 
 +   proceder as análises com cada um dos modelos usando algum ambiente computacional 
 +   Examinar e justificar a razão pela qual podem ser ajustados com GLM com família Poisson 
 +   Comparar e discutir semelhanças e diferenças entre o ajuste de GLM com outros procedimentos (teste exato de fisher, teste chi-quadrado) ​  
 + 
 +=== 22/02 === 
 +  ​Mostrar como quantidades de interesse (predição) podem ser obtidas. Utilizar os exemplos vistos em aula.  
 +    ​Mostrar como obter as predições na escala da resposta e da função de ligação 
 +    ​Mostrar como obter os intervalos de predição 
 +    ​Verificar os resultados com os retornados pela função ''​predict()''​ do R 
 +    ​Algumas sugestões:​ 
 +      ​como calcular os valores da curva de valores ajustados nos exemplos da //​creatinina vs infarto// e no de "novos casos de AIDS na Bélgica"​. Ainda neste exemplo, como estimar a dose associada a uma certa probabilidade fixada de morte? 
 +      ​como calcular as contagens esperadas no exemplo de //crença vc sexo// ? 
 + 
 + 
 +=== 01/03 === 
 +Comandos do exemplo discutido em aula 
 +<code R> 
 +## carregando o conjunto de dados DHF99 do pacote epicalc 
 +require(epicalc) 
 +data(DHF99) 
 +head(DHF99) 
 +help(DHF99) 
 +summary(DHF99) 
 +summary(DHF99) 
 +## a variável village está como numérica mas de fato é um fator 
 +DHF99$village <as.factor(DHF99$village) 
 +summary(DHF99) 
 +## 
 +## Ajustando GLM'​s 
 +glm1 <glm(containers ~ village + education, data=DHF99, family=poisson) 
 +glm1 
 +summary(glm1) 
 +anova(glm1) 
 +## 
 +## vamos usar agora apenas a informação do tipo de vila 
 +glm2 <glm(containers ~ viltype + education, data=DHF99, family=poisson) 
 +glm2 
 +summary(glm1) 
 +anova(glm1) 
 +## 
 +## comparando os ajustes 
 +anova(glm2, glm1, test="​Chisq"​) 
 +## Portanto a informação individual de cada vila é relevante. 
 +## Entretanto, como exemplo vamos supor que não dispomos da informação individual 
 +## e apenas o tipo de vila. 
 +## Neste caso o ajuste não é bom e vamos tentar alternativas 
 +## 1. Modelo com interação 
 +glm3 <glm(containers ~ viltype * education, data=DHF99, family=poisson) 
 +anova(glm2, glm3, test="​Chisq"​) 
 +anova(glm2, glm3, test="​F"​) 
 +## 2. Modelo Binomial negativo 
 +require(MASS) 
 +glm2BN <- glm.nb(containers ~ viltype + education, data=DHF99) 
 +glm2BN 
 +c(poisson=logLik(glm2),​ BN=logLik(glm2BN)) 
 +c(poisson=deviance(glm2),​ BN=deviance(glm2BN)) 
 +c(poisson=AIC(glm2),​ BN=AIC(glm2BN)) 
 +## comparando os coeficientes e erros padrão 
 +summary(glm2) 
 +summary(glm2BN) 
 +## 3. Modelo quasipoisson 
 +glm2Q <- 
 + ​glm(containers ~ viltype + education, data=DHF99, family=quasipoisson) 
 +## comparando os coeficientes e erros padrão 
 +summary(glm2) 
 +summary(glm2Q) 
 +## Note que os ajustes poderiam ser avaliados em mais detalhes 
 +par(mfrow=c(2,​2)) 
 +plot(glm1) 
 +plot(glm2) 
 +plot(glm3) 
 +plot(glm2BN) 
 +## 
 +## As análises poderiam prosseguir de diversas formas. Alguns exemplos: 
 +## - avaliando ainda outros modelos como por exemplo inflacionados de de zeros, hurdle . 
 +## - verificando a relevância das covariáveis (e.g education) 
 +## Caso as vilas fossem consideradas poderia-se avaliar modelos mistos como vilas como efeito aleatórios
 </​code>​ </​code>​
  

QR Code
QR Code disciplinas:ce225-2012-02:historico (generated for current page)