Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
disciplinas:ce225-2012-02:historico [2013/02/07 17:16] paulojus |
disciplinas:ce225-2012-02:historico [2013/03/04 08:09] (atual) paulojus [22/02] |
||
---|---|---|---|
Linha 25: | Linha 25: | ||
| 23/01 | PA-03 |Modelagem estatística: de LM's a GLM's | | | | | | | | | 23/01 | PA-03 |Modelagem estatística: de LM's a GLM's | | | | | | | | ||
| 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Modelos lineares, linearizáveis, não lineares, normais e não normais. Avaliação e comparação de ajustes de modelos. | | | | | | | | | 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Modelos lineares, linearizáveis, não lineares, normais e não normais. Avaliação e comparação de ajustes de modelos. | | | | | | | | ||
- | | 30/01 | LABEST (VER ABAIXO) |Exemplos de problemas sob a forma de GLM's | | | | | | | | + | | 30/01 | LABEST |Exemplos de problemas sob a forma de GLM's (VER ABAIXO) | | | | | | | |
- | | 01/02 | LABEST (VER ABAIXO) |Interpretações de resultados das análises | | | | | | | | + | | 01/02 | LABEST |Interpretações de resultados das análises (VER ABAIXO) | | | | | | | |
- | | 06/02 | PA-03 (VER ABAIXO)|Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance | | | | | | | | + | | 06/02 | PA-03 |Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance (VER ABAIXO)| | | | | | | |
- | | 08/02 | LABEST (VER ABAIXO) | | | | | | | | | + | | 15/02 | LABEST | Análise de tabelas de contingência. Distribuições e modelos alternativos e equivalências em análise via GLM| | | | | | | | |
+ | | 20/02 |atividades de estudo |(ver abaixo) | | | | | | | | ||
+ | | 22/02 |atividades de estudo |(ver abaixo) | | | | | | | | ||
+ | | 27/02 |PA-03 | Outros GLM's - estendendo GLM usuais - modelos com dispersão, modelagem de média e variância, quasi verosimilhança, superdispersão e efeitos aleatórios | | | | | | | | ||
+ | | 01/03 | LABEST |exemplos de "outros" GLM's. Ex: Escolha da modelo, modelo binomial negativo e quasipoisson (ver abaixo) | | | | | | | | ||
Linha 213: | Linha 217: | ||
==== 06/02 e 08/02 ==== | ==== 06/02 e 08/02 ==== | ||
+ | **Exemplo 1** \\ | ||
A tabela abaixo apresenta dados de um estudo sobre "Acreditar em Vida Após a Morte" retirados de Wood (2006). | A tabela abaixo apresenta dados de um estudo sobre "Acreditar em Vida Após a Morte" retirados de Wood (2006). | ||
O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo. | O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo. | ||
Linha 227: | Linha 231: | ||
M 375 134 | M 375 134 | ||
------------------------------ | ------------------------------ | ||
+ | </code> | ||
+ | |||
+ | <code R> | ||
+ | |||
+ | M <- cbind(c(435, 375), c(147, 134)) | ||
+ | dimnames(M) <- list(c("F", "M"), c("S", "N")) | ||
+ | M | ||
+ | |||
+ | chisq.test(M) | ||
+ | |||
+ | addmargins(M) | ||
+ | Mesp <- outer(rowSums(M), colSums(M))/sum(M) | ||
+ | Mesp | ||
+ | |||
+ | (Chi2 <- sum(((M - Mesp)^2)/Mesp)) | ||
+ | chisq.test(M, correct=F) | ||
+ | |||
+ | |||
+ | vam <- data.frame(Y=as.vector(M), Sexo = rownames(M), Acredita=rep(colnames(M), each=2)) | ||
+ | vam | ||
+ | |||
+ | ## Modelo 0 | ||
+ | |||
+ | ## Modelo 1: (independência) | ||
+ | ## E(Y) = mu = n * Sexo * Acredita | ||
+ | ## log(mu) = log(n) + log(Sexo) + log(Acredita) | ||
+ | mod1 <- glm(Y ~ Sexo + Acredita, family=poisson(link="log"), data=vam) | ||
+ | model.matrix(mod1) | ||
+ | mod1 | ||
+ | |||
+ | fitted(mod1) | ||
+ | Mesp | ||
+ | |||
+ | resid(mod1, type="pearson") | ||
+ | (M - Mesp)/sqrt(Mesp) | ||
+ | |||
+ | sum(resid(mod1, type="pearson")^2) | ||
+ | |||
+ | |||
+ | resid(mod1, type="deviance") | ||
+ | sum(resid(mod1, type="deviance")^2) | ||
+ | |||
+ | |||
+ | ## Modelo 2: não independência | ||
+ | mod2 <- glm(Y ~ Sexo * Acredita, family=poisson, data=vam) | ||
+ | model.matrix(mod2) | ||
+ | mod2 | ||
+ | |||
+ | fitted(mod2) | ||
+ | M | ||
+ | |||
+ | anova(mod1, mod2, test="Chisq") | ||
+ | |||
+ | ## extensível a várias dimensões - modelos log-lineares | ||
+ | |||
+ | # sob link canônico X'y = X'\hat{mu} | ||
+ | # - marginais preditas iguais a observadas em mod1 | ||
+ | </code> | ||
+ | |||
+ | |||
+ | **Exemplo 2**\\ | ||
+ | Novos casos de AIDS na Bélgica de 1981 a 1993.\\ | ||
+ | Modelo Epidêmico (Venables & Ripley, MASS). \\ | ||
+ | //Interesse:// A taxa de novos casos está reduzindo? | ||
+ | |||
+ | <code R> | ||
+ | aids <- data.frame( | ||
+ | y = c(12,14,33,50,67,74,123,141,165,204,253,246,240), | ||
+ | ano = 1:13 | ||
+ | ) | ||
+ | aids | ||
+ | with(aids, plot(y ~ I(1980 + ano))) | ||
+ | </code> | ||
+ | |||
+ | Considere um modelo em que o número esperado de novos casos por ano seja: | ||
+ | <latex> | ||
+ | \mu_i = \gamma \exp(\delta t_i) | ||
+ | </latex> | ||
+ | |||
+ | Ajuste o modelo fazendo suposições necessárias e adequadas.\\ | ||
+ | Procure avaliar a qualidade de ajuste e possíveis formas de tentar melhorar o ajuste com os dados disponíveis.\\ | ||
+ | Represente o(s) modelo(s) ajustados graficamente (na escala das observações) procurando incluir no gráfico a incerteza das previsões | ||
+ | |||
+ | <code R> | ||
+ | # mu_i = a . exp(b*ano_i) | ||
+ | # log(mu_i) = log(a) + b*ano_i = \beta_0 + \beta_1 * ano_i | ||
+ | |||
+ | m1 <- glm(y ~ ano, family=poisson, data=aids) | ||
+ | m1 | ||
+ | summary(m1) | ||
+ | |||
+ | plot(resid(m1) ~fitted(m1)) | ||
+ | lines(lowess(resid(m1) ~fitted(m1))) | ||
+ | |||
+ | par(mfrow=c(2,2)) | ||
+ | plot(m1) | ||
+ | par(mfrow=c(1,1)) | ||
+ | |||
+ | ## tentando melhorar o ajuste | ||
+ | m2 <- glm(y ~ ano + I(ano^2), family=poisson, data=aids) | ||
+ | m2 | ||
+ | summary(m2) | ||
+ | anova(m1,m2, test="Chisq") | ||
+ | |||
+ | # nao faz sentido aqui mas é util com variaveis diferentes | ||
+ | drop1(m2) | ||
+ | drop1(m2, test="Chisq") | ||
+ | |||
+ | ano.seq <- seq(1,13, l=100) | ||
+ | ypred <- predict(m2, data.frame(ano=ano.seq), se=TRUE) | ||
+ | str(ypred) | ||
+ | with(aids, plot(y ~ I(1980 + ano), ylim=c(0,280))) | ||
+ | lines(exp(ypred$fit) ~ I(ano.seq+1980)) | ||
+ | lines(exp(ypred$fit - 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2) | ||
+ | lines(exp(ypred$fit + 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2) | ||
+ | </code> | ||
+ | |||
+ | === 20/02 === | ||
+ | - Obter as funções de verossimilhança para os quatro modelos discutidos em aula para tabelas de contingência | ||
+ | - proceder as análises com cada um dos modelos usando algum ambiente computacional | ||
+ | - Examinar e justificar a razão pela qual podem ser ajustados com GLM com família Poisson | ||
+ | - Comparar e discutir semelhanças e diferenças entre o ajuste de GLM com outros procedimentos (teste exato de fisher, teste chi-quadrado) | ||
+ | |||
+ | === 22/02 === | ||
+ | - Mostrar como quantidades de interesse (predição) podem ser obtidas. Utilizar os exemplos vistos em aula. | ||
+ | - Mostrar como obter as predições na escala da resposta e da função de ligação | ||
+ | - Mostrar como obter os intervalos de predição | ||
+ | - Verificar os resultados com os retornados pela função ''predict()'' do R | ||
+ | - Algumas sugestões: | ||
+ | - como calcular os valores da curva de valores ajustados nos exemplos da //creatinina vs infarto// e no de "novos casos de AIDS na Bélgica". Ainda neste exemplo, como estimar a dose associada a uma certa probabilidade fixada de morte? | ||
+ | - como calcular as contagens esperadas no exemplo de //crença vc sexo// ? | ||
+ | |||
+ | |||
+ | === 01/03 === | ||
+ | Comandos do exemplo discutido em aula | ||
+ | <code R> | ||
+ | ## carregando o conjunto de dados DHF99 do pacote epicalc | ||
+ | require(epicalc) | ||
+ | data(DHF99) | ||
+ | head(DHF99) | ||
+ | help(DHF99) | ||
+ | summary(DHF99) | ||
+ | summary(DHF99) | ||
+ | ## a variável village está como numérica mas de fato é um fator | ||
+ | DHF99$village <- as.factor(DHF99$village) | ||
+ | summary(DHF99) | ||
+ | ## | ||
+ | ## Ajustando GLM's | ||
+ | glm1 <- glm(containers ~ village + education, data=DHF99, family=poisson) | ||
+ | glm1 | ||
+ | summary(glm1) | ||
+ | anova(glm1) | ||
+ | ## | ||
+ | ## vamos usar agora apenas a informação do tipo de vila | ||
+ | glm2 <- glm(containers ~ viltype + education, data=DHF99, family=poisson) | ||
+ | glm2 | ||
+ | summary(glm1) | ||
+ | anova(glm1) | ||
+ | ## | ||
+ | ## comparando os ajustes | ||
+ | anova(glm2, glm1, test="Chisq") | ||
+ | ## Portanto a informação individual de cada vila é relevante. | ||
+ | ## Entretanto, como exemplo vamos supor que não dispomos da informação individual | ||
+ | ## e apenas o tipo de vila. | ||
+ | ## Neste caso o ajuste não é bom e vamos tentar alternativas | ||
+ | ## 1. Modelo com interação | ||
+ | glm3 <- glm(containers ~ viltype * education, data=DHF99, family=poisson) | ||
+ | anova(glm2, glm3, test="Chisq") | ||
+ | anova(glm2, glm3, test="F") | ||
+ | ## 2. Modelo Binomial negativo | ||
+ | require(MASS) | ||
+ | glm2BN <- glm.nb(containers ~ viltype + education, data=DHF99) | ||
+ | glm2BN | ||
+ | c(poisson=logLik(glm2), BN=logLik(glm2BN)) | ||
+ | c(poisson=deviance(glm2), BN=deviance(glm2BN)) | ||
+ | c(poisson=AIC(glm2), BN=AIC(glm2BN)) | ||
+ | ## comparando os coeficientes e erros padrão | ||
+ | summary(glm2) | ||
+ | summary(glm2BN) | ||
+ | ## 3. Modelo quasipoisson | ||
+ | glm2Q <- | ||
+ | glm(containers ~ viltype + education, data=DHF99, family=quasipoisson) | ||
+ | ## comparando os coeficientes e erros padrão | ||
+ | summary(glm2) | ||
+ | summary(glm2Q) | ||
+ | ## Note que os ajustes poderiam ser avaliados em mais detalhes | ||
+ | par(mfrow=c(2,2)) | ||
+ | plot(glm1) | ||
+ | plot(glm2) | ||
+ | plot(glm3) | ||
+ | plot(glm2BN) | ||
+ | ## | ||
+ | ## As análises poderiam prosseguir de diversas formas. Alguns exemplos: | ||
+ | ## - avaliando ainda outros modelos como por exemplo inflacionados de de zeros, hurdle . | ||
+ | ## - verificando a relevância das covariáveis (e.g education) | ||
+ | ## - Caso as vilas fossem consideradas poderia-se avaliar modelos mistos como vilas como efeito aleatórios | ||
</code> | </code> | ||