Essa é uma revisão anterior do documento!
Tabela de conteúdos
Participantes
- Kelly Cristina Cancela, Mestre(UFPR)
- Antonio Rioyei Higa, Prof. Phd
- Joel Maurício Corrêa da Rosa , Prof. Dr. (UFPR)
- Luciana Duque Silva ,Doutoranda (UFPR)
- Valdeci Constantino ,Mestrando (UFPR)
Objetivo
O objetivo deste projeto é desenvolver e reunir metodologias estatísticas ligadas a problemas em Engenharia Florestal.
Metodologia
Modelos Lineares Generalizados, Testes Paramétricos e Não-Paramétricos, Análise de Sobrevivência, Análise de Séries Temporais, Modelos de Crescimento, Análise de Dados Longitudinais, Regressão por Quantis
Experimento - Kelly Cancela
Experimento - Luciana Duque Silva
Experimentos de Diferentes Espécie
- Espécie - Benthamii
- Espécie - Dunii
Dados do Dendômetro
Comparação entre duas famílias/tratamento (há dez séries temporais para cada família) . O objetivo é comparar o crescimento das famílias, distribuídas em 2 blocos (dois ambientes no local). Foram selecionadas 5 famílias de cada planta por bloco.
A luciana quer comparar estas duas famílias (seleção genética, pegou a melhor e a pior em 32 famílias). O que está em questão é medir a diferença entre o crescimento.
- Família 11- 5/bloco3 5/bloco2
- Familia 24 -6/bloco2 4/bloco3
Variável dependente - Crescimento pelo dendômetro Variáveis independentes - Copa da árvore (não é medida frequentemente, mas pode ser medida de tempos em tempos),tensão de agua no solo a 30cm de profundidade e a 60cm de profundidade, temperatura, umidade do ar, precipitação(diária), insolação, velocidade do vento (talvez não interfira), dia de geada, estação do ano.
Dar uma olhada em modelos de função de transferência. delineamento original -32 famílias, 5 repetições
Dados sobre clima no Estado de Santa Catarina, locais : Ponte Serrada, Cacçador e Chapecó (não há média histórica). As variáveis analisadas são Temperatura, Número de Geadas, …
Primeiro Trabalho - Comparar observações climáticos dos locais acima, feita a partir de 2002, com a média histórica dos ultimos 30 anos.
Welch Two Sample t-test data: Inclinacao by factor(Familia) t = 3.3352, df = 237.873, p-value = 0.0009887 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.02653859 0.10312808 sample estimates: mean in group 11 mean in group 24 0.3349167 0.2700833 t.test(Inclinacao[meis==1]~Familia[meis==1]) Welch Two Sample t-test data: Inclinacao[meis == 1] by Familia[meis == 1] t = 0.4278, df = 17.553, p-value = 0.674 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.1215350 0.1835350 sample estimates: mean in group 11 mean in group 24 0.505 0.474 > t.test(Inclinacao[meis==2]~Familia[meis==2]) Welch Two Sample t-test data: Inclinacao[meis == 2] by Familia[meis == 2] t = 1.0119, df = 17.996, p-value = 0.325 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.08179697 0.23379697 sample estimates: mean in group 11 mean in group 24 0.347 0.271 > t.test(Inclinacao[meis==3]~Familia[meis==3]) Welch Two Sample t-test data: Inclinacao[meis == 3] by Familia[meis == 3] t = 1.021, df = 17.133, p-value = 0.3215 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.07349969 0.21149969 sample estimates: mean in group 11 mean in group 24 0.298 0.229 > t.test(Inclinacao[meis==4]~Familia[meis==4]) Welch Two Sample t-test data: Inclinacao[meis == 4] by Familia[meis == 4] t = 1.605, df = 17.661, p-value = 0.1262 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.02796802 0.20796802 sample estimates: mean in group 11 mean in group 24 0.301 0.211 > t.test(Inclinacao[meis==5]~Familia[meis==5]) Welch Two Sample t-test data: Inclinacao[meis == 5] by Familia[meis == 5] t = 0.6314, df = 17.51, p-value = 0.5359 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.09336618 0.17336618 sample estimates: mean in group 11 mean in group 24 0.327 0.287 t.test(Inclinacao[meis==6]~Familia[meis==6]) Welch Two Sample t-test data: Inclinacao[meis == 6] by Familia[meis == 6] t = 1.6165, df = 17.785, p-value = 0.1236 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.03188598 0.24388598 sample estimates: mean in group 11 mean in group 24 0.422 0.316 > t.test(Inclinacao[meis==7]~Familia[meis==7]) Welch Two Sample t-test data: Inclinacao[meis == 7] by Familia[meis == 7] t = 1.2701, df = 16.575, p-value = 0.2216 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.04252069 0.17052069 sample estimates: mean in group 11 mean in group 24 0.342 0.278 > t.test(Inclinacao[meis==8]~Familia[meis==8]) Welch Two Sample t-test data: Inclinacao[meis == 8] by Familia[meis == 8] t = 2.1657, df = 17.891, p-value = 0.04409 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.003334605 0.222665395 sample estimates: mean in group 11 mean in group 24 0.375 0.262 > t.test(Inclinacao[meis==9]~Familia[meis==9]) Welch Two Sample t-test data: Inclinacao[meis == 9] by Familia[meis == 9] t = 2.7336, df = 17.958, p-value = 0.01366 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.02729578 0.20870422 sample estimates: mean in group 11 mean in group 24 0.207 0.089 > t.test(Inclinacao[meis==10]~Familia[meis==10]) Welch Two Sample t-test data: Inclinacao[meis == 10] by Familia[meis == 10] t = 0.2025, df = 17.497, p-value = 0.8418 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.0939401 0.1139401 sample estimates: mean in group 11 mean in group 24 0.331 0.321 > t.test(Inclinacao[meis==11]~Familia[meis==11]) Welch Two Sample t-test data: Inclinacao[meis == 11] by Familia[meis == 11] t = 0.5754, df = 17.598, p-value = 0.5723 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.07972366 0.13972366 sample estimates: mean in group 11 mean in group 24 0.246 0.216 > t.test(Inclinacao[meis==12]~Familia[meis==12]) Welch Two Sample t-test data: Inclinacao[meis == 12] by Familia[meis == 12] t = 0.5083, df = 17.923, p-value = 0.6175 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.09717278 0.15917278 sample estimates: mean in group 11 mean in group 24 0.318 0.287 > t.test(Inclinacao~factor(Familia))
Joel, estou enviando o arquivo com os dados para determinar as correlações existentes entre as inclinações diárias e os dados meteorológicos do ano de 2007. Neste arquivo tem duas planilhas, uma somente com os dados do ano de 2007 e a outra com os dados de 2007 e algumas informações de dezembro de 2006 para determinar as correlações com os dados meteorológicos dos meses anteriores. Qualquer dúvida me escreva.
Experimento - Valdeci Constantino
Dados sobre crescimento de Pinus Taeda de acordo com diferentes tipos de tratamentos.
Plano Amostral para Estudo das Raízes
Este é um problema em que a determinação do plano amostral e do tamanho de amostra estão restritos aos custos monetários e, principalmente, operacionais ligados à coleta de dados. As variáveis sob as quais desejamos retirar informações são características das raízes finas (fine roots) e grossas (coarse roots) de Pinus Taeda plantadas na área experimental da empresa COMFLORESTA. A principal questão operacional vinculada a retirada das amostras é explicada pela dificuldade de locomoção na área com o "trator", equipamento que arranca a árvore do solo e a coloca em suspensão para que seja analisada a arquitetura da raiz grossa.
A importância no levantamento destas informações está no fato de que a absorção de nutrientes é feita pelas raízes finas e a sustentabilidade no crescimento está vinculada à raiz grossa. As características das raízes finas são expressas pelo peso e forma, enquanto a arquitetura da raiz grossa é mais dificil de ser definida ( ver Danjon e Reubens, 2008 ).
O que chamamos de amostragem aqui, na verdade é uma sub-amostragem feita em cima de árvores localizadas numa área experimental.
Planos amostrais sugeridos :
- Seleção de todas as árvores do primeiro bloco para análise de raízes finas e grossas.
- Seleção de duas árvores por parcela, em toda área do experimento, para análise de raízes finas e grossas.
Algumas Questões sobre o Experimento
- O padrão de mortes é aleatório no espaço ?
- As mortes estão relacionadas aos fatores ?
- Variáveis de raízes finas tem associação com variáveis de raízes grossas ?
Dissertação do Valdeci
Divisão da dissertação do Valdeci em capítulos.
Capítulo 1
O objetivo é verificar a influência dos fatores no desenvolvimento geral da árvore, caracterizado pelo diâmetro e altura.
- Variáveis resposta: Diâmetro, altura e volume, sendo volume uma função de diâmetro e altura.
- Fatores de variação: Responsável pelo plantio (E - Empresa , T - Terceirizado), Sistema de produção de mudas (tubete/55cm3 com 6 meses, tubete/55cm3 com 10 meses, tubete/126cm3 com 6 meses, raiz nua).
Os tratamentos foram aleatorizados em 4 blocos com o objetivo de controlar a variação espacial pois há um leve declive no terreno. No total foram criadas 32 parcelas para receber os 8 tratamentos resultante das possíveis combinações entre os fatores controlados no experimento( Resp.plantio e Sist.prod).
Metodologia Estatística
Será aplicado o modelo ANOVA para dois fatores em blocos inteiramente casualizados, adotando-se algum procedimento para controlar o número de mortos nas parcelas e seu efeito espacial nos resultados, caso este efeito exista. A hipótese existente para este efeito espacial é a de que parcelas com menor número de plantas oferecem mais espaço para o desenvolvimento da planta.
Uma primeira abordagem para minimizar o efeito da mortalidade é considerar o número de mortos na vizinhança (no máximo podem haver 8 mortos na vizinhança) como uma covariável (sugestão PJ). Devemos ter cuidado para declaração do modelo no R.
As análises de variância serão feitas para diâmetro, altura e volume de forma UNIVARIADA. Como volume é função de diâmetro e altura, devemos discutir se há necessidade realmente de repetir a análise para esta variável.
Definir alguns contrastes de interesse (Por exemplo: média dos tubetes x raiz nua)
Capítulo 2
Para o capítulo 2, serão analisadas as características das raízes finas. Para esta finalidade, foi selecionada uma árvore por parcela, totalizando 4 por tratamento. Foi selecionada a árvore no centro da parcela e, quando esta estava morta, selecionou-se a próxima na ordem de numeração crescente de acordo com o croqui do experimento.
- Variáveis resposta: peso em gramas da raízes finas medidas em 4 posições.
- Fatores de variação: Responsável pelo plantio (E - Empresa , T - Terceirizado), Sistema de produção de mudas (tubete/55cm3 com 6 meses, tubete/55cm3 com 10 meses, tubete/126cm3 com 6 meses, raiz nua).
Algumas hipóteses levantadas neste caso. Fatores ambientais podem levar a diferença entre os pesos das raízes finas nas diferentes posições(p1,p2,p3 e p4). Pode haver diferença nos pesos das raízes finas em função do sistema de produção pois espera-se que a raiz nua>tubete/126>tubete/55 10 meses > tubete 55 6 meses. Por hipótese, a raiz nua tem a tendência em ter melhor desenvolvimento pelas suas características de desenvolvimento no viveiro. Devemos verificar a interação entre a posição e os tratamentos (Será que existe ?????)
Matrizes de correlação para verificar se os pesos.
Definir alguns contrastes de interesse (Por exemplo: média dos tubetes x raiz nua)
Algumas dúvidas: (As observações nas posições são teoricamente correlacionadas espacialmente !!! Como superar isto ???)
Capítulo 3
No capítulo 3 foram amostradas, de maneira destrutiva, todas as árvores do primeiro bloco e cada ávore foi fotografada de 3 ângulos diferentes. Em cada ângulo, serão avaliadas as características da raiz grossa de acordo com escores pré-determinados. 64 árvores no total.
- A variável resposta é multivariada qualitativa ordinal. A princípio um vetor de dimensão 3 com os 3 escores para os ângulos fotografados.
- Fatores de variação: Responsável pelo plantio (E - Empresa , T - Terceirizado), Sistema de produção de mudas (tubete/55cm3 com 6 meses, tubete/55cm3 com 10 meses, tubete/126cm3 com 6 meses, raiz nua). Covariável : Número de mortos na vizinhança, posição do morto na vizinhança ,
Verificar junto ao Cesar Taconeli a possibilidade de aplicar árvores de classificação multivariadas com o objetivo de identificar quais fatores levam aos escores atribuídos as raízes. Com esta metodologia, talvez consigamos encontrar a conjunção dos fatores que levem ao melhor arquitetura de raiz grossa.
Uma possibilidade (mais pobre) é aplicar testes não paramétricos para a nota em cada ângulo fotografado.
Neste capítulo, a primeira abordagem estatística consiste de utilizar uma técnica não paramétrica para encontrar alguma evidência de diferença entre os métodos e entre as empresas na constituição da raiz grossa. A justificativa para utilizar técnicas não-paramétricas é a característica da variável resposta que é qualitativa.
# Leitura dos dados avalia<-read.csv2('http://www.leg.ufpr.br/~joel/dados/grossaclassif.csv') # Resumo das variaveis summary(avalia) # Attachando os dados attach(avalia) # Nomes das variaveis names(avalia) # Carrega pacote para comparacoes multiplas nao parametricas require(pgirmess) # O gráfico de interacao é fundamental pois vai ser um instrumento para verificar # a sua possivel existencia interaction.plot(metodo,plantio,soma) interaction.plot(plantio,metodo,soma) # Alguns graficos exploratorios para entender melhor as interacoes boxplot(soma[plantio=="empresa"]~metodo[plantio=="empresa"]) boxplot(soma[plantio=="terceiro"]~metodo[plantio=="terceiro"]) boxplot(soma[metodo=="M1"]~plantio[metodo=="M1"]) boxplot(soma[metodo=="M2"]~plantio[metodo=="M2"]) boxplot(soma[metodo=="M3"]~plantio[metodo=="M3"]) boxplot(soma[metodo=="M4"]~plantio[metodo=="M4"]) # Testes para verificar diferenças nos plantios dentro dos métodos # Observação : como são dois niveis de plantio, o teste U de Mann-Whitney é um caso # particular do kruskall-wallis e , portanto, não precisa fazer comparação multipla aqui # Nomes dos metodos m<-levels(metodo) # loop que troca de metodos e testa diferencas entre os plantios for (i in 1:4) { s<-soma[metodo==m[i]] p<-plantio[metodo==m[i]] print(paste("metodo",m[i])) print(kruskal.test(s~p)) } # aqui vamos trocar de plantios e verificar as diferenças entre os métodos n<-levels(plantio) # loop que troca de plantios e testa as diferenças entre os métodos...aqui # já aproveito o embalo e faço as comparações multiplas com nível de significância # de 10% for (i in 1:2) { s<-soma[plantio==n[i]] p<-metodo[plantio==n[i]] print(paste("plantio",n[i])) print(kruskal.test(s~p)) print(kruskalmc(s,p,prob=0.1)) }
To Do List
- Criar e preencher as planilhas para os Capítulos 1 e 2 (Valdeci)
Artigos de Interesse
Artigo sobre Modelos Lineares Generalizados Mistos
Artigo sobre Comparação Múltipla Não-paramétrica
Avaliação de Comparações Múltiplas
Análise de Sobrevivência Aplicada à Germinação
Sobre a Arquitetura de Raízes de Árvores
Características Morfológicas de Raízes de Pinus Taeda
Links de Interesse
Funções do R
Referências Bibliográficas
- [1992, book]
- Cox, D. R. (1992). Planning of Experiments Wiley-Interscience.
- [1998, book]
- Johnson, R. A., & Wichern, D. W. (1998). Applied Multivariate Statistical Analysis Prentice Hall.
- [2001, book]
- Montgomery, C. D. (2001). Design and Analysis of Experiments John Wiley & Sons.