Análise de dados categorizados multivariados e dados composicionais via árvores de classificação e regressão multivariadas
Prof. Cesar Taconeli
Árvores de classificação e regressão (Classification And Regression Trees – CART) constituem uma poderosa ferramenta preditiva e exploratória, aplicando-se à análise de diferentes tipos de dados. Em sua abordagem multivariada, árvores de classificação e regressão permitem avaliar as relações entre um conjunto de variáveis explicativas e um conjunto de variáveis aleatórias, empregando-se, por exemplo, como alternativa a outras técnicas multivariadas, como regressão multivariada e análise de correlação canõnica, e na análise de dados longitudinais. Como atrativos, ressaltam-se a ausência de pressuposições paramétricas, possibilidade de analisar dados com estruturas complexas e produção de resultados facilmente interpretáveis. Nesse seminário serão apresentadas alternativas para a utilização de CART na análise de dados categorizados multivariados e dados composicionais. Como ilustrações, serão discutidas aplicações na análise de dados de um levantamento sobre consumo de álcool e drogas, realizado no município de Botucatu (SP), e num estudo acerca das propriedades físicas do solo para fins de manejo e irrigação, realizado na ESALQ (Piracicaba-SP).