===== Modelos Estruturados por Árvores ===== === Participantes === * [[pessoais:joel|joel]] *[[pessoais:rmoreira|Rodrigo Moreira]] *[[pessoais:camila|Camila Epprechet]] *[[pessoais:taconeli|César Taconeli]] *[[pessoais:paulojus|Paulo Justiniano]] *[[pessoais:alvaro|Alvaro Veiga]] == palavras chaves == árvores de decisão, regressão com transição suave, teste do tipo multiplicadores de Lagrange. ===== Introdução ===== As Árvores de Classificação e Regressão compõem um conjunto de métodos de particionamento recursivo que geram regras de decisão para problemas de classificação e regressão que podem ser facilmente interpretadas. Algoritmos como o CHAID, CART, QUEST e C4.5, dentre outros, popularizaram estes métodos em várias comunidades científicas. O grande poder preditivo destes métodos foi comprovado nas tradicionais competições KDD nas quais diversas metodologias exploratórias de dados concorrem para extração de conhecimento em diferentes bases. Mais recentemente, métodos de boosting e bagging potencializaram ainda mais o uso destes métodos. ==== Artigos ==== * {{projetos:modeltree:treedglm.pdf|Bayesian Generalized Tree Models}} * {{:projetos:modeltrees:modeltreesrainfall.pdf|Model Trees for Rainfall-runoff modelling}} * {{projetos:modeltree:darosa_veiga_medeiros_revised.pdf|Tree Structured Smooth Transition Regression}} * {{projetos:modeltree:cartspace.pdf|CART aplicado a Dados Espaciais com uso de GLM}} * {{projetos:modeltree:a-comparison-of-logistic.pdf|Comparação Regressão Logística x Árvore de Decisão}} * {{projetos:modeltree:cart_area_medica.pdf|Aplicação do CART na Área Médica}} ==== Trabalhos Acadêmicos ==== {{:projetos:modeltrees:tese_bernardo_v10.doc|Dissertação de Mestrado de Bernardo Spindel}} {{:projetos:modeltrees:tesecesartaconeli.pdf|Tese de Doutorado de César Taconeli}} {{:pessoais:dissertacao_rm.pdf|Dissertação de Mestrado de Rodrigo Moreira}} ==== Recursos Computacionais ==== {{projetos:modeltrees:treestar1.zip|Star-Tree}} require(rpart) z.auto <- rpart(Mileage ~ Weight, car.test.frame) post(z.auto, file = "") # display tree on active device # now construct postscript version on file "pretty.ps" # with no title post(z.auto, file = "pretty.ps", title = " ") z.hp <- rpart(Mileage ~ Weight + HP, car.test.frame) post(z.hp) ==== Conjuntos de Dados ==== === Classificação de solos segundo atributos químicos === {{:projetos:modeltrees:guilhermecluster.rnw|Analise de Cluster + Arvores de Classificação - Guilherme Brenner}} {{:projetos:modeltrees:quimicos_c1.txt|Atributos Químicos de Solos}} {{:projetos:modeltrees:quimicos_c2.txt|Atributos Químicos de Solos}} === Identificação de Fatores de Risco para Hipertensão=== dados<-read.csv2('http://www.leg.ufpr.br/~joel/dados/hiipertensao.csv',na.strings="") {{projetos:dados_hipertenso.txt|Banco de Dados - Hipertensão}} {{pessoais:tinetoon:nomesvariaveis.xls|Nome das Variáveis - Hipertensão}} ==== Links de Interesse ==== [[http://www.statmethods.net/advstats/cart.html|Tree-Based Models Quick-R]] ==== To do list ==== * Translate matlab code to R code * {{projetos:modeltrees:09_non-linear_regression.pdf|Self Starter functions to give initial values}} * Use STR as inputs to Random Forests (Regression Problems) * Bagging STR ==== Referências Bibliográficas ==== @Book{ripley:1996, author = {Ripley, B.D.}, title = {Pattern Recognition and Neural Networks}, publisher = {Cambridge University Press}, address = {Cambridge}, year = {1996}, }