Essa é uma revisão anterior do documento!
Tabela de conteúdos
Modelos Estruturados por Árvores
Participantes
palavras chaves
árvores de decisão, regressão com transição suave, teste do tipo multiplicadores de Lagrange.
Introdução
As Árvores de Classificação e Regressão compõem um conjunto de métodos de particionamento recursivo que geram regras de decisão para problemas de classificação e regressão que podem ser facilmente interpretadas. Algoritmos como o CHAID, CART, QUEST e C4.5 popularizaram estes métodos em várias comunidades científicas.
Os modelos estruturados por árvores, também conhecidos como árvores de decisão, podem ser vistos como métodos não paramétricos de regressão. O princípio destes modelos é o particionamento recursivo do espaço das variáveis e o ajuste de modelos simples em cada partição.
Devido a fácil interpretação gerada por este modelo seu uso tornou-se comum em diferentes áreas como: medicina diagnóstica, escoragem de crédito e classificação de populações.
Quando a variável resposta é uma classe, estes modelos são denominados árvores de classificação e quando ela é contínua, são chamados árvores de regressão.
Muitos algoritmos foram desenvolvidos para realizar o particionamento recursivo, dentre eles: CHAID, CART, QUEST, C4.5,…
Uma das desvantagens destes algoritmos é a instabilidade do modelo final. Pequenas mudanças na base de dados pode gerar diferentes modelos. Por este motivo, são adotadas saídas como Bagging e Boosting para problemas que a finalidade é preditiva.
Artigos
Programas
Links de Interesse
To do list
- Translate matlab code to R code
- Use STR as inputs to Random Forests (Regression Problems)
- Bagging STR
Referências Bibliográficas
- [1996, book]
- Ripley, B. D. (1996). Pattern Recognition and Neural Networks. Cambridge: Cambridge University Press.