Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
projetos:modeltrees [2008/08/15 13:17]
joel
projetos:modeltrees [2008/11/07 19:24] (atual)
joel
Linha 7: Linha 7:
  
   *[[pessoais:​camila|Camila Epprechet]]   *[[pessoais:​camila|Camila Epprechet]]
 +  ​
 +  *[[pessoais:​taconeli|César Taconeli]]
 +  ​
 +  *[[pessoais:​paulojus|Paulo Justiniano]]
  
   *[[pessoais:​alvaro|Alvaro Veiga]]   *[[pessoais:​alvaro|Alvaro Veiga]]
Linha 21: Linha 25:
 ===== Introdução ===== ===== Introdução =====
  
-As Árvores de Classificação e Regressão compõem um conjunto de métodos de particionamento recursivo que geram regras de decisão para problemas de classificação e regressão que podem ser facilmente interpretadas. Algoritmos como o CHAID, CART, QUEST e C4.5 popularizaram estes métodos em várias comunidades científicas.+As Árvores de Classificação e Regressão compõem um conjunto de métodos de particionamento recursivo que geram regras de decisão para problemas de classificação e regressão que podem ser facilmente interpretadas. Algoritmos como o CHAID, CART, QUEST e C4.5, dentre outros, ​popularizaram estes métodos em várias comunidades científicas.
  
 +O grande poder preditivo destes métodos foi comprovado nas tradicionais competições KDD nas quais diversas metodologias exploratórias de dados concorrem para extração de conhecimento em diferentes bases. Mais recentemente,​ métodos de boosting e bagging potencializaram ainda mais o uso destes métodos.
  
-Os modelos estruturados por árvores, também conhecidos como árvores de decisão, podem ser vistos como métodos não paramétricos ​ de regressão. O princípio destes modelos é o particionamento recursivo do espaço das variáveis e o ajuste de modelos simples em cada partição. ​ 
- 
-Devido a fácil interpretação gerada por este modelo seu uso tornou-se comum em diferentes áreas como: medicina diagnóstica,​ escoragem ​ de crédito e classificação de populações. 
- 
-Quando a variável resposta é uma classe, estes modelos são denominados árvores de classificação e quando ela é contínua, são chamados árvores de regressão. 
- 
-Muitos algoritmos foram desenvolvidos para realizar o particionamento recursivo, dentre eles: CHAID, CART, QUEST, C4.5,... 
- 
-Uma das desvantagens destes algoritmos é a instabilidade do modelo final. Pequenas mudanças na base de dados pode gerar diferentes modelos. Por este motivo, são adotadas saídas como Bagging e Boosting para problemas que a finalidade é preditiva. 
  
 ==== Artigos ==== ==== Artigos ====
Linha 43: Linha 39:
    * {{projetos:​modeltree:​a-comparison-of-logistic.pdf|Comparação Regressão Logística x Árvore de Decisão}}    * {{projetos:​modeltree:​a-comparison-of-logistic.pdf|Comparação Regressão Logística x Árvore de Decisão}}
    * {{projetos:​modeltree:​cart_area_medica.pdf|Aplicação do CART na Área Médica}}    * {{projetos:​modeltree:​cart_area_medica.pdf|Aplicação do CART na Área Médica}}
 +==== Trabalhos Acadêmicos ====
  
-==== Programas ​====+ 
 +{{:​projetos:​modeltrees:​tese_bernardo_v10.doc|Dissertação de Mestrado de Bernardo Spindel}} 
 + 
 +{{:​projetos:​modeltrees:​tesecesartaconeli.pdf|Tese de Doutorado de César Taconeli}} 
 + 
 +{{:​pessoais:​dissertacao_rm.pdf|Dissertação de Mestrado de Rodrigo Moreira}} 
 + 
 +==== Recursos Computacionais ​====
 {{projetos:​modeltrees:​treestar1.zip|Star-Tree}} {{projetos:​modeltrees:​treestar1.zip|Star-Tree}}
 +
 +<​code>​
 +require(rpart)
 +z.auto <- rpart(Mileage ~ Weight, car.test.frame)
 +post(z.auto,​ file = ""​) ​  # display tree on active device
 +   # now construct postscript version on file "​pretty.ps"​
 +   # with no title
 +post(z.auto,​ file = "​pretty.ps",​ title = " ")
 +z.hp <- rpart(Mileage ~ Weight + HP, car.test.frame)
 +post(z.hp)
 +</​code>​
 +==== Conjuntos de Dados ====
 +
 +=== Classificação de solos segundo atributos químicos ===
 +{{:​projetos:​modeltrees:​guilhermecluster.rnw|Analise de Cluster + Arvores de Classificação - Guilherme Brenner}}
 +{{:​projetos:​modeltrees:​quimicos_c1.txt|Atributos Químicos de Solos}}
 +{{:​projetos:​modeltrees:​quimicos_c2.txt|Atributos Químicos de Solos}}
 + 
 +=== Identificação de Fatores de Risco para Hipertensão===
 +
 +<​code>​
 +dados<​-read.csv2('​http://​www.leg.ufpr.br/​~joel/​dados/​hiipertensao.csv',​na.strings=""​)
 +</​code>​
 +
 +{{projetos:​dados_hipertenso.txt|Banco de Dados - Hipertensão}}
 +
 +{{pessoais:​tinetoon:​nomesvariaveis.xls|Nome das Variáveis - Hipertensão}}
  
 ==== Links de Interesse ==== ==== Links de Interesse ====
Linha 69: Linha 100:
 } }
 </​bibtex>​ </​bibtex>​
- 

QR Code
QR Code projetos:modeltrees (generated for current page)