期刊名称:iSys - Revista Brasileira de Sistemas de Informação
印刷版ISSN:1984-2902
出版年度:2014
卷号:7
期号:2
页码:25-47
语种:Portuguese
出版社:iSys - Revista Brasileira de Sistemas de Informação
摘要:Em aprendizado supervisionado, é comum a ocorrência de bases de dados contendo atributos irrelevantes. Sob tais circunstâncias, a adoção de critérios de seleção de características relevantes para a classificação é fundamental, principalmente nos problemas em que os custos de coleta de dados são proporcionais à quantidade de atributos. Neste artigo, são apresentados dois critérios de seleção de atributos voltados para Random Forests, denominados Fator de Incidência (FI) e Fator de Profundidade (FP), e é apresentada também uma análise empírica detalhada comparando o desempenho desses critérios com a Importância Baseada no Erro (IE) e a Importância de Gini (IG) - os dois principais critérios para Random Forests atualmente em uso. Os resultados indicam que o critério FP é um critério robusto, com desempenho superior aos critérios IE e IG.
关键词:Ciências Exatas e da Terra; Ciência da Computação; Sistemas de Informação