首页    期刊浏览 2024年12月05日 星期四
登录注册

文章基本信息

  • 标题:MDLText e Indexação Semântica aplicados na Detecção de Spam nos Comentários do YouTube
  • 本地全文:下载
  • 作者:Renato Moraes Silva ; Túlio C. Alberto ; Tiago A. Almeida
  • 期刊名称:iSys - Revista Brasileira de Sistemas de Informação
  • 印刷版ISSN:1984-2902
  • 出版年度:2017
  • 卷号:10
  • 期号:3
  • 页码:49-73
  • 语种:Portuguese
  • 出版社:iSys - Revista Brasileira de Sistemas de Informação
  • 摘要:Muitos usuários do YouTube produzem conteúdo regularmente e fazem desta tarefa seu principal meio de vida. Contudo, esse sucesso vem despertando a atenção de usuários mal-intencionados, que propagam comentários indesejados para se autopromoverem ou para disseminar links maliciosos. Neste cenário, métodos tradicionais de categorização de texto podem sofrer limitações devido às características inerentes ao problema: (1) os comentários costumam ser curtos e mal redigidos e (2) o problema de classificação é naturalmente online. Este artigo avalia um método de classificação baseado no princípio da descrição mais simples e compara os resultados com os de métodos tradicionais de aprendizado online. Também é proposta uma técnica ensemble, que combina os métodos de classificação com diferentes técnicas de processamento de linguagem natural. Os experimentos foram cuidadosamente realizados e a análise estatística dos resultados indica que a técnica proposta obteve desempenho superior ao obtido quando apenas os comentários originais foram empregados.
  • 关键词:aprendizado de máquina;categorização de texto;princípio da descrição mais simples;YouTube
国家哲学社会科学文献中心版权所有