首页    期刊浏览 2024年12月02日 星期一
登录注册

文章基本信息

  • 标题:Fouille de données séquentielles pour l’extraction d’information dans les textes
  • 本地全文:下载
  • 作者:Thierry Charnois ; Marc Plantevit ; Christophe Rigotti
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2009
  • 卷号:50
  • 期号:3
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Cet article montre l’intérêt d’utiliser les motifs issus des méthodes de fouille de données dans le domaine du TAL appliqué à la biologie médicale et génétique, et plus particulièrement dans les tâches d’extraction d’information. Nous proposons une approche pour apprendre les patrons linguistiques par une méthode de fouille de données fondée sur les motifs séquentiels et sur une fouille dite récursive des motifs eux-mêmes. Une originalité de notre approche est de s’affranchir de l’analyse syntaxique tout en permettant de produire des résultats symboliques, intelligibles pour l’utilisateur, a contrario des méthodes numériques qui restent difficilement interprétables. Elle ne nécessite pas de ressources linguistiques autres que le corpus d’apprentissage. Pour la reconnaissance d’entités biologiques nommées, nous proposons une méthode fondée sur un nouveau type de motifs intégrant une séquence et son contexte.
国家哲学社会科学文献中心版权所有