文章基本信息

标题：Extraction de lexiques bilingues à partir de corpus comparables spécialisés : étude du contexte lexical
本地全文：下载
作者：Amir Hazem ; Emmanuel Morin
期刊名称：Traitement Automatique des Langues
印刷版ISSN：1248-9433
电子版ISSN：1965-0906
出版年度：2014
卷号：55
期号：1
页码：1-25
语种：French
出版社：ATALA - Assoc Traitement Automatique Langues
摘要：Ce travail s’intéresse à la notion de contexte lexical qui est au cœur de l’approche fondatrice en extraction de lexiques bilingues à partir de corpus comparables spécialisés. D’une part, nous revenons sur les deux principales stratégies, dédiées à la caractérisation du contexte lexical, qui reposent sur l’exploitation de représentations graphique ou syntaxique. Nous montrons que l’exploitation conjointe de ces deux représentations a un intérêt particulier pour la tâche de construction de lexiques bilingues. D’autre part, nous abordons la difficulté de disposer d’observations significatives du contexte des mots en corpus comparables spécialisés. Pour répondre à cette difficulté, nous proposons de mettre en œuvre des stratégies de réestimation des observations de cooccurrences de mots par méthode de lissage ou par prédiction. Les différentes contributions associées à ce travail engendrent une amélioration significative de la qualité des lexiques extraits.