首页    期刊浏览 2024年12月14日 星期六
登录注册

文章基本信息

  • 标题:Extraction de lexiques bilingues à partir de corpus comparables spécialisés : étude du contexte lexical
  • 本地全文:下载
  • 作者:Amir Hazem ; Emmanuel Morin
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2014
  • 卷号:55
  • 期号:1
  • 页码:1-25
  • 语种:French
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Ce travail s’intéresse à la notion de contexte lexical qui est au cœur de l’approche fondatrice en extraction de lexiques bilingues à partir de corpus comparables spécialisés. D’une part, nous revenons sur les deux principales stratégies, dédiées à la caractérisation du contexte lexical, qui reposent sur l’exploitation de représentations graphique ou syntaxique. Nous montrons que l’exploitation conjointe de ces deux représentations a un intérêt particulier pour la tâche de construction de lexiques bilingues. D’autre part, nous abordons la difficulté de disposer d’observations significatives du contexte des mots en corpus comparables spécialisés. Pour répondre à cette difficulté, nous proposons de mettre en œuvre des stratégies de réestimation des observations de cooccurrences de mots par méthode de lissage ou par prédiction. Les différentes contributions associées à ce travail engendrent une amélioration significative de la qualité des lexiques extraits.
国家哲学社会科学文献中心版权所有