首页    期刊浏览 2025年02月02日 星期日
登录注册

文章基本信息

  • 标题:De la constitution d’un corpus arboré à l’analyse syntaxique du serbe
  • 本地全文:下载
  • 作者:Aleksandra Miletic ; Cécile Fabre ; Dejan Stosic
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2018
  • 卷号:59
  • 期号:3
  • 页码:1-25
  • 语种:French
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Cet article retrace une expérience de constitution d’un corpus arboré pour le serbe, conçu dans le but de doter cette langue des instruments nécessaires à l’analyse syntaxique et, plus généralement, de favoriser des recherches plus systématiques aussi bien en TAL (traitement automatique des langues) qu’en linguistique serbe. Au-delà de la description des résultats de ce projet, nous présentons une méthode de confection d’un corpus arboré qui vise à optimiser les ressources, par définition rares, dont on dispose dans le cas d’une langue peu dotée, qu’il s’agisse de moyens matériels (corpus et outils) ou humains. Nous montrons comment tirer au mieux parti de l’existant pour faciliter le travail des annotateurs humains et accélérer l’enri- chissement du corpus, tout en garantissant la validité de l’annotation produite. Cette méthode, basée sur des principes transposables à d’autres langues, a vocation à faciliter la création des corpus arborés pour les langues sous-dotées en général.
国家哲学社会科学文献中心版权所有