首页    期刊浏览 2024年12月14日 星期六
登录注册

文章基本信息

  • 标题:Transcription automatique et segmentation thématique de livres d’heures manuscrits
  • 本地全文:下载
  • 作者:Béatrice Daille ; Amir Hazem ; Christopher Kermorvant
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2019
  • 卷号:60
  • 期号:3
  • 页码:1-24
  • 语种:French
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Les livres d’heures sont le plus grand best-seller de tout le Moyen Âge, avec plus de 10 000 témoins conservés. Incontournables pour comprendre l’univers mental médiéval, leurs textes ont été très peu étudiés. Ils sont très longs et ont une structure complexe correspondant à l’organisation liturgique médiévale et la prière quotidienne de l’office. Cet article décrit les méthodes et les traitements automatiques mis en oeuvre sur les livres d’heures : la reconnaissance de l’écriture manuscrite et la segmentation adaptées à ces manuscrits. L’approche de segmentation semi-supervisée proposée tire profit de la constitution spécifique du manuscrit pour mieux retrouver leur structure malgré le bruit engendré par la reconnaissance de l’écriture.
  • 其他摘要:Books of Hours are the number one best seller of the Middle Ages, with more than 10 000 copies preserved. They are a crucial witness to the medieval mindset, but their textual contents have been very scarcely studied. They are very long and offer a complex hierarchical entangled structure, with several characteristics specific to medieval daily Prières office. This paper presents the methods and processing applied to books of hours: handwritten text recognition and text segmentation adapted to medieval manuscripts. We propose a weak supervised approach, based on the overarching structure of the manuscripts, that provides the first stateof- the-art results on transcript texts and despite remaining errors for this new challenging task.
国家哲学社会科学文献中心版权所有