首页    期刊浏览 2025年03月03日 星期一
登录注册

文章基本信息

  • 标题:異なる学問分野のコーパスを利用した専門用語抽出手法の提案
  • 本地全文:下载
  • 作者:久保 順子 ; 辻 慶太 ; 杉本 重雄
  • 期刊名称:情報知識学会誌
  • 印刷版ISSN:0917-1436
  • 电子版ISSN:1881-7661
  • 出版年度:2010
  • 卷号:20
  • 期号:1
  • 页码:15-31
  • DOI:10.2964/jsik.19-320
  • 出版社:Japan Society of Information and Knowledge
  • 摘要:

    コンピュータを使用した専門用語自動抽出は,従来,対象とする専門分野のテキストコーパスのみをデータとして行っているものが多かった.しかし,専門用語の特徴として,対象分野のコーパスに頻出し,対象分野以外の他分野コーパスにはあまり多く出現しない点が挙げられる.そこで本研究では,対象分野コーパスと他分野コーパスとの用語の出現率の差を考慮した手法を提案する.実験では,女性学のテキストを対象分野のコーパスとして使用し,他分野のコーパスとして39分野のテキストを使用した.実験の結果,従来の代表的手法よりもかなり高い精度で用語が抽出できることが明らかとなった.また39分野のテキストから任意のテキストを選び他分野コーパスとして用いてコーパスの規模を縮小できるか実験を行った.その結果,対象分野と類似した分野のテキストを用いることで,39分野すべてのテキストを用いた場合の抽出精度・再現率に近づけることができた.

  • 关键词:専門用語; 専門用語自動抽出; 頻度; コーパス; 女性学
国家哲学社会科学文献中心版权所有