首页    期刊浏览 2025年01月24日 星期五
登录注册

文章基本信息

  • 标题:Modelagem Semântica de Dados Abertos: A Viabilidade de Aplicação de Word Embeddings sobre o Currículo Lattes
  • 本地全文:下载
  • 作者:Felipe de Paula Oliveira ; Thiago Magela Rodrigues Dias ; Adilson Luiz Pinto
  • 期刊名称:Ciência da Informação
  • 印刷版ISSN:0100-1965
  • 电子版ISSN:1518-8353
  • 出版年度:2019
  • 卷号:48
  • 期号:3
  • 页码:495-496
  • 摘要:Os currículos cadastrados na Plataforma Lattes do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico), são importantes fontes de dados abertos que possibilitam obter informações sobre formação acadêmica, produção científica, projetos de pesquisa e atuação profissional de um conjunto de indivíduos. O que possibilita a realização de diversos tipos de análises bibliométricas, podendo ser aplicados tanto métodos ou modelos tradicionais, quanto alternativos para a avaliação da ciência. O estudo apresentado, trata de afirmar sobre a viabilidade de aplicação de PLN (Processamento de Linguagem Natural) para a avaliação de similaridade semântica sobre os dados cadastrados no currículo Lattes. Para a realização de análises utilizou-se uma amostra de curículos referentes a doutores e realizado o tratamento em um corpus textual, para a representação semântica vetorial, foi aplicada a ferramenta Word2Vec, sendo possível a realização de inferência dos termos. Como resultados foram apresentados índices de similaridade calculados pelo modelo em palavras contidas em títulos de publicações.
  • 关键词:Plataforma Lattes;Processamento de Linguagem Natural;Similaridade Semântica.
国家哲学社会科学文献中心版权所有