期刊名称:Revista Cubana de Información en Ciencias de la Salud
电子版ISSN:2307-2113
出版年度:2018
卷号:29
期号:1
页码:1-19
DOI:10.36512/rcics.v29i1.1184
出版社:Editorial Ciencias Médicas
摘要:Por la diversidad de formas en la entrada de los campos de autor-afiliación, la normalización de los datos bibliográficos es uno de los problemas que limitan los análisis de información métrica en tiempo de ejecución, fiabilidad de los indicadores y tamaño del corpus de datos. Este trabajo tiene como objetivo proponer los requerimientos para el mejoramiento de la normalización de datos en software de análisis métricos. Para lograr el objetivo se realizó un diagnóstico de los principales métodos y técnicas que son empleados a nivel mundial en este tipo de estudio. Como resultado principal, se relacionan los requerimientos para una aplicación de preprocesamiento automatizado de datos con fines métricos. Se proponen la base de datos, las tareas, los pasos y los algoritmos que contendrá esa aplicación. Se debe usar una combinación de algoritmos para desambiguar los campos afiliación y autor.
关键词:procesamiento de datos; minería de datos; bibliometría;
descubrimiento basado en la literatura; análisis de datos.