摘要:El tesoro más valioso de la raza humana es el conocimiento. Gran parte de este conocimiento existe en forma de lenguaje natural: libros, periódicos, artículos, etcétera. La posesión real de todo este conocimiento depende de nuestra habilidad para realizar ciertas operaciones con la información, por ejemplo: buscarla, compararla, y resumirla. La minería de texto, una nueva área de investigación definida como descubrimiento de conocimiento en colecciones de textos, se enfoca en el análisis de grandes conjuntos de documentos. En particular, considera el descubrimiento de patrones interesantes, tales como grupos, asociaciones y desviaciones, en colecciones de textos. Los métodos actuales de minería de texto se caracte-rizan por usar representaciones sencillas del contenido de los documentos, por ejemplo, bolsas o vectores de palabras. Por una parte estas representaciones son fáciles de obtener y analizar, pero por otra parte restringen los patrones descubiertos a un nivel temático. Con el propósito de obtener resultados más útiles y significativos deben usarse representaciones más completas de la información. Basándonos en esta suposición se propuso un nuevo método para realizar minería de texto a nivel detalle. Este método usa los grafos conceptuales como representación del contenido de los textos, y obtiene algu-nos patrones descriptivos de los documentos aplicando varios tipos de operaciones sobre estos grafos.
其他摘要:Knowledge is the most valuable treasure of humankind. Most of this knowledge exists in natural language format, for instance, in books, journals, reports, etc. The real possession of all this knowledge depends on our capabilities to perform different tasks with texts, such as: searching for interesting texts, comparing different documents, and summarizing them.Text mining, an emerging research area that can be roughly characterized as knowledge discovery in large text co-llections, is focused on automatically analyzing a set of texts. Mainly, it is concerned with the discovery of interesting patterns such as clusters, associations, and deviations from large text collections. Current methods of text mining tend to use simplistic and shallow representations of texts, e.g., keyword sets or keyword frequency vectors. On one hand, such representations are easy to obtain from texts and easy to analyze, but on the other hand, however, they restrict the know-ledge discovery results to the topic level. To obtain more useful and meaningful results, richer text representations are ne-cessary. On the basis of this assumption, we propose a new method for doing text mining at detail level. This method uses conceptual graphs for representing text content and relies on performing some tasks on these graphs, allowing the disco-very of more descriptive patterns.
关键词:Text Mining; Conceptual Graphs; Conceptual Clustering; Knowledge Discovery Minería de Texto; Grafos Conceptuales; Agrupamiento Conceptual; Descubrimiento de Conocimiento