摘要:La Lingüística, siendo el estudio científico del lenguaje humano, intenta describirlo y explicarlo. Sin embargo, es difícil demostrar la certeza de cualquier teoría lingüística por la naturaleza versátil del lenguaje como una convención humana y también por la imposibilidad de investigar todo lo que se habla y se escribe en la vida real. A pesar de estos problemas, las técnicas y los modelos computacionales pueden proporcionar la evidencia para que las teorías lingüísticas sean comprobadas o refutadas. A través de un estudio de caso, realizamos una serie de experimentos por computador en un corpus de colocaciones de verbo-sustantivo en español usando métodos de aprendizaje de máquina, con el fin de comprobar el hecho lingüístico de que las colocaciones del idioma no conforman un grupo sin estructura sino que son unidades lingüísticas relacionadas por medio de lo que denominamos isomorfismo de colocaciones, representado por las funciones léxicas de la Teoría Significado-Texto. Nuestros experimentos nos permiten verificar esa declaración lingüística. Asimismo, los experimentos sugieren que las consideraciones semánticas son más importantes en la definición de colocaciones que las estadísticas.
其他摘要:Linguistics as a scientific study of human language intends to describe and explain it. However, validity of a linguistic theory is difficult to prove due to volatile nature of language as a human convention and impossibility to cover all real-life linguistic data. In spite of these problems, computational techniques and modeling can provide evidence to verify or falsify linguistic theories. As a case study, we conducted a series of computer experiments on a corpus of Spanish verb-noun collocations using machine learning methods, in order to test a linguistic point that collocations in the language do not form an unstructured collection but are language items related via what we call collocational isomorphism, represented by lexical functions of the Meaning-Text Theory. Our experiments allowed us to verify this linguistic statement. Moreover, they suggested that semantic considerations are more important in the definition of the notion of collocation than statistical ones.
关键词:Collocations; lexical functions; machine learningColocaciones; funciones léxicas; aprendizaje de máquina