摘要:Neste trabalho apresento a metodologia adotada para a elaboração de uma base de dados bilíngue (português brasileiro francês) que reúne formas lexicogramaticais prototípicas do gênero artigo científico. Com base na exploração de corpora comparáveis de artigos de Linguística, Economia e Engenharia e Conservação de Bens Materiais, levantamos combinatórias lexicais que remetem ao fazer científico ou à articulação textual, aqui ilustradas apenas em português. Esse levantamento é seguido por uma análise sintático-semântica que nos permite, além de identificar esquemas colocacionais, associar as unidades a funções retóricas, considerando seu funcionamento textual. Essas nos informam, finalmente, sobre a epistemologia dos discursos científicos em análise.