摘要:14.00 800x600 Normal 0 21 false false false PT-BR X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Tabela normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Times New Roman","serif";} O presente artigo pretende demonstrar a criação de corpora técnicos bilíngües (português e inglês), com a finalidade de alimentar um banco de dados de caráter terminográfico. Para tanto, foram construídos dois corpora, bilíngües nas áreas de Informática e Lingüística, retirados da Internet, com aproximadamente um milhão de palavras cada um. Os corpora resultantes foram usados para levantamento de candidatos a termos nas duas áreas citadas (através do uso do software WordSmith Tools) e forneceram dados para a construção da microestrutura de verbetes técnicos, através de exemplos reais de uso de língua e dados morfo- sintático- semânticos.
关键词:Linguística de Corpus;Banco de Dados Terminográfico;Informática;Linguística;WordSmith Tools