摘要:Neste trabalho, discute-se a importante relação entre o sistema de anotação sintática e o processamento automático, mais especificamente, a análise automática, no contexto da criação de "bancos de árvores" ou treebanks. Um experimento é conduzido para comparar a performance do parseador sobre duas versões do sistema de anotação utilizado no Corpus Tycho Brahe. Os resultados demonstram que um sistema de anotação mais conciso e informativo favorece a performance. Como conclusão, são sugeridos dois princípios norteadores para especificação do sistema de anotação e treinamento do parseador. Por fim, a discussão é contextualizada a partir de uma visão geral do processo de construção de um treebank e de sua importância na pesquisa linguística.
关键词:Linguística de corpus;Corpora anotados;Processamento automático