摘要:A l’heure où de plus en plus de corpus et de données sont accessibles, le travail initié s’interroge sur l’exploitation de données linguistiques dans un corpus d’oral à dimension sociolinguistique avec l’objectif d’en extraire automatiquement du contenu subjectif. A partir de l’exploitation du corpus ESLO (Enquête Sociolinguistique à Orléans), l’objectif est de modéliser, détecter et visualiser la perception qu’ont les locuteurs de la ville d’Orléans grâce à une approche pluridisciplinaire. Cet article présente la chaîne de traitement développée pour atteindre cet objectif. A partir d’une première étape de détection des noms de lieux dans le corpus, une analyse de la polarité est réalisée. Les informations extraites sont projetées sous la forme d’une carte afin de matérialiser la perception des habitants de leur environnement.
其他摘要:At a time when anincreasing number of corpora and data are accessible, the research done inthis article aims the exploitation of linguistic data in an oral corpus with asociolinguistic dimension in order to automatically extract subjectivecontent. Based on the exploitation of the ESLO corpus (SociolinguisticSurvey in Orleans), the purpose is to model, detect and visualise theperception the speakers have of the city of Orleans through amultidisciplinary approach. This paper presents the processing chaindeveloped to achieve this goal: the detection of the location names, theanalysis of identified opinions and the visualisation of extractedinformation. The extracted data is projected as a map in order tomaterialise the inhabitants’ perception of their environment.