Identification automatique de sentiments liés aux territoires

783

Post-doctorant : Eric Kergosien

Organisme d'accueil : Irstea

Encadrement à Tetis : Maguelonne Teisseire (Irstea)

Autre(s) encadrant(s) : Mathieu Roche (Cirad)

Axe(s) Tetis concerné(s) : SISO

Fin : Décembre 2013

Mots-clés : fouille de textes, fouille de données d’opinion, information géographique, aménagement du territoire

Contexte/Cadre du Post-doctorant : SENTERRITOIRE

Résumé: Au-delà de sa stricte définition d’entité administrative et politique, le territoire, témoigne d’une appropriation à la fois économique, idéologique et politique (sociale donc) de l’espace par des groupes qui se donnent une représentation particulière d’eux-mêmes, de leur histoire, de leur singularité. Dans ce contexte éminemment subjectif, la caractérisation et la compréhension des perceptions d’un même territoire par les acteurs sont difficiles, mais néanmoins particulièrement intéressantes dans une perspective d’aménagement du territoire et de conception de politique publique territoriale. La recherche d’informations associées incluant les groupes d’acteurs porteurs d’un même discours territorial représente un verrou scientifique multidisciplinaire.
L’extraction d’informations spatiales au sein des documents est un premier pas pour définir une méthode de découverte semi-automatique de la perception des territoires. Ceci reste un enjeu majeur dans le contexte de l’aménagement et des débats publics associés. L’originalité des travaux proposés est de s’inscrire dans une démarche pluridisciplinaire initiée à partir d’une méthode automatique visant à fournir aux géographes et, aux environnementalistes, une aide à la découverte de connaissances. Des verrous sont associés à l’hétérogénéité des documents manipulés aussi bien dans leur structure que dans leur contenu (rapports techniques, compte-rendu de réunions publiques, cahiers d’acteurs, articles de journaux, blogs, interviews retranscrits).
Dans le cadre de ce post-doctorat, un travail d’analyse a été mené afin de définir un modèle de descripteur géospatial. Le modèle de base s’appuie, entre autres, sur le concept d'entité spatiale absolue caractérisant les informations propres à une entité nommée (par exemple, la ville de Selles-sur-Cher) et le concept d'entité spatiale relative caractérisant des indications spatiales associées aux entités nommées (par exemple, près de Selles-sur-Cher). Pour extraire les descripteurs géospatiaux, une démarche combinant, entre autres, des approches de TALN et de Fouille de Texte/Web a été proposée. Ainsi, nous avons mis en œuvre et évalué, à partir de des données réelles, une méthode automatique de détection de liens sémantiques entre les descripteurs géospatiaux.
Nous avons ensuite défini les concepts d’opinion liés aux données textuelles territoriales en s’appuyant en grande partie sur les descripteurs géospatiaux (définis et extraits lors de la première phase) et déterminé l’ensemble des concepts importants liés aux territoires. Les concepts d’opinion en lien avec la thématique des territoires ont été définis et organisés. L’objectif est ainsi de développer une méthode de détection automatique d’une opinion à partir de textes décrivant des informations territoriales en prenant en compte la polarité et l’intensité des opinions.

Publications dans le cadre du post-doctorat:
E. Kergosien, P. Maurel, M. Roche, M. Teisseire. OPITER : Fouille de données d’opinion pour les territoires, In Spatial Analysis and GEOmatics (Sagéo’13), Brest, 2013.
S. Tahrat, E. Kergosien, S. Bringay, M. Roche, and M. Teisseire. Text2Geo: from textual data to geospatial information. In the 3rd International Conference on Web Intelligence, Mining and Semantics (WIMS'13), 2013.
S. Tahrat, E. Kergosien, S. Bringay, M. Roche, and M. Teisseire. Text2geo : des données textuelles aux informations géospatiales. In Actes de la conférence EGC'13 (Extraction et Gestion des Connaissances), p.407-412, Article court, Toulouse, 2013.