Erin MACMURRAY
Université Sorbonne nouvelle, SYLED CLA²T, TEMIS R&D
erin.macmurray@gmail.com
 
La détection automatique d'événements économiques dans le discours médiatique : la fusion de Hewlett-Packard avec Compaq
 
La veille stratégique, domaine en plein essor depuis les années 1980, se préoccupe de la collecte et de l'analyse d'informations susceptibles d'influencer la stratégie d'une entreprise. À la frontière des disciplines de l'économie et des sciences de l'information, la notion d'événement a une importance particulière quand elle concerne la détection et le suivi des actions des entités-acteurs ciblés.
Notre objectif est de présenter une méthode de fouille pour détecter des événements à partir du texte brut et de distinguer cette méthode " en discours " des approches actuelles se basant sur des descriptions linguistiques externes (ontologies, classes sémantiques, etc.). Dans cette perspective, nous proposons ici une série d'expériences textométriques sur le corpus New York Times de Janvier 2001 à Décembre 2002, pour la rubrique Business/Financial. La textométrie est utilisée ici comme méthode de fouille dans le but de détecter automatiquement un événement économique, la fusion de Hewlett-Packard (HP) avec Compaq, dans un corpus sans traitement préalable (sans annotations).
Dans un premier temps, une analyse chronologique des variations de fréquence de HP mettra en évidence les fluctuations de cette entité lors de la période de fusion, par contraste avec la période " hors fusion ". L'événement sera observé sous sa dimension temporelle afin de voir s'il y a un lien avec son évolution quantitative.
Dans un deuxième temps, l'analyse mensuelle des réseaux coocurrentiels permettra de resituer HP dans son environnement contextuel, nous montrant la dynamique des acteurs principaux de cet événement ainsi que des constructions connexes créant la scène interdiscursive sur laquelle la fusion se déroule.
 
Mots clés : cooccurrences, détection automatique d'événements, fouille textuelle, textométrie, veille économique
 
EHRMANN, M. Les Entités Nommées, de la linguistique au TAL : statut théorique et méthodes de désambiguïsation.  Thèse pour le doctorat de linguistique théorique, descriptive et automatique, Université Paris 7, 2008.
MARTINEZ, W. Contribution à une méthodologie de l'analyse des cooccurrences lexicales multiples dans les corpus textuels, Thèse pour le doctorat en Sciences du Langage, Université Sorbonne nouvelle - Paris 3, 2003.
MOIRAND, S. Les discours de la presse quotidienne, observer, analyser, comprendre. Paris : Presses Universitaires de France, 2007.
POIBEAU T. Extraction automatique d'information. Du texte brut au web sémantique. Paris : Hermès Sciences, 2003.
VENIARD, M. La nomination d'un événement dans la presse quotidienne nationale. Une étude sémantique et discursive : la guerre en Afghanistan et le conflit des intermittents dans le Monde et le Figaro, Thèse pour le doctorat en Sciences du Langage, Université Sorbonne nouvelle - Paris 3, 2007.
ZUELL, C. Using computer-assisted text analysis to identify media reported events. Proceedings of the 10th International Conference on Statistical Analysis of Textual Data, Rome 2010.