|
La détection automatique d'événements économiques dans
le discours médiatique : la fusion de Hewlett-Packard avec Compaq
La veille stratégique, domaine en plein essor depuis les
années 1980, se préoccupe de la collecte et de l'analyse d'informations
susceptibles d'influencer la stratégie d'une entreprise. À la frontière des
disciplines de l'économie et des sciences de l'information, la notion
d'événement a une importance particulière quand elle concerne la détection et le
suivi des actions des entités-acteurs ciblés. Notre objectif est de
présenter une méthode de fouille pour détecter des événements à partir du texte
brut et de distinguer cette méthode " en discours " des approches actuelles se
basant sur des descriptions linguistiques externes (ontologies, classes
sémantiques, etc.). Dans cette perspective, nous proposons ici une série
d'expériences textométriques sur le corpus New York Times de Janvier 2001 à
Décembre 2002, pour la rubrique Business/Financial. La textométrie est utilisée
ici comme méthode de fouille dans le but de détecter automatiquement un
événement économique, la fusion de Hewlett-Packard (HP) avec Compaq, dans un
corpus sans traitement préalable (sans annotations). Dans un premier temps,
une analyse chronologique des variations de fréquence de HP mettra en évidence
les fluctuations de cette entité lors de la période de fusion, par contraste
avec la période " hors fusion ". L'événement sera observé sous sa dimension
temporelle afin de voir s'il y a un lien avec son évolution quantitative.
Dans un deuxième temps, l'analyse mensuelle des réseaux coocurrentiels
permettra de resituer HP dans son environnement contextuel, nous montrant la
dynamique des acteurs principaux de cet événement ainsi que des constructions
connexes créant la scène interdiscursive sur laquelle la fusion se
déroule.
Mots clés : cooccurrences, détection
automatique d'événements, fouille textuelle, textométrie, veille économique
EHRMANN, M. Les Entités Nommées, de la linguistique au TAL :
statut théorique et méthodes de désambiguïsation. Thèse pour le doctorat
de linguistique théorique, descriptive et automatique, Université Paris 7, 2008.
MARTINEZ, W. Contribution à une méthodologie de l'analyse des cooccurrences
lexicales multiples dans les corpus textuels, Thèse pour le doctorat en Sciences
du Langage, Université Sorbonne nouvelle - Paris 3, 2003. MOIRAND, S. Les
discours de la presse quotidienne, observer, analyser, comprendre. Paris :
Presses Universitaires de France, 2007. POIBEAU T. Extraction automatique
d'information. Du texte brut au web sémantique. Paris : Hermès Sciences,
2003. VENIARD, M. La nomination d'un événement dans la presse quotidienne
nationale. Une étude sémantique et discursive : la guerre en Afghanistan et le
conflit des intermittents dans le Monde et le Figaro, Thèse pour le doctorat en
Sciences du Langage, Université Sorbonne nouvelle - Paris 3, 2007. ZUELL, C.
Using computer-assisted text analysis to identify media reported events.
Proceedings of the 10th International Conference on Statistical Analysis of
Textual Data, Rome 2010.
| |