Sens, discours, corpus, TAL
(Responsable : Sandrine Reboul-Touré)
- Programme n°1 : Les discours de transmission des connaissances
- Programme n°2 : Nomination et référence
- Programme n°3 : Corpus
- Programme n°4 : Référence, discours et représentations cognitives
- Programme n°5 : Comparaison langue/culture dans des perspectives discursives
- Programme n°6 : Sciences du langage et demande sociale
- Programme n°7 : Analyse du discours en France et hors de France
- Programme n°8 : Outiller les linguistes
Programme 1
Les discours de transmission des connaissances
Cette réflexion, centrale au sein du CEDISCOR, s'oriente d'une part du côté de la vulgarisation de la science et d'autre part du côté de la transmission des langues. Les différents thèmes des Carnets du CEDISCOR soulignent d'ailleurs ces deux pôles.
Les recherches sur les traces de la science dans la presse quotidienne ont d'ailleurs permis de revisiter certains concepts de l'analyse du discours (S. Moirand, 2007). Par ailleurs l'analyse de la vulgarisation scientifique sur des corpus issus de l'internet conduit aussi à s'interroger sur les différentes typologies existantes pour le discours rapporté notamment et de proposer une ouverture de la typologie existante. On peut aussi s'interroger sur le concept de modalisation autonymique qui s'enrichit avec l'étude des liens hypertextuels (S. Reboul-Touré, 2005). Ces analyses seront poursuivies notamment avec la collecte de corpus issus de l'internet s'inscrivant dans la suite de la réflexion rassemblée dans les Carnets du Cediscor 8 - Les Discours de l'internet : nouveaux corpus, nouveaux modèles ? F. Mourlhon-Dallies, F. Rakotonoelina, S. Reboul-Touré Eds (2004).
Dans le cadre des formations à distance, l'imprimé demeure, à l'heure actuelle, un support pédagogique universellement répandu. Cependant, les technologies de l'information et de la communication tentent de jouer un rôle essentiel dans l'essor de l'enseignement à distance, montrant ainsi l'étroite relation existant entre technologies, dispositifs de formation et transmission des connaissances. à un niveau institutionnel, les plates formes d'enseignement à distance (telles Blackboard, Moodle, etc.) sont désormais la pierre angulaire de ces dispositifs pour diffuser des contenus de connaissance. Dépareillés des institutions, les dispositifs de formation en libre accès sur le web donnent à voir d'autres manières de diffuser des contenus de connaissance. L'objectif de la recherche est d'observer et d'amener à comprendre les nouvelles pratiques discursives liées aux processus de transmission des connaissances à l'intérieur des dispositifs institutionnels tout autant qu'à l'extérieur (le libre accès sur l'internet)
Opération 1 : La vulgarisation scientifique et l'analyse du discours
Participants : S. Moirand, S. Reboul-Touré, F. Mourlhon-Dallies, F. Rakotonoelina, G. Cislaru, C. Ruchon, M. Krylyschin
En préparation : Les Carnets du Cediscor 12
Opération 2 : Les pratiques discursives dans les formations à distance
Participants : F. Rakotonoelina, P. Chardenet
Communications :
Programme 2
Nomination et référence
Opération 1 : Linguistique de la nomination
Dans la continuation des travaux théoriques concernant la nomination, notamment dans le cadre du séminaire du RES (1998-2002), il s'agit d'élaborer des modèles sémantico-référentiels de l'activité linguistique de nomination, en confrontant plusieurs perspectives : linguistique contrastive, sémantique cognitive, sociopragmatique et sémantique discursive.
Calendrier et livraisons : Publication d'un ouvrage collectif sur la linguistique de la nomination (2010, Peeters).
Opération 2 : Sens, référence, cognition (sous réserve)
La question de la référence est au cœur des approches sémantiques discursives, avec l'articulation entre matérialité linguistique - formes lexicales, structures syntaxiques, enchaînements textuels - d'une part, et matérialité extralinguistique - qu'il s'agisse d'objets concrets ou abstraits, réels ou fictionnels, individuels ou collectifs - d'autre part. Les analyses portent sur les noms propres, les noms abstraits, les noms d'événements et autres objets sociaux, la nomination des sensations et des émotions.
Calendrier et livraisons : Journées d'étude (2012) sur " sens, référence, cognition "
Programme 3
Corpus
Opération 1 : Corpus CFPP2000 : Discours sur la ville. Corpus de Français Parlé Parisien des années 2000 (Responsable : Gabriella Parussa)
Participants : Serge Fleury (Maître de Conférences à l'Université de Paris 3-Sorbonne-Nouvelle, équipe SYLED), Florence Lefeuvre Maître de Conférences (HDR) à l'Université de Paris 3-Sorbonne-Nouvelle (équipe LATTICE ) et Mat Pires, Maître de conférences à l'Université de Besançon.
Réalisation d'un site 2007-2009
Le corpus de français parlé parisien (CFPP2000 : (http://cfpp2000.univ-paris3.fr/)) a été constitué à l'initiative de Sonia Branca-Rosoff par trois universitaires de Paris 3, Sonia Branca-Rosoff, et Serge Fleury, (Equipe SYLED), Florence Lefeuvre (Equipe LATTICE) ainsi que par Mat Pires (Equipe LASELDI, U. de Franche-Comté).
Il s'agit d'interviews non directives sur les quartiers de Paris et de la proche banlieue, qui ont été transcrites et alignées sur le son au tour de parole, et qui sont entièrement et librement accessibles sur le net. Un certain nombre d'outils en ligne, notamment un concordancier et des outils textométriques, permettent de mener des requêtes lexicales et grammaticales. Ce corpus constitue aussi un ensemble de témoignages intéressants sur les représentations de Paris et de sa proche banlieue, susceptible d'intéresser des analystes du discours, des sociologues, ou tout simplement des curieux de la ville.
Le corpus comporte aujourd'hui un peu plus de 300 000 mots.
Projets 2010-2011 :
Il s'agit d'augmenter le corpus, d'améliorer les outils mis à disposition des utilisateurs (par exemple en ce qui concerne l'étiquetage morpho-syntaxique) et de l'exploiter en morpho-syntaxe et en analyse du discours.
Perspectives : Dépôt d'un projet ANR dont le SYLED serait porteur
Publications en ligne :
Branca-Rosoff, Sonia, Fleury Serge, Lefeuvre Florence, Pires, Mat, (2009)
"Constitution et exploitation d'un corpus de français parisien "
Communications et articles :
Branca-Rosoff, Sonia, (2009), "Corpus et recherches linguistiques sur le futur simple et le futur périphrastique" Colloque de l'Association of French Linguistics Studies, 3-5 septembre, Neuchâtel
Branca-Rosoff, Sonia & Fleury Serge, (2009) Les usages du futur simple et du futur périphrastique dans un corpus d'interviews en français parlé non formel, Colloque Aston University, Birmingham
Articles à paraître :
2010, Lefeuvre F. à par, "Bon à l'oral : une unité syntaxique averbale et autonome ?", Oprhys
2010, Lefeuvre F., Morel M.-A., Teston-Bonnard, à par., "L'unité macrosyntaxique quoi". Neuphilologische Mitteilungen (Bulletin de la Société Néophilologique).
2010, Lefeuvre F., "Bon et quoi à l'oral : des marqueurs d'unités syntaxiques averbales autonomes", revue Discours.
Articles en cours :
Branca-Rosoff, Sonia, (2009), Stéréotypes et représentations : le topos du quartier-village
Programme 4
Référence, discours et représentations cognitives
La question de la référence est un objet de prédilection de l'analyse de discours : en effet, la référenciation est partie prenante de l'acte d'énonciation (E. Benveniste), son étude présupposant l'articulation entre matérialité linguistique (formes lexicales, structures syntaxiques, enchaînements textuels) et " matérialité " du monde (qu'il s'agisse d'objets concrets ou abstraits, réels ou fictionnels, individuels ou collectifs). Cette articulation revêt une dimension cognitive dans le sens où les formes linguistiques peuvent véhiculer des représentations et participer au processus de construction de connaissances. Cet axe comporte deux opérations : 1) la construction discursive des objets sociaux et 2) la construction des événements sociaux.
Opération 1 : Objets sociaux/événements et médias
Opération 2 : Projet avec Labeurb (discours urbains)
Opération 3 : Projet avec Brésil (Zoppi)
Programme 5
Comparaison langue/culture dans des perspectives discursives
Les orientations de la recherche s'inscrivent dans le prolongement de celles engagées au cours du précèdent quadriennal. On envisage une réflexion critique autour des modèles théoriques en circulation établis par des sociologues, des psycholinguistes (M. Bennett), des psychologues (G. Hofstede), des anthropologues (E. Hall), etc. pour une approche de la culture.
En effet, s'il est communément admis que discours et culture ne sont pas imperméables, on ne dispose pas actuellement en sciences du langage d'un modèle validé pour aborder l'articulation entre les deux. Un tel modèle apparaît d'autant plus nécessaire que l'analyse de discours s'emploie à contextualiser les corpus avec lesquels elle travaille, ce qui conduit à intégrer automatiquement les données culturelles à l'objet d'analyse. Comment mesurer dès lors l'impact de celles-là sur celui-ci, et vice-versa ?
S'interroger sur la possibilité de la mise à l'épreuve de modèles de représentation de la culture, dans des perspectives ethnolinguistiques, devrait permettre d'éprouver leur degré d'adéquation et de fiabilité compte tenu de la spécificité des corpus (oraux/écrits ; produits dans des contextes variés : monde professionnel, académique, virtuel, etc.) et de la nature des langues/cultures impliquées.
Participants : G. Cislaru, C. Claudel, G. Felten, S. Katsiki, P. von MÜnchow, F. Pugnière, F. Rakotonoelina, M. Pordeus, C. Rivera
- HDR de P. von MÜnchow
- Thèse de G. Tréguer-Felten
- Colloque IPRA
Programme 6
Sciences du langage et demande sociale
Opération 1 : Analyse d'une procédure discursive : Le signalement de la maltraitance de l'enfant et son traitement institutionnel
En envisageant les écrits de signalement dans leur dimension synchronique, nous nous sommes dotés de points de repère dans les textes, ce qui permet d'outiller la lecture et de guider l'interprétation de l'analyste. Mais ce n'est que le premier niveau d'articulation entre les pratiques linguistiques et les pratiques sociales. Pour avoir une représentation plus complète de l'interface entre le social et le langagier, il convient d'envisager l'écriture des rapports éducatifs dans leur dimension processuelle. Cette dimension dynamique peut être appréhendée de deux points de vue : du point de vue de l'évolution historique (diachronie) et du point de la mise au point des différentes étapes de la construction d'un texte (génétique). C'est pourquoi nous envisageons de poursuivre nos recherches dans deux directions : archives et brouillons.
Participants : F. Sitri, G. Cislaru, F. Pugnière, M. Veniard
Colloque ADDS 2008, Analyse du discours et demande sociale : enjeux théoriques et méthodologiques
Projet innovant, Approche discursive et génétique des brouillons : les écrits des travailleurs sociaux dans le champ de l'enfance en danger, resp. G. Cislaru
Opération 2 : Langue et travail
Cette opération de recherche consiste à étudier différents genres discursifs produits en situation professionnelle en mettant en relation les caractéristiques formelles des discours en question avec les cultures et les logiques professionnelles (pensées en termes de savoirs partagés et de non dits) des domaines de travail concernés. L'approche croise des données langagières avec des modélisations de l'activité professionnelle, en prenant appui sur l'analyse du travail et la sociologie des entreprises. La recherche est sensible au fait que tout discours produit au travail s'inscrit dans un contexte fait d'autres discours à forte prévisibilité (par exemple, une ordonnance médicale est accompagnée d'un discours oral explicatif), ce qui permet de parler de chaînages discursifs. L'étude se concentre sur les chevauchements, les points de non jonction, les blancs qui peuvent s'établir entre les différents discours qui entrent dans une même chaîne d'activité. Elle fait place aux malentendus, aux surprises, qui déstabilisent les genres canoniques autant qu'aux occurrences prototypiques qui en permettent l'identification. La recherche développe également un volet didactique, qui interroge les méthodologies d'enseignement des langues à des publics professionnels à la lumière des évolutions du travail et de son organisation.
Participants : F. Mourlhon-Dallies, E. Oursel
Publications :
F. Mourlhon-Dallies éd., 2007, Français dans le monde, recherche et applications 42 : Langue et travail, CLE international
F. Mourlhon-Dallies, 2008, Enseigner une langue à des fins professionnelles, Editions Didier.
HDR de F. Mourlhon-Dallies
Programme 7
Analyse du discours en France et hors de France
Co-organisation avec d'autres groupes de recherche afin de réaliser une journée d'étude par an sur divers aspects de l'analyse du discours afin de travailler sur la représentation des différents concepts du domaine.
Les centres de recherche CEDITEC, CELTED, CENEL, LADISCO et CEDISCOR (autour de Sandrine Reboul-Touré) forment le RéSEAU D'éQUIPES EN ANALYSE DE TEXTES ET DES DISCOURS.
CEDITEC, Centre d'étude des discours, images, textes, écrits, communications, EA 3119, université Paris 12 Val de Marne, autour de Malika Temmar, Alice Krieg-Planque
CELTED, Centre d'Etudes Linguistiques des Textes et des Discours, EA 3474, université de Metz, autour de Michelle lecolle, Guy Achard-Bayle
CENEL, Centre d'étude des nouveaux espaces littéraires, EA 452, université Paris 13, autour de Marie-Anne Paveau
LADISCO, université libre de Bruxelles, autour de Laurence Rosier
Voir
les journées d'étude et les publications
Les Carnets du Cediscor 11 - Le nom propre en discours, PSN, 2009
Recherches Linguistiques 30 - Sentiment linguistique. Discours spontanés sur le lexique, Université de Metz, 2009
Le discours et la langue 1 - Ethnotypes et sociotypes : normes, discours, cultures, EME, Bruxelles, 2009
Programme 8
Outiller les linguistes
Les préoccupations du Centre de Lexicométrie et d'Analyse Automatique des Textes (SYLED-CLA2T) concernent à la fois: le développement de la méthodologie de l'étude quantitative des textes et la réalisation de logiciels d'analyse lexicométrique qui permettent seuls de mettre les méthodes élaborées par les chercheurs du centre, seuls ou en collaboration avec d'autres équipes, à la disposition de la communauté de recherche dans le domaine des études textuelles. Les principaux chantiers de l'équipe sont à l'heure actuelle :
- le développement de méthodes consacrées à l'étude des séries textuelles chronologiques
- la prise en compte de catégorisations (morphosyntaxiques, sémantiques, etc.) dans les traitements lexicométriques
- le développement de logiciels de lexicométrie
- la construction de ressources textométriques (corpus, alignement de textes...)
Participants : André Salem, Serge Fleury, Cédric Lamalle, Michel Jacobson
Opération 1 : Développement de logiciels
LEXICO
- URL PROJET : http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/
- DESCRIPTIF :
LEXICO est un logiciel conçu pour le traitement lexicométrique de textes comportant plusieurs centaines de milliers d'occurrences. Il a d'abord été développé par André Salem (ILPGA - Paris 3) au sein du laboratoire "Lexicométrie & textes politiques" de l'E.N.S. de Fontenay-Saint-Cloud. Il est désormais maintenu par l'équipe CLA2T de l'UPRES SYLED (Systèmes Linguistiques Enonciation et Discours - EA 2290 - Université de la Sorbonne Nouvelle - Paris 3).
- DOCUMENTATION : http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/manuels.htm
- CONTACT : salem@msh-paris.fr
- EQUIPE DéVELOPPEMENT : William Martinez, Cédric Lamalle, Serge Fleury, André Salem
Le Trameur
- URL PROJET : http://tal.univ-paris3.fr/trameur/
- DESCRIPTIF :
Le Trameur :Programme de génération puis de gestion de la trame et du cadre d'un texte (le métier lexicométrique) pour des opérations lexicométriques. Le Trameur intègre le programme treetagger : système d'étiquetage automatique des catégories grammaticales des mots avec lemmatisation. Le Trameur est disponible en 2 versions : la " version Tk " et la " version console ".
- DOCUMENTATION : http://tal.univ-paris3.fr/trameur/leMetierLexicometrique.pdf
- CONTACT : serge.fleury@univ-paris3.fr
- EQUIPE DéVELOPPEMENT : André Salem, Serge Fleury
MKALIGN
- URL PROJET : http://tal.univ-paris3.fr/mkAlign/
- DESCRIPTIF :
Le programme mkAlign permet de construire, corriger et visualiser un alignement de deux textes via un éditeur à double entrée. Il permet d'afficher simultanément les textes source et cible pour y rajouter ou corriger des segments équivalents. Ce programme n'est pas un aligneur automatique. Il est conçu pour aider l'utilisateur dans la création, l'alignement, la correction et la validation de textes traduits. L'utilisateur garde la maîtrise sur l'ensemble de ces processus, depuis la mise en correspondance initiale des segments équivalents jusqu'à l'export final du bi-texte produit.
- DOCUMENTATION : http://tal.univ-paris3.fr/mkAlign/mkAlignDOC.htm
- CONTACT : serge.fleury@univ-paris3.fr
- EQUIPE DéVELOPPEMENT : Serge Fleury
- LICENCE : université, entreprise, chercheur isolé
Projets 2010-2011 : JADT'2010
A. Salem coordonne la structure permanente JADT (Journées d'analyse des données textuelles) qui réunit tous les deux ans autour de 200 participants venant d'une quinzaine de pays pour faire le point sur les avancées dans le domaine de l'approche quantitative des textes (Barcelone 1990, Montpellier 1993, Rome 1995, Nice 1998, Lausanne 2000, St Malo 2002, Louvain 2004) Cette manifestation est ouverte aux chercheurs d'un vaste domaine d'études qui, centré sur la statistique textuelle, s'étend de la lexicographie à l'analyse du discours politique, de la recherche documentaire à la recherche en marketing, de la linguistique computationnelle à la sociolinguistique, du traitement informatique des données à l'analyse de contenu. Les actes de ces journées sont publiés au début de chaque conférence et disponibles quelques mois plus tard sur le site de la revue électronique Lexicometrica, animée par A. Salem et S. Fleury.