Présentation du corpus CDMCL2007
A l’origine, le corpus CDMCL2007 a été constitué dans le but d’étudier le discours métalinguistique d’enseignants de cours préparatoire (CP), lors de séances de lecture de textes brefs. Il a servi de base à un travail de thèse[1] repris dans un ouvrage à paraitre : Parler des mots, apprendre à lire : la circulation du métalangage dans les activités de lecture[2].
Plutôt que de stocker ces données au fin fond d’un fichier au risque de les perdre, il nous a semblé plus utile de les rendre accessibles sans restriction sur le site du Syled. Elles pourront ainsi servir d’autres études, sur le discours didactique notamment, les interactions scolaires peut-être ou encore les pratiques d’enseignement de la lecture…
1. Choix opérés dans la constitution du corpus
L’enjeu de la constitution d’un corpus est certes sa représentativité mais, comme l’a fait remarquer Sonia Branca-Rosoff[3], « les conditions de production des énoncés, retenues comme pertinentes pour constituer les corpus, sont déjà des options théoriques ». De fait, elles conditionnent l’interprétation, ce qui nous pousse à prendre le temps d’expliciter, ici, nos choix, en insistant sur les différents contrastes opérés au fil du montage.
1.1 Le type de séances de lecture retenues
Nous avons choisi d’enregistrer et de transcrire des séances intégrales afin de collecter le plus de renseignements possibles tout en prenant la mesure des contraintes que le temps de la séance peut exercer sur le discours.
Dans l’ensemble, les séances de lecture prélevées correspondent à la découverte d’un nouvel écrit : la nouvelle page du manuel, le nouvel épisode de l’album en cours ou tout autre texte travaillé pour la première fois. Par conséquent, ces situations ont en commun le support de lecture qu’elles utilisent (un texte plus ou moins court), le mode de lecture qu’elles engagent (lecture à voix haute) et le temps qu’elles se donnent (45 minutes environ).
1.2 Cadres sociologiques et institutionnels
Les enseignantes de ce corpus ont toutes de l’expérience. Elles ont dépassé depuis longtemps les problèmes de gestion du groupe classe qui désorientent tant les pratiques des débutants. La plupart d’entre elles ont plus de dix ans d’ancienneté dans le métier (certaines sont même en fin de carrière) et elles enseignent au CP depuis au moins cinq ans. Elles professent dans des écoles sans problèmes particuliers, implantées dans deux circonscriptions de l’Académie d’Aix‑Marseille. Ce sont des écoles de village ou de quartiers. En effet, nous avons écarté de ce corpus les écoles en zones d’éducation prioritaire (ZEP) car nous pensons que d’autres problèmes entrent alors dans le jeu de l’enseignement-apprentissage de la lecture.
Les élèves, pour la plupart, sont issus de milieux socioprofessionnels moyens, parfois favorisés[4], et le français est pour la grande majorité d’entre eux la langue maternelle.
1.3 Recueil des données[5]
Ce corpus formé de 39 séances de lecture de texte a été monté en trois temps, 1997/99, 2001/02, 2005/06 :
12 leçons de lecture ont tout d’abord été enregistrées dans huit classes de cours préparatoire, durant les mois de mars et d’avril de l’année 1997/98. Les Instructions Officielles de 1995 alors en vigueur font la part belle à la production d’écrits, à l’interaction lecture/écriture et à la grammaire de texte. Cette fin de semestre a été volontairement choisie en raison du discours métalinguistique scolaire supposé plus diversifié en cette période de l’année. L’apprentissage de la lecture est en effet bien avancé et seuls les élèves en difficulté peinent en lisant. C’est pour eux que cinq des professeures dédoublent leurs cours. Elles profitent de séances décloisonnées menées par des intervenants, en bibliothèque ou en salle informatique, pour travailler successivement avec deux groupes de lecteurs homogènes avancés ou faibles, ou bien elles pratiquent une pédagogie différenciée en restant avec trois ou quatre lecteurs fragiles, pendant que le reste de la classe travaille seul répondant par écrit à un questionnaire concernant le texte du jour (ce que les enseignantes nomment les lectures silencieuses).
Il apparaît très vite que les enseignantes des deux circonscriptions ne mènent pas de la même façon leurs séances. Les unes suivent, pas à pas, un manuel de lecture classique (Ratus), les autres, très inspirées par les travaux du groupe Ecouen, pratiquent le « questionnement de texte » sur différents types d’écrits : notice de fabrication, conte, bande dessinée, documentaire animalier. De plus, le comptage du métalangage employé révèle un contraste frappant. Alors que la nomenclature liée à l’enseignement du code graphique est commune aux deux types de CP, le nombre de termes métatextuels oppose nettement les classes que, faute d’une meilleure dénomination, nous avons appelées des CP‑textes (la présence de tout un vocabulaire technique narratologique comme narration, dialogue, monologue étant caractéristique de ce groupe) et les classes que nous nommons des CP‑code.[6] Ce fait explique que, dans cette répartition basée sur le métalangage en usage, des classes qui suivent une méthode mixte telle que Pas à page ou plus radicalement phonique comme Ratus se retrouvent également étiquetées CP-code.
Dans un second temps, 19 enregistrements[7] ont été réalisés durant l’année 2001/2002 chez deux des enseignantes du groupe initial, une pour chaque type de classe. Des données permettant de décrire assez objectivement les pratiques professionnelles ont ainsi été recueillies sur une année complète (septembre, décembre, mars, mai). Parce qu’un problème technique nous a privée, pour le CP‑textes, de la séance de septembre, plusieurs enregistrements ont été effectués à la rentrée suivante (septembre 2002) lors de la première semaine d’école. De nouvelles Instructions Officielles entrent en application cette année-là, mais comme elles prennent à peine effet, le déroulement des séances de lecture en 2002 reste sensiblement le même qu’en 1997.
Enfin, parce que nous avons eu besoin, pour l’analyse, de vérifier ce qui se passait en amont et en aval de cette année de CP, mais aussi dans une classe conduite par une enseignante débutante[8], se sont ajoutés plus tard de nouveaux enregistrements effectués en Grande section de maternelle[9] (juin 2005), au cours élémentaire première année[10] (mars/avril 2006) et dans un CP‑code (septembre 2005) mené pour la première fois par une jeune enseignante (deuxième année d’enseignement et premier CP).
Nous avons souligné que malgré l’étalement temporel du recueil des données (de 1997 à 2006) et la publication de nouvelles Instructions Officielles concernant l'enseignement de la lecture (1995, 2002, 2006), les pratiques enseignantes restent sensiblement les mêmes d’une période d'enregistrement à l’autre. En revanche, l’axe du déroulement d’une année scolaire s’avère essentiel. Au début de l’année, la quasi totalité des élèves sont des non‑lecteurs, en fin d’année la situation s’inverse. Nous ordonnons donc les transcriptions sur le fil d’une année en renonçant à suivre l’ordre de leur recueil : la première semaine de classe, la fin du premier trimestre, la fin de second trimestre, la fin du troisième trimestre. Les séances de GS et de CE1 bordent le tout. Ce réagencement facilite une première perception globale de l’évolution du métalangage.
Dans ce cadre, il faut rappeler également que l’élaboration de ce corpus ne visait pas à distinguer des méthodes d’enseignement de la lecture, mais la circulation du métalangage dans des pratiques d’enseignement. Cette restriction du champ d’observation ne doit pas faire oublier que l’enseignement de la lecture comporte d’autres types de situations conduites à d’autres moments dans la classe. En aucune façon, on ne peut donc conclure des pratiques observées dans l’activité de « lecture de texte » à l’enseignement de la lecture en général. Il y aurait abus à en tirer des conclusions généralisantes sur ce que font les enseignants en lecture. Si l’on voulait confronter les classes, il faudrait tenir compte de l’ensemble des activités et les envisager dans leur plus ou moins grande systématicité.
2. Outils
Attardons-nous à présent sur le choix des outils qui, de l’introduction des supports de lecture aux conventions de transcription adoptées, organisent ce recueil.
2.1 Les supports de lecture
Avant chaque séance, les références du manuel de lecture employé et la page étudiée sont indiquées. Nous réécrivons également le texte support en tentant de respecter le plus possible sa présentation, mais les illustrations, les aménagements typographiques, l’agencement des unités etc. sont autant d’éléments significatifs qui ne figurent pas dans cette réécriture. Nous engageons donc les lecteurs de ce corpus à consulter les textes originaux des manuels utilisés :
Grandaty, M., Euillet, P., Mole, Y. (1998). Frisapla la sorcière. Toulouse : Sedrap.
Fouillade, G., Cancalon, F., Olivier, M.-C. (1992). Croquepages, Bordas.
Giribone, C., Hugon, M., Gazzano-Giribone, M. (1998). Pas à page. Paris : Nathan.
Gombert, J.-E., Colé, P., Daguson, M., Jaulhac, P., Valdois, S., Goigoux, R. (2001), Crocolivre CE1, Paris : Nathan.
Guion, J., Guion, J. (1987). Ratus et ses amis. Paris : Hatier
2.2 Les conventions de transcription
Les conventions de transcription du Groupe Aixois de Recherche en Syntaxe (G.A.R.S) servent de référence. Nous transcrivons en orthographe standard et nous renonçons au point et à la virgule, car les pauses de l’oral ne correspondent pas systématiquement à l’usage de ces signes de ponctuation. Deux degrés de pauses sont notés et les interruptions du discours sont signalées.
+ pause brève
-- pause longue
/// coupure dans la transcription du discours
Néanmoins, les ponctèmes « ? » et « ! » sont conservés. Ils sont essentiels à la bonne compréhension de l’énoncé et ils correspondent à des intonations caractéristiques, même si l’interrogation n’est pas toujours marquée par la montée de la voix.
Le signe est rajouté pour marquer l’appel intonatif (assez proche d’une montée interrogative) que l’enseignant adresse si fréquemment aux élèves dans le dialogue scolaire :
M alors maintenant on a pas le [o] on a le [u] ça fait
L [ku]
Pour des raisons de lisibilité, quelques modifications supplémentaires sont introduites :
Tout à coup, un des oiseaux aperçoit une boule blanche au pied de l’arbre.
M [u] alors dis‑moi un peu Alexandra et les autres réfléchissez la lettre [sé] on sait qu’elle a au moins deux sons au moins devant le [o] elle fait quel son ?
L [ko]
M alors maintenant on a pas le [o] on a le [y] ça fait
L [ku]
M [ku] Alexandra tu nous relis tout ça on y va
Alex. tout à + coup (CP‑textes 25.03.02)
Comme on peut le voir dans l’exemple ci‑dessus, la séquence à lire telle qu’elle est exactement écrite dans le texte source est rappelée en italique avant chaque phase de lecture.
M et non L1 désigne l’enseignante, L1, L2, L3… nomment les élèves qu’il est impossible d’identifier, et L code les réponses collectives.
L’emploi de l’Alphabet Phonétique International permet de transcrire les tentatives d’oralisation d’un terme écrit qui ne correspondent pas à des morphèmes, ainsi que les noms de lettres afin de bien les distinguer du phonème qui leur correspond. Par exemple, la lettre c sera notée [sé] et le son qu’elle transcrit [s] ou [k].
La transcription [mm] note la séquence codée que les enseignants et les élèves utilisent pour marquer un mot provisoirement illisible, sans interrompre pour autant la lecture en cours.
Elle n’a pas peur des sorcières qu’elle rencontre.
L elle n’a pas peur des [mm] qu’elle [mm] (CP‑textes 15.1101)
L’italique est utilisé pour signaler les faits autonymiques qu’il s’agisse de séquences lues, de reprises, de discours rapportés, de définitions, de gloses[11] ou de cas de modalisation autonymique[12]. Toutefois, afin de faciliter les repérages du lecteur, ce marquage typographique se limite aux séquences autonymiques directement liées au texte à lire.
Aujourd’hui nos amis vont se promener en ville. Ils vont regarder les vitrines des magasins faire quelques courses.
Manon aujourd’hui
M bien fort pour que l’on entende
Manon aujourd’hui nos amis vont se [pRomEnER]
M vont se promener […] alors Manon tu reprends la phrase
Manon aujourd’hui nos amis
M nos z‑amis
Manon nos amis vont se promener en + ville
M oui (CP‑code 18.04.02)
Les accents d’insistance et de focalisation sur les mots sont transcrits en MAJUSCULES :
« M vont se promener … alors Manon tu reprends la phrase ».
Un z‑ est écrit pour noter les liaisons (nos z‑amis) uniquement dans les reprises correctives. Sa présence indique par conséquent que l’apprenti lecteur n’a pas réalisé la liaison dans le tour précédent.
Enfin, le tiret placé dans un mot signale une lecture syllabée : a‑tten‑tion, les séquences inaudibles ou incompréhensibles sont transcrites « xxx » et les deux points marquent un allongement volontaire de la voyelle dans le mot prononcé.
2.3 Remerciements
Au terme de cette présentation, nous tenons à remercier les enseignantes et leurs élèves sans qui nous n’aurions pu ni monter ce corpus, ni le mettre en ligne : Christiane V., Françoise A., Christine G., Marie‑Agnès A., Valérie T., Danielle L.F., Françoise H., Laurence B., Simone C., Margaret C., Valérie D. et Nathalie T.
Nous leur dédions ce recueil.
[1] Gomila, C. (2007). Le discours métalinguistique de la classe de lecture. Comment des enseignants, et leurs élèves qui apprennent à lire, parlent du langage. Thèse de doctorat en Langage et Langue : description, théorisation, transmission, sous la direction de Sonia Branca‑Rosoff. Université de Paris III - Sorbonne Nouvelle.
[2] Gomila, C. (à paraître), Parler des mots, apprendre à lire : la circulation du métalangage dans les activités de lecture. Genève : Peter Lang, coll. Explorations,
[3] Branca-Rosoff, S. (2002). Les corpus d’archive en analyse de discours. In P. CHARAUDEAU & D. MAINGUENEAU (Eds.), Dictionnaire d’analyse de discours (pp.151‑154). Paris : Seuil.
[4] Ce n’est pas un critère que nous avons pris en compte dans cette étude.
[5] La constitution de ce corpus est détaillée dans l’ouvrage cité dans la note 2.
[6] Les recommandations de la conférence de consensus (PIREF, 2003, 38) observent que les maîtres de CP peuvent conduire l’enseignement de la lecture selon des progressions différentes. À côté de progressions linéaires, il a été observé des progressions spiralaires, « qui reviennent à plusieurs reprises sur les mêmes éléments mais à des niveaux d’information et d’exigence différents et ne peuvent donc fonder une structuration en phases successives » Nos deux types de CP se distinguent également sur cette base.
[7] Le signe * permet de mieux les repérer dans le sommaire.
[8] Il s’agissait de vérifier si certains gestes et pratiques métadiscursives propres à la classe de lecture se construisent avec l’expertise professionnelle.
[9] Noté GS désormais.
[10] Noté CE1.
[11] Cf. Steuckardt, A. & Niklas-Salminen, A. (2003). Le mot et sa glose. Langues et langage n° 9. Aix-en-Provence : Publications de l’Université de Provence.
[12] Cf. Authier-Revuz, J. (2003). Le fait autonymique : Langage, langue, discours Quelques repères. In J. Authier-Revuz, M. Doury, S. Reboul-Touré (Eds.), Parler des mots. Le fait autonymique en discours, (pp. 68-96). Paris : Presses de la Sorbonne nouvelle.