URL projet : http://www.univ-paris3.fr/ecriscol

Responsables du projet : Claire Doquet, Serge Fleury (Sorbonne Nouvelle, Paris 3, Clesthia EA-7345)

Le projet de recherche ECRISCOL est centré sur l'analyse des écrits produits en situation scolaire. Il s'agit de faire le rapport entre des traits caractéristiques de ces écrits et des situations d'apprentissage et d'enseignement suscitant leur production, de manière à faire apparaître des dispositifs didactiques favorisant certains types d'écrits et certaines stratégies ou procédures d'écriture.

(zoom sur la copie en déplaçant le curseur de votre souris)

Objectifs scientifiques

Objectifs technologiques

Mise en oeuvre de protocoles spécifiques d'analyse dans les logiciels de textométrie utilisés pour traiter les textes des élèves, qui ont des caractéristiques linguistiques spécifiques (constructions a-syntaxiques, écarts orthographiques, etc. ) de manière à ce que ces logiciels soient capables de produire des analyses prenant en charge ce type de corpus orthographiquement et syntaxiquement décalés.

Corpus

La plupart des écrits disponibles ici ont été recueillis dans le cadre de la recherche « Analyse linguistique de l'écriture scolaire » du laboratoire Clesthia. Dans le cadre d'un accord entre les universités Sorbonne Nouvelle et Cergy-Pontoise, le site Ecriscol accueille en outre des écrits collectés et traités par le laboratoire EMA (Ecole, Mutations, Apprentissage) de l'UCP, sous la responsabilité de M.-L. Elalouf et C. Boré : écoles JOD, PYR et PAS. Le corpus Ecriscol, dont la vocation première est de mettre à disposition les données recueillies par des membres de Clesthia, peut ainsi accueillir tout ensemble d'écrits d'élèves recueillis par des chercheurs extérieurs, à condition que ces écrits répondent aux normes fixées par le laboratoire.

L'ensemble des données du corpus sera mis en ligne progressivement ci-dessous. Ces données (les copies d'élèves) sont accessibles par niveau d'étude. Sous chaque niveau, on trouvera des liens donnant à voir l'ensemble des devoirs d'une classe donnée (avec pour certains devoirs, différentes versions du même devoir). Chacune des copies est visible avec les différentes opérations de réécriture transcrites (et les corrections réalisées) et en regard du manuscrit original (avec la possibilité de zoomer sur ce manuscrit original).

Dernière mise à jour du corpus : 30/05/2019

Taille du corpus : 1405 copies

(cliquez sur le niveau pour mettre au jour les classes disponibles par école)

2014/2015

ECOLE ABZ

Classe 1 : Devoir 1

Classe 1 : Devoir 2

Classe 2 : Devoir 1

2015/2016

ECOLE ABZ

Classe 1 : Devoir 1

2016/2017

ECOLE ABZ

Classe 1 : Devoir 1

Classe 1 : Devoir 2

Classe 1 : Devoir 3

2016/2017

ECOLE SSI

Classe 1 : Devoir 1

ECOLE BSZ

Classe 1 : Devoir 1

Classe 1 : Devoir 2

2014/2015

ECOLE JOD (EMA)

Classe 1 : Devoir 1

ECOLE PAS (EMA)

Classe 1 : Devoir 1

2014/2015

ECOLE PYR (EMA)

Classe 1 : Devoir 1

2014/2015

ECOLE SDPA

Classe 1 : Devoir 1

ECOLE MAG

Classe 1 : Devoir 1

Classe 2 : Devoir 1

Classe 2 : Devoir 2

2015/2016

ECOLE MAF

Classe 1 : Devoir 1

ECOLE EGL

Classe 1 : Devoir 1

Classe 1 : Devoir 2

Classe 1 : Devoir 4 Corrections en cours

2016/2017

ECOLE EGL

Classe 1 : Devoir 1 Corrections en cours

Classe 1 : Devoir 2

Classe 1 : Devoir 3

ECOLE PNT

Classe 1 : Devoir 1

Classe 1 : Devoir 2 Corrections en cours

Classe 1 : Devoir 3

2016/2017

ECOLE PTA

Classe 1 : Devoir 1

Classe 1 : Devoir 2

Classe 2 : Devoir 1

2014/2015

ECOLE FSB

Classe 1 : Devoir 1

Classe 2 : Devoir 1

ECOLE ARG

Classe 1 : Devoir 1

2014/2015

LYCEE MLJ

Classe 1 : Devoir 1

2016/2017

LYCEE MLJ

Classe 1 : Devoir 1

Aucune copie pour le moment...

2015/2016

LYCEE CHT

Classe 1 : Devoir 1

2013/2014

UNIV UCP

Classe 1 : Devoir 1

2014/2015

UNIV UCP

Classe 1 : Devoir 1


Bases textométriques

Les données du corpus seront progressivement disponibles sous la forme de bases textométriques exploitables dans les logiciels Le Trameur et iTrameur.
Ces fichiers peuvent être téléchargés ci-dessous puis importés dans ces logiciels.

Les bases notées (avec étiquetage treetagger*) sont construites automatiquement à partir des fichiers dits d'"annotation" du corpus Ecriscol. Ce processus intègre un étiquetage via treetagger et un formatage final des données associant à chaque mot 4 couches d'annotation dans la base finale : le mot initial (correct ou erroné), son lemme, sa POS et sa forme normée. Ces différentes couches d'annotation sont exploitables dans les logiciels visés.
Les bases présentées infra regroupent toutes les copies d'un même devoir (par version). Il est possible de procéder à des regroupements de différentes natures (toutes les copies de troisième par exemple).

BASE ECRISCOL regroupant toutes les copies actuellement disponibles : BASE-ECRISCOL pour iTrameur avec étiquetage treetagger* [mise à jour : 09/02/2018],

(cliquez sur le niveau pour mettre au jour les bases disponibles)

2014/2015

ECOLE ABZ

BASE EC-CE1-2014-ABZ-C1-D1-V1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CE1-2014-ABZ-C1-D1-V2 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CE1-2014-ABZ-C1-D1-V3 pour iTrameur (avec étiquetage treetagger*)

2016/2017

ECOLE SSI

BASE EC-CE2-2016-SSI-C1-D1 pour iTrameur (avec étiquetage treetagger*)

Aucune base disponible pour le moment...

2014/2015

ECOLE MAG

BASE EC-CM2-2014-MAG-C1-D1-V1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2014-MAG-C1-D1-V2 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2014-MAG-C2-D1-V1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2014-MAG-C2-D1-V2 pour iTrameur (avec étiquetage treetagger*)

ECOLE SDPA

BASE EC-CM2-2014-SDPA-C1-D1 pour iTrameur (avec étiquetage treetagger*)

2015/2016

ECOLE MAF

BASE EC-CM2-2015-MAF-C1-D1-V1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2015-MAF-C1-D1-V2 pour iTrameur (avec étiquetage treetagger*)

2016/2017

ECOLE PNT

BASE EC-CM2-2016-PNT-C1-D1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2016-PNT-C1-D3-F-G-V1-V2 pour iTrameur (avec étiquetage treetagger)

BASE EC-CM2-2016-PNT-C1-D3-F-G-V1-V2 pour iTrameur

BASE EC-CM2-2016-PNT-C1-D3-F-G-V1-V2 pour Le Trameur

ECOLE EGL

BASE EC-CM2-2016-EGL-C1-D2-V1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2016-EGL-C1-D2-V2 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2016-EGL-C1-D3-V1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2016-EGL-C1-D3-V2 pour iTrameur (avec étiquetage treetagger*)

BASE EC-CM2-2016-EGL-C1-D3-V3 pour iTrameur (avec étiquetage treetagger*)

2016/2017

ECOLE PTA

BASE EC-6EME-2016-PTA-C1-D1 pour iTrameur (avec étiquetage treetagger*)

BASE EC-6EME-2016-PTA-C2-D1 pour iTrameur (avec étiquetage treetagger*)

2014/2015

COLLEGE FSB

BASE CO-3-2014-FSB-C1-D1 pour iTrameur (avec étiquetage treetagger*)

2014/2015

LYCEE MLJ

BASE LY-2-2014-MLJ-C1-D1-V1 pour iTrameur (avec étiquetage treetagger*)

BASE LY-2-2014-MLJ-C1-D1-V2 pour iTrameur (avec étiquetage treetagger*)

2016/2017

LYCEE MLJ

BASE LY-2-2016-MLJ-C1-D1 pour iTrameur (avec étiquetage treetagger*)

Aucune base disponible pour le moment...

Aucune base disponible pour le moment...

Aucune base disponible pour le moment...