Approche Discursive et Génétique des Brouillons :
Les Ecrits Des Travailleurs Sociaux Dans Le Champ De L’Enfance En Danger

Le corpus Brouillons

Le corpus de brouillons a été recueilli auprès de nos partenaires du S.A.F.E. de Caen. Nous les remercions pour leur participation et pour l’accès au corpus. Les textes sur lesquelles nous travaillons ont été anonymés. Compte tenu de la nature du corpus et de sa sensibilité sociale, celui-ci n’est pas en accès libre. Si vous êtes intéressés par les données ci-dessous, vous pouvez contacter georgeta.cislaru@univ-paris3.fr et serge.fleury@univ-paris3.fr.

Présentation du corpus

Etat de départ (Version 1)

85 fichiers au format MS-Word répartis en 11 dossiers. Chaque dossier regroupe les différentes versions d’un même fichier :

Dossier

nombre de version

1

24

2

5

3

12

4

3

5

16

6

5

7

5

8

2

9

3

10

6

11

4

Etat de départ (Version 2)

124 fichiers au format MS-Word répartis en 12 dossiers. Chaque dossier regroupe les différentes versions d’un même fichier :

Dossier

nombre de version

1

6

2

30

3

5

4

4

5

41

6

4

7

2

8

5

9

6

10

10

11

4

12

7

Reformatage des données

L’ensemble des fichiers a été transformé automatiquement par programme au format TXT brut en reproduisant l’organisation initiale des dossiers.  Les noms de répertoire et de fichiers ont été « normalisés ». Un programme (écrit en perl) parcourt l’arborescence des dossiers et pour chaque fichier word rencontré :

- Le programme transforme le fichier word en txt brut (via antiword : programme unix).

- Les données du fichier sont anonymisées.

Chaque dossier contient donc au final les différents états au format TXT et le fichier global concaténant l’ensemble des états (pour Lexico3 et Le Trameur).

Explorations du corpus (version 1)

Dossier n°1

  • Alignement sur un état de brouillon (24 fichiers) : V1, V2
  • Chronologie de la variation (24 fichiers) : V1, V2
  • Chronologie des Segments répétés : rapport produit par le Trameur sur le corpus constitué par les 24 états
  • Chronologie de la variation des Segments répétés : V1

Dossier n°2

  • Alignement sur un état de brouillon (12 fichiers) : V1, V2
  • Chronologie de la variation (12 fichiers) : V1, V2
  • Chronologie des Segments répétés : rapport produit par le Trameur sur le corpus constitué par les 12 états
  • Chronologie de la variation des Segments répétés : V1

Dossier n°3

  • Alignement sur un état de brouillon (16 fichiers) : V1
  • Chronologie de la variation (16 fichiers) : V1
  • Chronologie des Segments répétés : rapport produit par le Trameur sur le corpus constitué par les 16 états
  • Chronologie de la variation des Segments répétés : V1

Explorations du corpus (version 2)

Dossier n°1 (echeance-bilan)

  • Alignement sur un état de brouillon (6 fichiers) : V1
  • Chronologie de la variation (6 fichiers) : V1

Dossier n°1 (plan-synthèse)

  • Alignement sur un état de brouillon (30 fichiers) : V1
  • Chronologie de la variation (30 fichiers) : V1

Dossier n°2 (plan-synthèse)

  • Alignement sur un état de brouillon (13 sur 41 fichiers) : V1
  • Chronologie de la variation (13 sur 41 fichiers) : V1

Dossier n°3

  • Alignement sur un état de brouillon (10 fichiers) : V1
  • Chronologie de la variation (10 fichiers) : V1