2. Propos de l’ADE22

 

L’objectif de l’ADE22 est rendre vivant et librement accessible l’AD87 :

  1. l’usager définit les deux groupes de données qu’il souhaite opposer et dont il s’agit d’afficher le contraste à travers l’espace géographique de l’afr ;
  2. à cette fin il fait des recherches dans la base de données des 200 textes sélectionnés et localisés par Dees, au moyen de listes de mots ou d’expressions régulières, qui définissent les deux groupes dont le contraste sera ensuite affiché en diatopie.

Il s’agit ainsi de reconstruire, autant que faire se peut, l’instrument que l’équipe Dees avait mis au point dans les années 80, qui a permis la confection des deux atlas mais n’a jamais été rendu public ni même décrit, et qui est aujourd’hui perdu. Dans la mesure du possible, l’ADE22 cherche donc à rester fidèle au matériau empirique, à la conception et au fonctionnement de l’AD87. Cela se traduit notamment par les propriétés suivantes :

  1. la nomenclature géographique que Dees a établie pour l’AD80 et l’AD87 est reprise par l’ADE22 : l’espace afr. est ainsi divisé en 29 Régions, 86 sous-Régions et 232 sous-sous-Régions (voir section 3.2). Les données sélectionnées par l’utilisateur sont affichées, selon son choix, pour les deux premiers niveaux de granularité (mais non le troisième, voir section 3.2), et en leur sein, dans tous les segments géographiques qui les composent. Il est à noter que si l’équipe Dees fonctionnait bien avec ces trois niveaux, les deux plus fins demeuraient invisibles au public puisque l’AD80 et l’AD87 n’affichent que le niveau Région à 29 segments (28 pour l’AD80, l’Angleterre ayant été ajoutée pour l’AD87, voir section 3.1).
  2. les cartes opposent toujours deux groupes de données, soit par exemple pour la carte no 42 de l’AD87 les formes de l’adj. possessif lour, lours (groupe A) vs. lor, lors, lorz (groupe B).
  3. l’AD87 est un atlas lexical : il oppose des mots ou groupes de mots et affiche leur distribution diatopique. Il en va de même de l’ADE22.
  4. le corpus à la base de l’ADE22 (corpus Dees, ou corpusD infra) est exactement celui qui a fondé l’AD87 : 200 textes choisis par Dees en fonction du coefficient Dees qui indique la fiabilité de la localisation géographique opérée par Dees et son équipe (voir sections 1.4 et 4.2). La version numérisée des textes est celle de l’AD87 qui a été conservée sur des disquettes (voir section 4.1).
  5. Dees a annoté les 200 textes par un code en trois chiffres, le code Dees (codeD), qui indique la catégorie grammaticale de chaque mot (voir section 4.5). Le corpusD contient le codeD, qui a contribué à la lemmatisation des mots. Le codeD est restitué à l’utilisateur dans les résultats des requêtes formulées par celui-ci pour rechercher des items dans le corpusD.

La différence majeure par rapport à l’AD87 est que l’utilisateur peut formuler ses propres requêtes dans le corpusD, et ainsi produire les cartes qui l’intéressent. En d’autres mots, il est à la place à laquelle se trouvait A. Dees et son équipe dans les années 80 lorsqu’ils ont choisi les 517 cartes de l’AD87 selon ce qu’ils jugeaient important. L’AD87 était ainsi figé à tout jamais en fonction des choix et des intérêts de l’équipe de Dees. Le propos de l’ADE22 est de rendre vivant le travail de Dees et de son équipe, de façon à qu’il soit accessible à tous et permette l’affichage diatopique des données librement choisies.