3.1. Reconstruction de la nomenclature Dees
3.2. Distribution des 200 textes de l’AD87 sur le maillage géographique Dees
3.3. Implémentation en vecteurs géographiques
3.3.1. Identification et projection géographique des 650 localités, ensuite des ssR, sR et R
3.1. Reconstruction de la nomenclature Dees
Il a été indiqué en section 1.3 que la nomenclature géographique de Dees qui a fondé les deux atlas AD80 et AD87 est composée de 87 points maillant l’espace géographique de l’afr. Or le lecteur des deux atlas ne voit jamais ces 87 points : les cartes affichent 29 segments (28 pour l’AD80).[1]
Les deux atlas ne sont donc, pour le maillage géographique comme pour le reste, que la pointe visible de l’iceberg Dees que nous cherchons à reconstruire. De fait l’équipe Dees a travaillé sur un maillage géographique en trois niveaux de granularité, dont le niveau intermédiaire, les sous-Régions, est celui des 87 points dont il a été question. Le tableau (3) résume la situation.
(3) maillage géographique Dees | |||
code géographique Dees | |||
a. | 29 Régions | (R) | 1 à 29 |
b. | 87 sous-Régions | (sR) | 1 à 86 |
c. | 232 sous-sous-Régions | (ssR) | 10 à 300 (il existe des chiffres non utilisés) |
Il s’agit là en tout cas du résultat de la reconstruction que nous avons faite de la nomenclature Dees. Elle est basée sur les informations fournies par Piet van Reenen en 2017-18, et notamment sur un document dactylographié daté de 1982. Il est à noter que la nomenclature géographique définie dans ce document ne connaît que 86 sR, la 87e ayant été ajoutée ultérieurement et ne jouant aucun rôle dans l’AD87 [1]. L’ADE22 s’en tient donc à cette liste de 86 sR.
Le tableau complet des correspondances entre R, sR et ssR est disponible ici, et le tableau (4) en présente un extrait.
(4) extrait de la nomenclature géographique Dees | |||||
R | appellation | sR | appellation | ssR | appellation |
10 | Normandie | 22 | absence d’appellation | 100 | Normandie |
23 | Manche | 101 | Manche | ||
102 | Orne | ||||
103 | Calvados | ||||
24 | Eure | 104 | Eure | ||
25 | Seine-Maritime | 105 | Seine-Maritime | ||
106 | Eure ouest (Verneuil, Bernay, Pont-Audemer, St.Sébastien, Grosley) | ||||
107 | Eure est (Gisors, Pacy, Louviers, Pont de l’Arche, Ivry-la-Bataille) | ||||
108 | Seine-Mme. sud-ouest (Rouen, Caudebec) | ||||
109 | Seine-Mme. nord-est (Eu, Tréport, Neufchâtel, Bec de Mortaiser, Pays de Caux, Mesnil-Allard, Mesnil-Sorel) | ||||
11 | Somme, Pas-de-Calais | 26 | absence d’appellation | 110 | Somme/Pas-de-Calais |
26 | absence d’appellation | 111 | Somme | ||
26 | absence d’appellation | 112 | Pas-de-Calais | ||
27 | Somme centre + sud | 113 | Somme centre, sud (Amiens, Corbie, Boves, Montdidier, Picquiny, Roye, Nesle) | ||
28 | Somme nord-ouest | 114 | Somme nord-ouest (Abbeville, Rue, Doullens, Vallines, Nouvion, Beauquesne) | ||
115 | Somme nord-est (Péronne, Bray-sur-Somme, Cappy, Albert, Athiers, Lihons-en-Santerre) | ||||
29 | Pas-de-Calais sud-est | 116 | Pas-de-Calais sud-est (Arras, Croisiles, Beaumetz, Avesnes, Lens, Bapaumes) | ||
117 | Pas-de-Calais centre (St.Pol, Hesdin, Heuchin, Maizières) | ||||
30 | Pas-de-Calais sud-ouest | 118 | Pas-de-Calais sud-ouest (Montreuil, Etaples, Boulogne, Brimeux, Fiennes, Dommartin) | ||
31 | Pas-de-Calais centre + nord | 119 | Guines, St.Omer, Salperwick, Seninghen, Thérouanne, Aire |
3.2. Distribution des 200 textes de l’AD87 sur le maillage géographique Dees
La nomenclature Dees a bien sûr servi pour toute l’activité de l’équipe, i.e. concernant les chartes autant que les textes littéraires. Elle est beaucoup plus fine que ce que le maillage des 200 textes littéraires de l’AD87 n’exige, ou plutôt, n’autorise. L’AD87 localise les textes dans le maillage de base de l’AD80, à savoir les 86 sR. Dans certains cas, lorsqu’une localisation à ce niveau de précision n’était pas possible, les textes ont été attribués à une R entière: pour ce faire, l’équipe Dees a implémenté dans la nomenclature des 86 sR des sR qui correspondent de fait à des R, telle la sR22 Normandie dont le périmètre géographique est identique à la R10 Normandie. Ces cas où l’appellation d’une sR est identique à l’appellation de sa R sont étudiés en détail en section 3.3.3.
Mais retenons le fait que les 200 textes sont toujours attribués à l’une des 86 sR. Par conséquent, les ssR ne jouent aucun rôle dans la distribution géographique des textes. Elles représentent le maillage de base à partir duquel l’AD80 a été structuré en 86 sR (ou 85 à l’époque), mais leur granularité fine n’est pas utilisée pour la localisation des textes littéraires.
Les ssR ne jouant donc aucun rôle dans l’AD87, elles sont également inopérationnelles pour l’ADE22, qui ne les prend pas en compte. Néanmoins, le travail de leur reconstruction à partir du document 1982 de Piet van Reenen ayant été fait et implémenté en cartographie, elles sont présentées en section 3.3.1.
Le tableau (5) montre ce qui est opérationnel pour le fonctionnement de l’AD87 et donc de l’ADE22 : l’alignement des R et sR ainsi que le nombre de textes représentant les sR. Le tableau général des 200 textes (voir section 4.2) indique de quels textes il s’agit.
(5) distribution des 200 textes de l’AD87 sur les sR et R | |||||
R | nb mots R | sR | nb mots sR | nb textes | |
1 | 34874 | 2 | 34874 | 1 | |
2 | 77240 | 4 | 63668 | 3 | |
5 | 13572 | 3 | |||
4 | 12727 | 10 | 12727 | 1 | |
5 | 36610 | 11 | 36610 | 1 | |
6 | 7798 | 16 | 7798 | 1 | |
10 | 180844 | 22 | 65408 | 6 | |
23 | 1390 | 1 | |||
24 | 114046 | 9 | |||
11 | 305929 | 26 | 78199 | 8 | |
27 | 17660 | 2 | |||
29 | 181812 | 21 | |||
31 | 28258 | 5 | |||
12 | 65419 | 32 | 65419 | 5 | |
13 | 149814 | 37 | 149814 | 11 | |
14 | 15831 | 40 | 15831 | 2 | |
15 | 29889 | 44 | 29889 | 3 | |
16 | 117616 | 45 | 117616 | 11 | |
17 | 56412 | 50 | 56412 | 5 | |
18 | 92956 | 51 | 17074 | 1 | |
52 | 58740 | 6 | |||
53 | 17142 | 1 | |||
19 | 167059 | 54 | 24115 | 2 | |
55 | 47946 | 4 | |||
57 | 85545 | 7 | |||
56 | 9453 | 1 | |||
20 | 42249 | 58 | 42249 | 5 | |
21 | 112712 | 59 | 112712 | 10 | |
22 | 292345 | 61 | 266822 | 21 | |
63 | 25523 | 2 | |||
23 | 25837 | 67 | 25837 | 3 | |
24 | 28059 | 70 | 20602 | 1 | |
72 | 7457 | 1 | |||
25 | 8737 | 75 | 8737 | 1 | |
26 | 55872 | 77 | 21040 | 1 | |
79 | 22337 | 2 | |||
78 | 12495 | 1 | |||
27 | 27775 | 81 | 8727 | 1 | |
84 | 19048 | 2 | |||
28 | 206689 | 85 | 206689 | 20 | |
29 | 62903 | 86 | 62903 | 8 | |
TOT | 2.214.196 | 2.214.196 | 200 |
Il apparaît que quatre régions sur 29 ne sont pas représentées : aucun texte n’est localisé dans les régions 3 Vienne, 7 Maine-et-Loire, 8 Mayenne, Sarthe et 9 Bretagne. S’agissant des sR, 41 sur 87, soit moins de la moitié, sont représentées par au moins un texte.
Enfin, il est encore utile de mentionner que sur les 25 régions représentées, seize ne le sont que par une seule sR, alors que neuf régions sont nourries par davantage de sR (entre deux et quatre). C’est donc cela qui fera la différence entre l’affichage cartographique par R et par sR.
La distribution géographique des zones blanches de l’AD87 pour lesquelles aucun des 200 textes n’est localisé est montrée sous (6) pour les R, sous (7) pour les sR.
(6) | AD87 : zones blanches parmi les régions (4 sur 29) |
(7) | AD87 : zones blanches parmi les sR |
La carte des R sous (6) ne variera pas et ainsi constitue le fond de carte pour l’affichage par R de ce que l’utilisateur aura défini. La carte des sous-régions sous (7) en revanche souffrira des modifications concernant les zones blanches, dues aux sR que nous appelons englobantes, i.e. qui recouvrent le même périmètre que leurs R. Elles sont étudiées en section 3.3.2 où la carte finale des zones blanches est ainsi établie.
3.3. Implémentation en vecteurs géographiques
3.3.1. Identification et projection géographique des 650 localités, ensuite des ssR, sR et R
Il a été mentionné que la nomenclature géographique de l’équipe Dees a été reconstruite à partir du document de 1982 de Piet van Reenen (2017-18). Il en va de même pour l’implémentation en vecteurs géographiques de cette nomenclature, qui par ailleurs s’est appuyée sur des cartes des deux atlas Dees (AD80 et AD87) ainsi que sur des cartes publiées dans Dees (1984, 1985, 1986). Basé sur ces sources, la nomenclature reconstruite a été projetée à l’aide du système d’information géographique QGIS. Puis à partir des informations fournies par le document de Piet van Reenen, plusieurs niveaux de découpage ont été créés en repartant des localisations les plus détaillées, i.e. les ssR (cf. la dernière colonne sous (4)).
Les indications géographiques contenues dans le document de Piet van Reenen renvoient soit à une région (ex. Bourgogne), soit à un département (ex. Somme, Pas-de-Calais, Oise, etc.), soit à une partie de département (ex. Somme nord-ouest) accompagné ou non d’une énumération de localités, soit à une seule énumération de localités (ex. Loudun, Trois-Moûtier), voire à une seule localité (ex. Lusignan). Ces localités, au nombre de 650, ont également été géolocalisées sous forme de points, permettant de créer, par regroupement, des polygones circonscrits. Le résultat est montré sous (8).
(8) | localisation : Régions, sous-Régions, sous-sous-Régions, villes |
Concrètement, l’exemple sous (9) montre que le département de l’Oise (R = 12, sR = 32, ssR =120) est divisé en 4 sR (33, 34, 35, 36), elles-mêmes subdivisées en 9 ssR (n°121 à 129) contenant de une à quinze localités, pour un total de 75 localités.
(9) Exemples de polygones des ssR 121 à 129 (Oise), chaque point représente une localité
Mais, mises côte-à-côte, les différentes entités créées sur la base des localités ne forment pas toujours une couverture géographique complète : ainsi le département de la Vienne (R = 02, sR = 6, ssR = 30), subdivisé en 7 ssR dont chacune n’est formée que par une seule localité (tableau (10)), a un grand espace vide au sud montré en damier sous (11) qui n’est pas dénommé dans la nomenclature.
(10) | extrait de la nomenclature géographique Dees | |||||
R | sR | ssR | ||||
03 | Vienne | 06 | Vienne | 30 | Vienne | |
31 | Poitiers | |||||
32 | Nouaille | |||||
33 | Lusignan | |||||
07 | absence d’appellation | 34 | Mirebeau | |||
08 | absence d’appellation | 35 | Loudun, Trois-Moûtiers | |||
09 | absence d’appellation | 36 | Châtellerault | |||
37 | La Roche-Posay |
(11) | Exemple du Département de la Vienne |
Nous avons attribué un code à ces espaces qui sont blancs dans la nomenclature Dees d’origine, ici 306 pour Vienne Sud. Les nouveaux codes attribués mentionnent d’abord le numéro de la R, puis le numéro de la sR englobante de la R (la notion « sR englobante » est expliquée dans la section suivante). Ici il s’agit de la R3 (premier chiffre du nouveau code) dont la sR englobante est la sR6 (d’où les deux chiffres suivants 06).
Il en va de même par exemple pour le segment représentant les deux départements Orne et Calvados au sein de la R10 Normandie: absent chez Dees, il reçoit le code 1022 puisqu’il s’agit de la R10, et que la sR englobante de cette R est la sR22.
Tous les codes et appellations nouvellement attribués sont répertoriés dans notre nomenclature géographique Dees raisonnée, expliquée dans la section suivante.
Outre les espaces blancs auxquels Dees n’a pas attribué de code, il y avait d’autres questions à résoudre, comme par exemple le statut très varié des entités géographiques comme les départements qui peuvent être une R à part entière (Oise, Vienne, etc.), ou une sR (Vendée, Loir-et-Cher, etc.) ou même une ssR (Charente, Indre, etc.). Il en va de même pour les provinces comme la Normandie, la Bourgogne ou la Franche-Comté.
Enfin, les regroupements à créer ne sont pas toujours allés de soi, car plusieurs interprétations sont possibles à partir du document dactylographié 1982 de Piet van Reenen et de la manière dont les indications géographiques sont présentées et articulées sous forme d’alinéas. Cependant le positionnement des résultats sur les différentes cartes proposées par Dees (cf. cartes (1) et (2) de la section 1.3) ont été de précieux indicateurs. Après évaluation de l’ensemble du matériel disponible, nous avons pris des décisions de classement et le résultat est notre nomenclature géographique Dees raisonnée. Les décisions prises sont identifiées dans ce document.
La principale difficulté est venue du fait que toutes les R comportent une sR qui a la même appellation que la R dont elle est censée être une sous-division. Ainsi la R10 Normandie est composée de quatre sR : Normandie (sR22), Manche (sR23), Eure (sR24) et Seine-Maritime (sR25). La sR22 Normandie semble donc être identique à la R10 Normandie.
Il en va de même pour la relation entre sR et ssR, les dernières pouvant avoir la même appellation que les premières. Cela pose un problème de hiérarchie lorsqu’il s’agit de la projection des données en géographie : si le périmètre géographique associé à la sR22 Normandie est le même que celui de la R10 Normandie, comment comptabiliser les textes localisés dans la sR22 Normandie par rapport aux textes des autres sR ? Si par exemple la requête usager produit des données localisées dans la sR23 Manche, la sR24 Eure et la sR22 Normandie, comment afficher celles de la sR22 Normandie sur la carte par sR ?
La raison pour laquelle il existe des sR qui portent la même appellation que leur R est que l’équipe Dees n’a pas voulu prendre d’engagement sur une localisation plus précise des textes en question (chartes et par la suite textes littéraires). C’est ce que nous supposions au vu de la situation générale, et Piet van Reenen a confirmé cette interprétation en 2022.
Ainsi les textes associés à la sR22 Normandie proviennent bien d’un segment géographique constitutif de la Normandie, mais au vu des résultats de la localisation pratiquée (voir section 1.3), l’équipe Dees n’a pas pu les localiser à une granularité plus fine que « Normandie ». C’est donc dire que la granularité de la localisation des textes est en 87 sR, sauf pour les sR englobantes, où elle est de fait au niveau d’une R.
Cette interprétation implique qu’un texte localisé en sR22 Normandie a une probabilité égale de provenir de fait de l’une des trois autres sR (sR23 Manche, la sR24 Eure, sR25 Seine-Maritime), ou encore du segment géographique représentant le Calvados et l’Orne qui dans la nomenclature Dees d’origine n’existe pas et à laquelle nous avons attribué un code sR (voir section 3.3.1). Le nombre d’occurrences contenu dans le résultat de la recherche usager sera donc divisé par 4 et ajouté au nombre d’occurrences de chacune des 4 autres segments.
Cela signifie que des segments blancs pour lesquels nous n’avons pas de données propres (absence de textes) reçoivent des données par les sR englobantes. Il en va ainsi pour les sR qui ne représentent pas de textes (en Normandie, la sR25 Seine-Maritime), autant que pour les segments qui manquent dans la nomenclature Dees d’origine (le Calvados et l’Orne dans notre exemple, segment auquel nous avons attribué le code 1022). Si donc la requête usager produit n occurrences pour la sR22 Normandie, x occurrences pour la sR23 Manche et y occurrences pour la sR24 Eure, la carte affichera le nombre d’occurrences suivant :
(12) | répartition des données des sR englobantes : cas de la sR22 Normandie | ||||
sR | englo-bante |
appellation | nb occurrences propre | nombre occurrences affichées | |
sR22 | oui | Normandie | n | – | |
sR23 | non | Manche | x | x + n/4 | |
sR24 | non | Eure | y | y + n/4 | |
sR25 | non | Seine-Maritime | – | n/4 | |
sR1022 | non | Calvados + Orne | – | n/4 |
La formule qui permet de calculer le nombre d’occurrences à afficher pour une sR non-englobante est donc la suivante :
x + n / nbseg
où x est le nombre d’occurrences de la sR affichée (zéro au cas où elle ne possède pas de textes), n le nombre d’occurrences de la sR englobante et nbseg le nombre de segments géographiques contenus dans la R (quatre dans le cas de la Normandie). Il va de soi que les sR englobantes elles-mêmes ne sont pas affichées sur la carte des sR du tout : leurs occurrences sont redistribuées sur les vraies composantes géographiques de leur R.
La carte sous (13) montre la situation pour la Normandie.
(13) | affichage géographique des données de la sR22 Normandie |
Il existe 12 sR englobantes qui ont pour effet de couvrir des zones blanches : elles fournissent, au sein de leur R, des données pour des sR qui ne possèdent pas de texte. Voici sous (14) la liste de ces 12 sR englobantes qui possèdent des textes et redistribuent leurs données à leurs sR sœurs.
(14) | les 12 sR englobantes qui possèdent des textes et redistribuent leurs données | ||
R | sR englobante | sR cibles de la redistribution | |
5 Orléanais | 11 Orléanais | 12, 13, 511 | |
18 Marne | 51 Marne | 1851, 52, 53 | |
19 Région parisienne | 54 Région parisienne | 1954, 55, 56, 57 | |
10 Normandie | 22 Normandie | 23, 1022, 24, 25 | |
11 Somme, Pas-de-Calais | 26 Somme, Pas-de-Calais | 27, 28, 1126, 29, 30, 31 | |
12 Oise | 32 Oise | 33, 34, 35, 36 | |
13 Aisne | 37 Aisne | 38, 1337 | |
16 Wallonie | 45 Wallonie | 46, 1645, 47 | |
24 Moselle, Meurthe-et-Moselle | 70 Moselle, Meurthe-et-Moselle | 71, 72, 73, 74 | |
25 Vosges | 75 Vosges | 76, 2575 | |
26 Franche-Comté | 77 Franche-Comté | 78, 79, 80 | |
27 Bourgogne | 81 Bourgogne | 82, 83, 84 |
Il existe par ailleurs cinq sR englobantes qui possèdent des textes mais au sein de leur R sont la seule sR. La R20 Yonne par exemple comporte une seule sR, qui est englobante : la sR58 Yonne. Dans ce cas, l’affichage sR est identique à l’affichage R : la R ne connaît pas de sous-division et le nombre d’occurrences pour la sR58 Yonne sera toujours identique à celui de la R20 Yonne. Outre le cas de la Yonne, il en va ainsi pour la R4 = sR10 Indre, Cher, la R21 = sR59 Aube, la R28 = sR85 Nièvre, Allier et la R29 = sR86 Angleterre.
Enfin, il y a le cas des sR englobantes qui n’ont pas d’effet sur l’affichage des occurrences retournés par les requêtes puisqu’elles ne représentent aucun texte. Ainsi la R2 Vendée, Deux-Sèvres est faite de trois sR : la sR englobante sR3 Vendée, Deux-Sèvres, la sR4 Vendée et la sR5 Deux-Sèvres. Les deux dernières sR ont des textes, mais la sR englobante n’en possède pas. Par conséquent elle n’aura jamais d’incidence sur l’affichage des résultats de requête.
Les R dont les sR englobantes ne possèdent pas de textes sont au nombre de 12. Ce qui fait avec les 17 R dont les sR englobantes représentent des textes (12 avec, 5 sans redistribution) le compte du total des 29 R.
La carte sous (15) montre la réduction des zones blanches obtenue par la redistribution des données des sR englobantes : les segments en vert clair ne possèdent pas de texte, mais reçoivent des données par une sR englobante. Les segments en vert moyen ont des textes, mais ne reçoivent pas de données supplémentaires par la redistribution depuis les sR englobantes. Enfin, les segments en vert foncé possèdent des textes et bénéficient d’un report depuis une sR englobante.
(15) | carte par sR : segments couverts par des données (et zones blanches) |
vert foncé : avec textes propres, reçoit une redistribution d’une sR englobante | |
vert moyen : avec textes propres, ne reçoit pas de redistribution d’une sR englobante | |
vert clair : sans texte propre, mais reçoit des données par la redistribution d’une sR englobante | |
L’AD80 était fondé sur 28 régions et 85 sR (Goebl 2011 : 666), qui ont été portées à 29 régions et 87 sR pour l’AD87 (Dees 1987 : vx). Absente en 1980, l’Angleterre a donné la région 29 et la sR87 en 1987. Ayant étudié les 222 liasses papier de l’héritage papier de Dees datées de 1983 (voir section 1.5), Goebl (2011 : 668) a pu identifier l’autre sR ajoutée : sR86 « Aisne sud ». Le document dactylographié daté de 1982 qui fonde notre reconstruction de la nomenclature Dees ne fournit que 86 sR, la 86e étant l’Angleterre, celle identifiée par Goebl (« Aisne sud ») étant absente. L’ADE22 s’en tient à cette liste de 86 sR. Tout cela n’a aucune incidence pratique puisque « Aisne sud » n’est représenté par aucun texte.