3. Géographie

3.1. Reconstruction de la nomenclature Dees

3.2. Distribution des 200 textes de l’AD87 sur le maillage géographique Dees

3.3. Implémentation en vecteurs géographiques

3.3.1. Identification et projection géographique des 650 localités, ensuite des ssR, sR et R

3.3.2. sR englobantes


3.1. Reconstruction de la nomenclature Dees

Il a été indiqué en section 1.3 que la nomenclature géographique de Dees qui a fondé les deux atlas AD80 et AD87 est composée de 87 points maillant l’espace géographique de l’afr. Or le lecteur des deux atlas ne voit jamais ces 87 points : les cartes affichent 29 segments (28 pour l’AD80).[1]

Les deux atlas ne sont donc, pour le maillage géographique comme pour le reste, que la pointe visible de l’iceberg Dees que nous cherchons à reconstruire. De fait l’équipe Dees a travaillé sur un maillage géographique en trois niveaux de granularité, dont le niveau intermédiaire, les sous-Régions, est celui des 87 points dont il a été question. Le tableau (3) résume la situation.

 

(3) maillage géographique Dees
code géographique Dees
a. 29 Régions (R) 1 à 29
b. 87 sous-Régions (sR) 1 à 86
c. 232 sous-sous-Régions (ssR) 10 à 300 (il existe des chiffres non utilisés)

 

Il s’agit là en tout cas du résultat de la reconstruction que nous avons faite de la nomenclature Dees. Elle est basée sur les informations fournies par Piet van Reenen en 2017-18, et notamment sur un document dactylographié daté de 1982. Il est à noter que la nomenclature géographique définie dans ce document ne connaît que 86 sR, la 87e ayant été ajoutée ultérieurement et ne jouant aucun rôle dans l’AD87 [1]. L’ADE22 s’en tient donc à cette liste de 86 sR.

Le tableau complet des correspondances entre R, sR et ssR est disponible ici, et le tableau (4) en présente un extrait.

 

(4) extrait de la nomenclature géographique Dees
R appellation sR appellation ssR appellation
10 Normandie 22 absence d’appellation 100 Normandie
23 Manche 101 Manche
102 Orne
103 Calvados
24 Eure 104 Eure
25 Seine-Maritime 105 Seine-Maritime
106 Eure ouest (Verneuil, Bernay, Pont-Audemer, St.Sébastien, Grosley)
107 Eure est (Gisors, Pacy, Louviers, Pont de l’Arche, Ivry-la-Bataille)
108 Seine-Mme. sud-ouest (Rouen, Caudebec)
109 Seine-Mme. nord-est (Eu, Tréport, Neufchâtel, Bec de Mortaiser, Pays de Caux,  Mesnil-Allard,  Mesnil-Sorel)
11 Somme, Pas-de-Calais 26 absence d’appellation 110 Somme/Pas-de-Calais
26 absence d’appellation 111 Somme
26 absence d’appellation 112 Pas-de-Calais
27 Somme centre + sud 113 Somme centre, sud (Amiens, Corbie, Boves, Montdidier, Picquiny, Roye, Nesle)
28 Somme nord-ouest 114 Somme nord-ouest (Abbeville, Rue, Doullens, Vallines, Nouvion, Beauquesne)
115 Somme nord-est (Péronne, Bray-sur-Somme, Cappy, Albert, Athiers,  Lihons-en-Santerre)
29 Pas-de-Calais sud-est 116 Pas-de-Calais sud-est (Arras, Croisiles, Beaumetz, Avesnes, Lens, Bapaumes)
117 Pas-de-Calais centre (St.Pol, Hesdin, Heuchin, Maizières)
30 Pas-de-Calais sud-ouest 118 Pas-de-Calais sud-ouest (Montreuil, Etaples, Boulogne, Brimeux,  Fiennes,  Dommartin)
31 Pas-de-Calais centre + nord 119 Guines, St.Omer, Salperwick, Seninghen, Thérouanne, Aire

 

3.2. Distribution des 200 textes de l’AD87 sur le maillage géographique Dees

La nomenclature Dees a bien sûr servi pour toute l’activité de l’équipe, i.e. concernant les chartes autant que les textes littéraires. Elle est beaucoup plus fine que ce que le maillage des 200 textes littéraires de l’AD87 n’exige, ou plutôt, n’autorise. L’AD87 localise les textes dans le maillage de base de l’AD80, à savoir les 86 sR. Dans certains cas, lorsqu’une localisation à ce niveau de précision n’était pas possible, les textes ont été attribués à une R entière: pour ce faire, l’équipe Dees a implémenté dans la nomenclature des 86 sR des sR qui correspondent de fait à des R, telle la sR22 Normandie dont le périmètre géographique est identique à la R10 Normandie. Ces cas où l’appellation d’une sR est identique à l’appellation de sa R sont étudiés en détail en section 3.3.3.

Mais retenons le fait que les 200 textes sont toujours attribués à l’une des 86 sR. Par conséquent, les ssR ne jouent aucun rôle dans la distribution géographique des textes. Elles représentent le maillage de base à partir duquel l’AD80 a été structuré en 86 sR (ou 85 à l’époque), mais leur granularité fine n’est pas utilisée pour la localisation des textes littéraires.

Les ssR ne jouant donc aucun rôle dans l’AD87, elles sont également inopérationnelles pour l’ADE22, qui ne les prend pas en compte. Néanmoins, le travail de leur reconstruction à partir du document 1982 de Piet van Reenen ayant été fait et implémenté en cartographie, elles sont présentées en section 3.3.1.

Le tableau (5) montre ce qui est opérationnel pour le fonctionnement de l’AD87 et donc de l’ADE22 : l’alignement des R et sR ainsi que le nombre de textes représentant les sR. Le tableau général des 200 textes (voir section 4.2) indique de quels textes il s’agit.

 

(5) distribution des 200 textes de l’AD87 sur les sR et R
R nb mots R sR nb mots sR nb textes
1 34874 2 34874 1
2 77240 4 63668 3
5 13572 3
4 12727 10 12727 1
5 36610 11 36610 1
6 7798 16 7798 1
10 180844 22 65408 6
23 1390 1
24 114046 9
11 305929 26 78199 8
27 17660 2
29 181812 21
31 28258 5
12 65419 32 65419 5
13 149814 37 149814 11
14 15831 40 15831 2
15 29889 44 29889 3
16 117616 45 117616 11
17 56412 50 56412 5
18 92956 51 17074 1
52 58740 6
53 17142 1
19 167059 54 24115 2
55 47946 4
57 85545 7
56 9453 1
20 42249 58 42249 5
21 112712 59 112712 10
22 292345 61 266822 21
63 25523 2
23 25837 67 25837 3
24 28059 70 20602 1
72 7457 1
25 8737 75 8737 1
26 55872 77 21040 1
79 22337 2
78 12495 1
27 27775 81 8727 1
84 19048 2
28 206689 85 206689 20
29 62903 86 62903 8
TOT 2.214.196 2.214.196 200

 

Il apparaît que quatre régions sur 29 ne sont pas représentées : aucun texte n’est localisé dans les régions 3 Vienne, 7 Maine-et-Loire, 8 Mayenne, Sarthe et 9 Bretagne. S’agissant des sR, 41 sur 87, soit moins de la moitié, sont représentées par au moins un texte.

Enfin, il est encore utile de mentionner que sur les 25 régions représentées, seize ne le sont que par une seule sR, alors que neuf régions sont nourries par davantage de sR (entre deux et quatre). C’est donc cela qui fera la différence entre l’affichage cartographique par R et par sR.

La distribution géographique des zones blanches de l’AD87 pour lesquelles aucun des 200 textes n’est localisé est montrée sous (6) pour les R, sous (7) pour les sR.

(6) AD87 : zones blanches parmi les régions (4 sur 29)

 

(7) AD87 : zones blanches parmi les sR

La carte des R sous (6) ne variera pas et ainsi constitue le fond de carte pour l’affichage par R de ce que l’utilisateur aura défini. La carte des sous-régions sous (7) en revanche souffrira des modifications concernant les zones blanches, dues aux sR que nous appelons englobantes, i.e. qui recouvrent le même périmètre que leurs R. Elles sont étudiées en section 3.3.2 où la carte finale des zones blanches est ainsi établie.

3.3. Implémentation en vecteurs géographiques

3.3.1. Identification et projection géographique des 650 localités, ensuite des ssR, sR et R

Il a été mentionné que la nomenclature géographique de l’équipe Dees a été reconstruite à partir du document de 1982 de Piet van Reenen (2017-18). Il en va de même pour l’implémentation en vecteurs géographiques de cette nomenclature, qui par ailleurs s’est appuyée sur des cartes des deux atlas Dees (AD80 et AD87) ainsi que sur des cartes publiées dans Dees (1984, 1985, 1986). Basé sur ces sources, la nomenclature reconstruite a été projetée à l’aide du système d’information géographique QGIS. Puis à partir des informations fournies par le document de Piet van Reenen, plusieurs niveaux de découpage ont été créés en repartant des localisations les plus détaillées, i.e. les ssR (cf. la dernière colonne sous (4)).

Les indications géographiques contenues dans le document de Piet van Reenen renvoient soit à une région (ex. Bourgogne), soit à un département (ex. Somme, Pas-de-Calais, Oise, etc.), soit à une partie de département (ex. Somme nord-ouest) accompagné ou non d’une énumération de localités, soit à une seule énumération de localités (ex. Loudun, Trois-Moûtier), voire à une seule localité (ex. Lusignan). Ces localités, au nombre de 650, ont également été géolocalisées sous forme de points, permettant de créer, par regroupement, des polygones circonscrits. Le résultat est montré sous (8).

(8) localisation : Régions, sous-Régions, sous-sous-Régions, villes

Concrètement, l’exemple sous (9) montre que le département de l’Oise (R = 12, sR = 32, ssR =120) est divisé en 4 sR (33, 34, 35, 36), elles-mêmes subdivisées en 9 ssR (n°121 à 129) contenant de une à quinze localités, pour un total de 75 localités.

(9) Exemples de polygones des ssR 121 à 129 (Oise), chaque point représente une localité

Mais, mises côte-à-côte, les différentes entités créées sur la base des localités ne forment pas toujours une couverture géographique complète : ainsi le département de la Vienne (R = 02, sR = 6, ssR = 30), subdivisé en 7 ssR dont chacune n’est formée que par une seule localité (tableau (10)), a un grand espace vide au sud montré en damier sous (11) qui n’est pas dénommé dans la nomenclature.

(10) extrait de la nomenclature géographique Dees
R sR ssR
03 Vienne 06 Vienne 30 Vienne
31 Poitiers
32 Nouaille
33 Lusignan
07 absence d’appellation 34 Mirebeau
08 absence d’appellation 35 Loudun, Trois-Moûtiers
09 absence d’appellation 36 Châtellerault
37 La Roche-Posay

 

(11) Exemple du Département de la Vienne

Nous avons attribué un code à ces espaces qui sont blancs dans la nomenclature Dees d’origine, ici 306 pour Vienne Sud. Les nouveaux codes attribués mentionnent d’abord le numéro de la R, puis le numéro de la sR englobante de la R (la notion « sR englobante » est expliquée dans la section suivante). Ici il s’agit de la R3 (premier chiffre du nouveau code) dont la sR englobante est la sR6 (d’où les deux chiffres suivants 06).

Il en va de même par exemple pour le segment représentant les deux départements Orne et Calvados au sein de la R10 Normandie: absent chez Dees, il reçoit le code 1022 puisqu’il s’agit de la R10, et que la sR englobante de cette R est la sR22.

Tous les codes et appellations nouvellement attribués sont répertoriés dans notre nomenclature géographique Dees raisonnée, expliquée dans la section suivante.

3.3.2. sR englobantes

Outre les espaces blancs auxquels Dees n’a pas attribué de code, il y avait d’autres questions à résoudre, comme par exemple le statut très varié des entités géographiques comme les départements qui peuvent être une R à part entière (Oise, Vienne, etc.), ou une sR (Vendée, Loir-et-Cher, etc.) ou même une ssR (Charente, Indre, etc.). Il en va de même pour les provinces comme la Normandie, la Bourgogne ou la Franche-Comté.

Enfin, les regroupements à créer ne sont pas toujours allés de soi, car plusieurs interprétations sont possibles à partir du document dactylographié 1982 de Piet van Reenen et de la manière dont les indications géographiques sont présentées et articulées sous forme d’alinéas. Cependant le positionnement des résultats sur les différentes cartes proposées par Dees (cf. cartes (1) et (2) de la section 1.3) ont été de précieux indicateurs. Après évaluation de l’ensemble du matériel disponible, nous avons pris des décisions de classement et le résultat est notre nomenclature géographique Dees raisonnée. Les décisions prises sont identifiées dans ce document.

La principale difficulté est venue du fait que toutes les R comportent une sR  qui a la même appellation que la R dont elle est censée être une sous-division. Ainsi la R10 Normandie est composée de quatre sR : Normandie (sR22), Manche (sR23), Eure (sR24) et Seine-Maritime (sR25). La sR22 Normandie semble donc être identique à la R10 Normandie.

Il en va de même pour la relation entre sR et ssR, les dernières pouvant avoir la même appellation que les premières. Cela pose un problème de hiérarchie lorsqu’il s’agit de la projection des données en géographie : si le périmètre géographique associé à la sR22 Normandie est le même que celui de la R10 Normandie, comment comptabiliser les textes localisés dans la sR22 Normandie par rapport aux textes des autres sR ? Si par exemple la requête usager produit des données localisées dans la sR23 Manche, la sR24 Eure et la sR22 Normandie, comment afficher celles de la sR22 Normandie sur la carte par sR ?

La raison pour laquelle il existe des sR qui portent la même appellation que leur R est que l’équipe Dees n’a pas voulu prendre d’engagement sur une localisation plus précise des textes en question (chartes et par la suite textes littéraires). C’est ce que nous supposions au vu de la situation générale, et Piet van Reenen a confirmé cette interprétation en 2022.

Ainsi les textes associés à la sR22 Normandie proviennent bien d’un segment géographique constitutif de la Normandie, mais au vu des résultats de la localisation pratiquée (voir section 1.3), l’équipe Dees n’a pas pu les localiser à une granularité plus fine que « Normandie ». C’est donc dire que la granularité de la localisation des textes est en 87 sR, sauf pour les sR englobantes, où elle est de fait au niveau d’une R.

Cette interprétation implique qu’un texte localisé en sR22 Normandie a une probabilité égale de provenir de fait de l’une des trois autres sR (sR23 Manche, la sR24 Eure, sR25 Seine-Maritime), ou encore du segment géographique représentant le Calvados et l’Orne qui dans la nomenclature Dees d’origine n’existe pas et à laquelle nous avons attribué un code sR (voir section 3.3.1). Le nombre d’occurrences contenu dans le résultat de la recherche usager sera donc divisé par 4 et ajouté au nombre d’occurrences de chacune des 4 autres segments.

Cela signifie que des segments blancs pour lesquels nous n’avons pas de données propres (absence de textes) reçoivent des données par les sR englobantes. Il en va ainsi pour les sR qui ne représentent pas de textes (en Normandie, la sR25 Seine-Maritime), autant que pour les segments qui manquent dans la nomenclature Dees d’origine (le Calvados et l’Orne dans notre exemple, segment auquel nous avons attribué le code 1022). Si donc la requête usager produit n occurrences pour la sR22 Normandie, x occurrences pour la sR23 Manche et y occurrences pour la sR24 Eure, la carte affichera le nombre d’occurrences suivant :

(12) répartition des données des sR englobantes : cas de la sR22 Normandie
sR englo-bante
appellation nb occurrences propre nombre occurrences affichées
sR22 oui Normandie n
sR23 non Manche x x + n/4
sR24 non Eure y y + n/4
sR25 non Seine-Maritime n/4
sR1022 non Calvados + Orne n/4

La formule qui permet de calculer le nombre d’occurrences à afficher pour une sR non-englobante est donc la suivante :

x + n / nbseg

où x est le nombre d’occurrences de la sR affichée (zéro au cas où elle ne possède pas de textes), n le nombre d’occurrences de la sR englobante et nbseg le nombre de segments géographiques contenus dans la R (quatre dans le cas de la Normandie). Il va de soi que les sR englobantes elles-mêmes ne sont pas affichées sur la carte des sR du tout : leurs occurrences sont redistribuées sur les vraies composantes géographiques de leur R.

La carte sous (13) montre la situation pour la Normandie.

(13) affichage géographique des données de la sR22 Normandie

Il existe 12 sR englobantes qui ont pour effet de couvrir des zones blanches : elles fournissent, au sein de leur R, des données pour des sR qui ne possèdent pas de texte. Voici sous (14) la liste de ces 12 sR englobantes qui possèdent des textes et redistribuent leurs données à leurs sR sœurs.

(14) les 12 sR englobantes qui possèdent des textes et redistribuent leurs données
R sR englobante sR cibles de la redistribution
5 Orléanais 11 Orléanais 12, 13, 511
18 Marne 51 Marne 1851, 52, 53
19 Région parisienne 54 Région parisienne 1954, 55, 56, 57
10 Normandie 22 Normandie 23, 1022, 24, 25
11 Somme, Pas-de-Calais 26 Somme, Pas-de-Calais 27, 28, 1126, 29, 30, 31
12 Oise 32 Oise 33, 34, 35, 36
13 Aisne 37 Aisne 38, 1337
16 Wallonie 45 Wallonie 46, 1645, 47
24 Moselle, Meurthe-et-Moselle 70 Moselle, Meurthe-et-Moselle 71, 72, 73, 74
25 Vosges 75 Vosges 76, 2575
26 Franche-Comté 77 Franche-Comté 78, 79, 80
27 Bourgogne 81 Bourgogne 82, 83, 84

 

Il existe par ailleurs cinq sR englobantes qui possèdent des textes mais au sein de leur R sont la seule sR. La R20 Yonne par exemple comporte une seule sR, qui est englobante : la sR58 Yonne. Dans ce cas, l’affichage sR est identique à l’affichage R : la R ne connaît pas de sous-division et le nombre d’occurrences pour la sR58 Yonne sera toujours identique à celui de la R20 Yonne. Outre le cas de la Yonne, il en va ainsi pour la R4 = sR10 Indre, Cher, la R21 = sR59 Aube, la R28 = sR85 Nièvre, Allier et la R29 = sR86 Angleterre.

Enfin, il y a le cas des sR englobantes qui n’ont pas d’effet sur l’affichage des occurrences retournés par les requêtes puisqu’elles ne représentent aucun texte. Ainsi la R2 Vendée, Deux-Sèvres est faite de trois sR : la sR englobante sR3 Vendée, Deux-Sèvres, la sR4 Vendée et la sR5 Deux-Sèvres. Les deux dernières sR ont des textes, mais la sR englobante n’en possède pas. Par conséquent elle n’aura jamais d’incidence sur l’affichage des résultats de requête.

Les R dont les sR englobantes ne possèdent pas de textes sont au nombre de 12. Ce qui fait avec les 17 R dont les sR englobantes représentent des textes (12 avec, 5 sans redistribution) le compte du total des 29 R.

La carte sous (15) montre la réduction des zones blanches obtenue par la redistribution des données des sR englobantes : les segments en vert clair ne possèdent pas de texte, mais reçoivent des données par une sR englobante. Les segments en vert moyen ont des textes, mais ne reçoivent pas de données supplémentaires par la redistribution depuis les sR englobantes. Enfin, les segments en vert foncé possèdent des textes et bénéficient d’un report depuis une sR englobante.

(15) carte par sR : segments couverts par des données (et zones blanches)
vert foncé : avec textes propres, reçoit une redistribution d’une sR englobante
vert moyen : avec textes propres, ne reçoit pas de redistribution d’une sR englobante
vert clair : sans texte propre, mais reçoit des données par la redistribution d’une sR englobante

 

 


[1]

L’AD80 était fondé sur 28 régions et 85 sR (Goebl 2011 : 666), qui ont été portées à 29 régions et 87 sR pour l’AD87 (Dees 1987 : vx). Absente en 1980, l’Angleterre a donné la région 29 et la sR87 en 1987. Ayant étudié les 222 liasses papier de l’héritage papier de Dees datées de 1983 (voir section 1.5), Goebl (2011 : 668) a pu identifier l’autre sR ajoutée : sR86 « Aisne sud ». Le document dactylographié daté de 1982 qui fonde notre reconstruction de la nomenclature Dees ne fournit que 86 sR, la 86e étant l’Angleterre, celle identifiée par Goebl (« Aisne sud ») étant absente. L’ADE22 s’en tient à cette liste de 86 sR. Tout cela n’a aucune incidence pratique puisque « Aisne sud » n’est représenté par aucun texte.