La numérisation des chartes originales du Haut Moyen Âge conservées en France
Marie-José Gasse-Grandjean
ARTEM-CNRS, Nancy
1. Le but de cette numérisation
3. Les limites de cette numérisation
1. Le but de cette numérisation
Le but premier de cette numérisation est de disposer sur support informatique de la reproduction des 5 000 chartes originales du haut Moyen Âge conservées en France. Car l'édition de notre base de données se fera sur support informatique, soit sur CD-Rom, soit sur Internet.
Cette numérisation rendra l'outil bien plus performant et ouvrira de nouvelles perspectives de recherche :
- La reproduction permet tout d'abord la vérification. Chaque jour, nous retournons nous-mêmes à la reproduction des documents pour faire une vérification, et les chercheurs qui font une interrogation sur notre base ont toujours besoin de notre collection photographique. Le traitement informatique des données, indissociable d'une normalisation, dissimule certaines informations que seule la reproduction restitue. Citons par exemple les additions que nous ne signalons pas spécifiquement dans les textes, ou bien les mots qui apparaissent parfois coupés, parfois collés et pour lesquels nous avons dû choisir une forme orthographique.
- Mais surtout la reproduction permettra des études de l'aspect externe des chartes à une échelle difficilement envisageable jusqu'à présent. En travaillant sur les chrismes, qui sont codés dans nos transcriptions et donc faciles à localiser, j'ai mesuré l'apport d'une base photographique couplée à une base textuelle pour l'étude des graphismes. La comparaison est facilitée et prend une nouvelle dimension. On peut de la même façon envisager des études variées en matière d'écriture, pour l'étude des abréviations, de la ponctuation par exemple, ou en matière de mise en page, avec l'étude des initiales.
2. Les aspects techniques
Techniquement, nous avons choisi de numériser les documents nous-mêmes et nous utilisons un scanner A3 et trois logiciels : Idealist, DeskScan et PictureIt.
Le logiciel Idealist 2 choisi pour gérer le documentaire et les textes de ces chartes originales, a été retenu également pour gérer les reproductions de chartes, sous la forme d'une autre base couplée à la première. Un certain nombre de rubriques, dont évidemment le numéro d'ordre propre à notre base de données, servent de pivots entre les différentes bases de données.
Cette base Photos sous Idealist présente ainsi trois zones distinctes (voir ill. 1). Dans la zone A, un ensemble de menus et boutons propres au logiciel Idealist servent à la gestion de la base de données, l'indexation et les recherches croisées. En B, des rubriques documentaires reprennent des données « pivot » dont le numéro Artem. En C, une série de boutons facilitent la numérisation. Ils permettent de lancer l'interface PaperPort (de Visioneer) et le logiciel du scanner (« Scanner »), de retoucher les images scannées (« Modifier ») et finalement, comme dans toute base de données, d'enregistrer le travail accompli (« Document numérisé », « Clichés »).
Fig. 1. La numérisation des chartes originales
antérieures à 1121 et conservées en France.
Base photographique de l'ARTEM/UMR 7002
Moyen Âge - 27/03/2001
Le logiciel utilisé pour numériser est HP DeskScan, notre scanner étant un scanner HP (ScanJet 6100C). Nous scannons en noir et blanc, avec 256 niveaux de gris et avec une résolution de 600 points par pouce (600 ppp).
Le logiciel utilisé pour la retouche des images est PictureIt. C'est un logiciel de retouches d'images grand public mais qui offre deux avantages : il est simple à utiliser - le volume à scanner, près de 5 000 chartes, a fait privilégier des commandes simples - ; il offre une option réglage de la netteté très adaptée à certains clichés noir et blanc. Ensuite les images traitées sous PictureIt peuvent être enregistrées dans de nombreux formats. Nous avons retenu deux formats : le format JPEG pour l'affichage à l'écran (moins gourmand en octets, avec des fichiers de 300 à 600 Ko), et le format BMP pour l'archivage.
Pratiquement, je scanne les images sous HPDeskScan sans utiliser beaucoup les options de réglage de ce logiciel. Je retiens seulement l'option « Photo en noir et blanc affinée » et je recadre la charte de façon à supprimer tout ce qui n'est pas la charte elle-même (j'y reviendrai). Ensuite l'interface PaperPort me permet de nommer et d'exporter l'image vers Idealist. Sous PictureIt, je retouche l'image s'il y a lieu (il faut souvent le faire). Trois fonctions du logiciel me sont particulièrement utiles : « Taille et position », « Retouches » et « Netteté ». Je dois parfois repositionner l'image : je redresse les textes pour une meilleure lecture ; les grands formats sont scannés verticalement, il faut donc les faire pivoter. L'option « Retouches » permet très facilement de gommer les numéros de lignes souvent fâcheusement ajoutés sur le cliché même, au moment de la transcription, ou toute autre avarie. Enfin je peux au besoin augmenter la netteté de l'image grâce à un curseur très commode. Tout cela en agrandissant considérablement l'image de façon à intervenir très précisément.
Je scanne, j'améliore la lisibilité du document et j'intègre sa reproduction dans la base documentaire et textuelle. La tâche n'est cependant pas aussi aisée qu'il peut paraître car le corpus d'images à traiter est très particulier. Cette numérisation a ses limites.
3. Les limites de cette numérisation
Il faut tout d'abord évoquer le problème de la masse des documents à traiter, soit une collection de 5 000 photos ou microfilms noir et blanc. L'importance du corpus a fait privilégier des manipulations simples, mais le travail reste long. Aujourd'hui, 10 % des documents sont numérisés, soit 500 chartes. Par ailleurs, ce corpus a été constitué peu à peu, par commandes auprès des services d'archives ou campagnes photographiques assurées par des membres de l'équipe. Nous disposons finalement d'un ensemble très disparate quant à la qualité de la prise de vue, aux formats et au papier utilisé pour les tirages. Ce sont autant de situations qu'il faut gérer au coup par coup, pour lesquelles une adaptation est nécessaire.
Au fur et à mesure de l'avancement du travail, nous sommes confrontés à des problèmes :
- de format : les clichés de format trop réduit ou les clichés qui ont un module d'écriture très petit sont difficiles à lire à l'écran une fois numérisés. Et l'agrandissement est vite inutilisable (au-delà de 2 x, le texte est illisible).
- d'encres denses, de parchemins salis ou de clichés sombres, qui donnent très vite des empâtements. Je pense par exemple à un acte 3 dont le dernier mot est écrit sur une languette très noircie ; à la numérisation, ce mot disparaît. À l'opposé, un cliché trop clair donnera lui aussi une image médiocre. L'idéal est le cliché présentant un fort contraste, avec un fond bien clair et une écriture bien foncée (voir ill. 2). La numérisation n'entraîne alors aucune perte de définition visible à l'oeil. Ce sont cependant des situations d'exception.
La base de l'Artem est principalement un outil de recherche textuelle et documentaire. L'Artem continue à privilégier les études de vocabulaire, ce pour quoi cette base a été créée. Mais avec la numérisation des chartes antérieures à 1121, cette base permettra de travailler sur des corpus d'actes très larges qui ne pourraient jamais être « réunis » sans le support numérique, et qui pourront ouvrir de nouvelles voies de recherche.
Fig. 2 - Deux exemples de chartes scannées
Paris, BNF, ms. lat. 17715 n° 41
Charte de donation d'Hardradus pour l'abbaye de Cluny, 997
(Artem 1873)
Cliché avec un bon contraste
3. Artem 2554 : Paris, Bibliothèque nationale de France, n.a.l. 2573, n° 11 : Honestus, archevêque de Ravenne, concède en emphythéose à Paul de Traversaria, fils de Pierre, le domaine de « Roditula », situé au territoire de Forli, et divers biens dans la cité de Ravenne (981, 16 septembre).
AD Loir-et-Cher, 16 H 120 n° 6
Notice du comte de Blois Etienne pour l'abbaye de Marmoutier, 1092
(Artem 2301)
Cliché numérique où le fond empâte l'écriture
1 . Une série d'instruments de travail (liste chronologique, tables des auteurs, des destinataires, des genres diplomatiques, de la tradition, des sceaux, des chirographes et des cotes) est actuellement sous presse (La diplomatique française du haut Moyen Âge. Inventaire des chartes originales antérieures à 1121 conservées en France, sous la direction de Benoît-Michel Tock, par Michèle Courtois et Marie-José Gasse-Grandjean, avec la collaboration de Philippe Demonty, Brepols, 2001 [Collection Artem]).