Le projet « Kaiserurkunden in Abbildungen » mené à la Bayerische Staatsbibliothek à Munich et la numérisation et mise en ligne des diplômes de Charles le Chauve
Nicholas Brousseau
nbrous@hotmail.com
Mission Historique Française en Allemagne
Gautier Poupeau
webenc@enc.sorbonne.fr
École nationale des chartes
http://www.enc.sorbonne.fr/
Les projets de numérisation de documents médiévaux en Europe et ailleurs n’ont pas cessé de se multiplier au cours des cinq dernières années [1]. Les approches scientifiques, mais aussi les moyens informatiques et, a fortiori, la qualité des images, varient néanmoins considérablement selon le public auquel ces projets sont destinés et selon les technologies employées. Dans le cadre de cette contribution nous avons voulu, à partir de l’exemple d’un projet de numérisation et de mise en ligne de diplômes du Moyen Âge réalisé par la Bibliothèque d’État de Bavière à Munich (Bayerische Staatsbibliothek) (BSB) [2] , présenter une entreprise similaire portant sur les fac-similés des diplômes de Charles le Chauve (840-877), publiés dans la série des Diplomata Karolinorum [3].
Le projet « Kaiserurkunden in Abbildungen » de la Bayerische Staatsbibliothek à Munich
En Allemagne, la Deutsche Forschungsgemeinschaft (DFG) [4], qui finance publiquement les différentes disciplines scientifiques, a depuis 1995 formulé, à l’usage des bibliothèques et des dépôts d’archives, des règles pour la numérisation des fonds, connues sous le nom de Elektronische Publikationen und Retrospektive Digitalisierung [5]. Il s’agit de lignes directrices définissant le cadre dans lequel les différents projets de numérisation financés en partie ou en totalité par la DFG doivent être préparés. Ces directives visent avant tout à ce que les projets de conservation du patrimoine archivistique allemand respectent des normes minimales de numérisation qui garantissent la qualité des images et l’uniformité du produit fini.
C’est dans cet esprit que la Bayerische Staatsbibliothek de Munich a entrepris de numériser une partie de son très riche fonds de livres anciens et de fac-similés. Pour remplir les objectifs qu’elle s’est fixés, celle-ci s’est dotée d’un Centre de numérisation (Digitalisierungszentrum) [6] chargé de mener à bien les différents projets portant sur la préparation et la publication électronique de livres et de documents d’archives du Moyen Âge jusqu’à nos jours. Au nombre des plus importantes réalisations de ce centre figurent la numérisation et la mise en ligne des Regesta imperii [7] et de l’édition du Décret de Gratien [8] publiée par Emil Friedberg en 1879. Dans ces deux cas, le traitement informatique de la source permet de visionner soit une transcription du texte, soit l’image de la page de l’édition sous deux formats offrant deux niveaux de résolution différents (au format PDF en 600 DPI et au format GIF en 110 DPI). À ces deux projets s’est ajouté celui qui concerne tous les fac-similés des rois et des empereurs germaniques publiés dans le dernier quart du xixe siècle sous la direction d’Heinrich von Sybel [9] et de Theodor von Sickel [10] : les Kaiserurkunden in Abbildungen [11].
Ce projet a été conjointement mené par la chaire de sciences auxiliaires de l’histoire (Lehrstuhl für Geschichtliche Hilfswissenschaften) [12] de l’université Ludwig-Maximilian de Munich [13] et par le Centre de numérisation de la BSB [14]. Ses promoteurs, Markus Brantl et Georg Vogeler, poursuivaient un double objectif.
Il s’agissait d’une part de mettre à la disposition des étudiants et des chercheurs cette importante série de fac-similés, publiée en onze livraisons entre 1880 et 1891 ; elle rassemble pas moins de 364 actes s’étendant de l’époque carolingienne à la fin du xve siècle. Cette collection est ainsi l’une des rares à couvrir l’ensemble de la période médiévale, et représente par conséquent un outil pédagogique d’une grande valeur pour l’enseignement de la diplomatique et de la paléographie. Toutefois peu d’étudiants et de chercheurs hors de l’Allemagne et de l’Autriche pouvaient y accéder, et plusieurs bibliothèques universitaires, même dans ces pays, n’en possèdent pas d’exemplaire. La numérisation et la mise en ligne gratuite des fac-similés via le site web de la BSB permirent ainsi de les rendre accessibles à tous ceux qui désirent s’initier à la diplomatique royale et impériale germanique, ainsi qu’aux diplomatistes qui éprouvent le besoin, à un moment ou à un autre, de comparer tel ou tel caractère externe d’un acte, d’en apprécier l’évolution, d’en observer la stabilité.
Au-delà de l’objectif de l’accessibilité des documents, ce projet se voulait aussi un banc d’essai permettant d’expérimenter diverses solutions techniques pour la mise en ligne d’images de grandes dimensions et de résolution graphique élevée. Deux aspects ont particulièrement retenu l’attention des responsables du projet : est-il possible de mettre à la disposition du public des images de très grand format avec capacité d’agrandissement (zoom) tout en conservant un temps de chargement relativement court et sans sacrifier la qualité graphique ? Dans quelle mesure les différents plugins [15] utilisés pour visualiser les images sur le site web sont-ils acceptés ou rejetés par les ordinateurs des utilisateurs ?
Ainsi, les fac-similés en noir et blanc furent d’abord numérisés à l’aide d’un appareil qui permet le traitement de documents de grand format (A4-A2), du type Zeutschel-Buchscanner [16], avec une résolution de 300 DPI (Dot Per Inch, c’est-à-dire pixel par pouce) en teintes de gris 8 bits. Les grandes dimensions de certains actes ont cependant contraint les responsables à numériser certains diplômes en plusieurs parties qui furent par la suite assemblées à l’aide d’un logiciel de traitement de l’image du type Adobe Photoshop [17]. Enfin, le volume de texte accompagnant l’édition des fac-similés [18], qui fournit divers renseignements sur les documents de la collection, a été numérisé à part, en mode image. L’encodage XML (Extensible Markup Language) avec la DTD TEI (Text Encoding Initiative) a été utilisé pour la mise en ligne du volume de texte et de la base de données qui permet de naviguer d’une image à l’autre. Pour chaque page du commentaire, un hyperlien assure la liaison entre le texte et la banque d’images ; ces dernières apparaissent, en ordre chronologique, dans une nouvelle fenêtre. Chaque image est accompagnée d’éléments descriptifs présentés sous la forme d’une base de données comprenant six champs : la datation de l’acte d’après l’édition des Kaiserurkunden in Abbildungen — et non pas d’après les éditions plus récentes —, le lieu d’émission de l’acte, son auteur juridique, la disposition juridique contenue dans le document, son destinataire et enfin sa photo en format réduit (thumbnail) [19] sur laquelle on clique pour faire apparaître l’acte en plein écran. Pour la visualisation des images, la BSB a choisi le format de compression d’images DjVu [20].
Le format DjVu (prononcé « déjà vu ») [21] s’appuie sur un algorithme de compression de fichiers plus puissant et plus fiable que le format JPEG. Développé depuis 1996 au laboratoire AT&T, il est utilisé dans de nombreux domaines comme la numérisation de documents anciens et historiques et de documents gouvernementaux [22]. De plus, il présente la caractéristique d’être open-source, ce qui signifie que les sources de l’algorithme et de certains programmes sont librement et gratuitement mises à la disposition des utilisateurs [23].
Les images compressées avec cet algorithme sont plus légères et présentent moins de pertes d’informations qu’avec le format JPEG qui demeure le plus fréquemment utilisé sur le Web. À titre d’exemple, un fichier de 604 Ko en JPEG et de 31,2 Mo en TIFF aura un poids de 70 Ko avec DjVu [24]. Le gain est par conséquent considérable et autorise la numérisation et la mise en ligne de documents importants avec une perte de qualité de l’image minimale. De plus, cette technologie permet de séparer l’image en arrière-plan (texture du papier et images) et en avant-plan (texte et ligne du dessin). Ainsi, pour un acte médiéval il devient possible de visualiser uniquement les écritures sans la texture souvent jaunâtre du papier en arrière plan, ce qui facilite grandement la transcription du texte.
Depuis mars 2000, la firme Lizartech [25], en accord avec AT&T, commercialise certains programmes de compression d’images qui utilisent le format DjVu. Elle offre aussi la possibilité, pour les utilisateurs, de télécharger gratuitement à partir de son site web un plugin permettant la visualisation par le navigateur des images à ce format [26]. Il offre aussi la possibilité de zoomer sur l’image de façon assez importante (de 25 % à 1200 %) et de visualiser séparément l’arrière-plan et le premier plan.
Dans certains cas, le poids de l’image peut toutefois rester important, surtout lorsque les images numérisées en haute définition sont de très grandes dimensions, comme dans le cas des diplômes du haut Moyen Âge qui peuvent atteindre plus de 600 millimètres de hauteur et 700 millimètres de largeur. L’utilisation d’une connexion à haute vitesse (fibre optique, câble ou ADSL) devient dès lors quasi indispensable, si l’on veut éviter les longues minutes d’attente pendant le téléchargement de chacune des images. En outre, le recours au plugin DjVu pour la visualisation des actes pose quelques problèmes de compatibilité pour les utilisateurs de Netscape [27] ou de navigateurs autres que Microsoft Internet Explorer [28].
Le projet de numérisation et de mise en ligne des fac-similés édités par Sickel et Sybel ne satisfait qu’en partie aux exigences du diplomatiste et de l’historien. Car, si la qualité des images est excellente, la base de données rudimentaire qui les accompagne ne permet pas d’exploiter pleinement ce formidable matériau mis à la disposition du chercheur : la datation des actes ne tient pas compte des dernières éditions critiques parues dans la collection des Monumenta Germaniae Historica (MGH) et aucun champ n’a été réservé à la critique d’authenticité des documents, pas plus d’ailleurs qu’à la tradition des diplômes. Il faut donc, pour glaner quelques renseignements sur les actes, se reporter aux pages numérisées en mode image de l’édition du volume de texte qui accompagne les fac-similés, ce qui est assez lourd à gérer. Enfin, l’étudiant qui désire parfaire ses connaissances en paléographie ne pourra, faute de transcriptions complètes, se corriger. L’absence du texte des actes empêche en outre toute enquête portant sur le vocabulaire des actes. Le projet munichois constitue néanmoins un excellent banc d’essai pour la mise en ligne de diplômes royaux et impériaux et ouvre la voie à de nouveaux projets utilisant des techniques et des technologies similaires.
Le projet de numérisation des actes de Charles le Chauve
Les problèmes que soulèvent la numérisation et la mise en ligne de documents diplomatiques ont suscité depuis cinq ans de nombreuses réflexions [29]. Comment en effet fournir un matériau diplomatique au chercheur en ne sacrifiant ni la qualité des images, ni le texte édité ? Est-il pertinent d’adjoindre à ces deux éléments une base de données qui fournirait divers renseignements sur l’authenticité des actes, sur leur tradition, sur leur contenu juridique, sur leur forme diplomatique ? Quelle place enfin accorder aux caractères externes ? En s’inspirant du projet des Kaiserurkunden in Abbildungen de la BSB et d’autres programmes qui ont cours en Allemagne et en France, tel celui d’édition du Cartulaire blanc [30] de Saint-Denis mené par l’École nationale des chartes [31], nous avons donc voulu proposer un projet de mise en ligne des diplômes originaux de Charles le Chauve (840-877) à partir des fac-similés des actes. Cette entreprise, actuellement en chantier [32], permettrait de mettre à la disposition de la communauté scientifique les images numérisées des diplômes et leur transcription, accompagnées d’une base de données fournissant plusieurs informations sur les documents.
Dans un premier temps, il s’est agi de numériser les fac-similés des diplômes à l’aide d’un scanner A3 (Tiff 600 DPI) et du logiciel de traitement de l’image Adobe Photoshop. Les images ont ensuite été stockées sur cédéroms, compressées au format DjVu. La base de données qui accompagnera les reproductions et permettra d’effectuer des recherches croisées par mot-clé et des tris combinant plusieurs champs, a été nourrie des renseignements que fournissent l’édition des actes et une récente thèse de l’École des chartes [33]. Cette base a été conçue à l’aide du logiciel File Maker et comprend quatorze champs répartis en trois sections : l’identification de l’acte, la description du contenu et du format, et les mentions de chancellerie [34]. On trouve ainsi, dans la première section, des indications concernant le numéro du diplôme dans l’édition des actes de la collection des Chartes et diplômes relatifs à l’histoire de France [35], la date exprimée en nouveau style, le lieu où l’acte fut donné, sa tradition, le fonds où il était conservé avant la sécularisation, son lieu de conservation actuel, sa cote d’archives et enfin le jugement d’authenticité de l’éditeur. La deuxième section comprend quatre champs consacrés à l’identification du destinataire de l’acte, au type de mesure juridique, au type diplomatique — précepte mineur, ordinaire ou solennel — et à son format — carta transversa, carta non transversa ou format carré. Enfin, la dernière section contient le nom du notaire et du chancelier. Les informations de la base de données seront, à terme, complétées par la transcription de l’acte en mode texte. Deux modifications devront cependant être apportées pour transférer les données sur le Web. Ainsi, les données de la base File Maker seront formatées pour le SGBD MySQL, qui permet un interfaçage sur le Web grâce au langage PHP. D’autre part, la transcription sera encodée au format XML en utilisant une DTD spécifique pour les sources diplomatiques, actuellement mise au point par l’École nationale des chartes et utilisée, par exemple, pour l’édition des actes du Cartulaire blanc de Saint-Denis.
Afin d’augmenter les possibilités qu’offre la mise en ligne des documents, les interfaces seront adaptées en fonction des usages et des internautes. Ainsi, selon le type de recherche et d’approche, l’internaute disposera d’une grille d’interrogation et d’un mode de navigation adéquats. Chaque acte se présentera de la même façon : l’ensemble des champs renseignés dans la base, une image de taille réduite (thumbnail) pour chacun de ces actes sur laquelle il suffira de cliquer pour accéder à une visualisation en plein écran permettant, à l’aide du plugin DjVu, d’augmenter la taille (zoom) de telle ou telle partie de l’acte et d’accéder à la transcription de l’acte. Quatre usages de cette base peuvent être dégagés :
-
Le mode « feuilletage » permettra de visualiser l’ensemble des actes un par un comme dans un livre. Il donne ainsi une vue d’ensemble du contenu de la base et permet une lecture continue de celle-ci. Cette interface conviendra entre autres aux étudiants qui désirent s’entraîner à la paléographie et qui n’ont pas encore acquis de connaissances précises sur la diplomatique carolingienne. Ceux-ci pourront donc choisir plus facilement les actes qui leur conviennent.
-
Le mode « recherche diplomatique » permettra l’interrogation sur tous les champs de la base de données à l’aide de menus déroulants encadrant la recherche et permettant d’éviter les fautes de frappe. Le diplomatiste pourra ainsi faire des tris croisés sur l’ensemble des champs de la base de données. Il lui sera par exemple possible d’obtenir les commentaires, l’image et le texte de tous les diplômes de Charles le Chauve donnés à Compiègne et confirmant l’immunité et le droit à l’élection libre de l’abbé.
-
Le mode « recherche paléographique » limitera l’interrogation aux caractéristiques paléographiques de chaque acte et donnera la possibilité aux paléographes de se concentrer uniquement sur les caractéristiques qui les intéressent. Ce mode sera particulièrement adapté aux professeurs de paléographie qui pourront retrouver rapidement un acte spécifique pour étudier en cours le ductus de l’écriture.
-
Le mode « recherche sur le texte » [36] permettra l’interrogation en plein-texte de la transcription des actes. Les chercheurs pourront faire une recherche sur le vocabulaire latin utilisé dans les actes de Charles le Chauve ou retrouver rapidement tous les actes utilisant une formule spécifique.
En somme, l’objectif de ce projet est de faire cohabiter dans un même site web l’image du diplôme, sa transcription et des informations scientifiques sur celui-ci. Les différentes interfaces du site permettent de mettre en valeur toute la richesse des documents du haut Moyen Age et d’en ouvrir l’accès à un public très large. En outre, l’outil informatique s’avère être une aide précieuse pour les sciences auxiliaires de l’histoire telles que la paléographie et la diplomatique. Enfin, on ne peut écarter l’aspect économique d’un tel projet — la base de données sera en accès libre sur le web — qui coûtera nettement moins cher que la confection d’un recueil traditionnel de fac-similés sur support papier. Autre avantage, cette édition électronique pourra être modifiée, contrairement au livre imprimé, si nécessaire, en fonction des travaux futurs sur le règne et les actes de Charles le Chauve.
Annexe 1
Annexe 2
[1]. Pour une analyse de quelques-uns de ces projets, cf. Karsten Uhde, Urkunden im Internet. Neue Präsentationsformen alter Archivalien, dans Archiv für Diplomatik, t. 45, 1999, p. 441-464.
[2]. http://www.bsb-muenchen.de/
[3]. Philippe Lauer, Ferdinand Lot et Georges Tessier (éd.), Diplomata Karolinorum : Recueil de reproductions en fac-similé des actes originaux des souverains carolingiens conservés dans les archives et bibliothèques de France, Toulouse, 1936-1949.
[7] http://www.regesta-imperii.org/ Cf. la recension du site par Antonella Ghignoli, dans Reti Medievali, t. III, 2002. www.dssg.unifi.it/_RM/rivista/recensio/ghignoli-regesta.htm
[8] http://mdz.bib-bvb.de/digbib/gratian/text/@Generic_BookView
[9]. http://www.bautz.de/bbkl/s/s4/sybel_he.shtml
[10]. http://www.bautz.de/bbkl/s/sickel_t.shtml
[11]. Heinrich von Sybel et Theodor von Sickel (dir.), Kaiserurkunden in Abbildungen, Berlin, 1880-1891. http://mdz.bib-bvb.de/digbib/urkunden/kuia/
[12]. http://www.lrz-muenchen.de/~GHW/start01.html
[13]. http://www.uni-muenchen.de
[14]. Je tiens à remercier le Dr. Markus Brantl de la Bayerische Staatsbibliothek à Munich de m’avoir communiqué les détails du projet qu’il co-dirigea avec le Dr. Georg Vogeler de l’université Ludwig-Maximilian de Munich.
[15]. Les plugins sont des petits programmes augmentant les possibilités du navigateur Web et permettant l’affichage des formats non pris en charge par ce dernier.
[17]. http://www.adobe.fr/products/photoshop/main.html
[18]. Heinrich von Sybel et Theodor von Sickel (dir.), Kaiserurkunden in Abbildungen. Textband, Berlin, 1891. [page web]
[19]. Cf. annexe.
[20]. http://www.djvuzone.org/
[21]. En français dans le texte.
[22]. Vous trouverez un aperçu des applications de DjVU à l’adresse :
http://www.djvuzone.org/links/index.html et
http://www.djvuzone.org/demos/appli/index.html
[23]. http://djvu.sourceforge.net/
[24]. Pour un aperçu des applications DjVu, cf. :
http://www.djvuzone.org/djvu/photos/jpgvsdjvu01/index.html
[25]. http://www.lizardtech.com/
[26]. http://www.djvu.com/download/?x=2&p=&o=1
[29]. Cf. entre autres le numéro 40 (automne 2001) du Médiéviste et l’ordinateur consacré à la numérisation des manuscrits médiévaux.
[30]. http://www.enc.sorbonne.fr/cartulaireblanc/index.php
[32]. Le site http://www.enc.sorbonne.fr/charleslechauve/ ne présente qu’un nombre réduit d’actes à titre d’expérience.
[33]. Nicholas Brousseau, Étude comparée des diplômes de Louis le Germanique et de Charles le Chauve (829-877), thèse pour le dipl. d’archiviste paléographe, 2003, dactyl.
[34]. Cf. l’exemple fourni en annexe.
[35]. Recueil des actes de Charles II le Chauve, roi de France, commencé par Arthur Giry, continué par Maurice Prou, terminé et publié sous la direction de M. Ferdinand Lot par M. Georges Tessier, Paris, 1943 (Chartes et diplômes relatifs à l’histoire de France), 3 t.
[36]. Sur les différentes possibilités de présentation du texte des actes, cf. le site du projet d’édition électronique des diplômes impériaux
d’Henri IV pour la ville de Spire.
www.uni-koeln.de/~a0054/diplome/index.html