Le Médiéviste et l’ordinateur
Le Médiéviste et l’ordinateurHistoire médiévale, informatique et nouvelles technologies
n° 42 (Printemps 2003) : La diplomatique

Le projet d’édition électronique
du Cartulaire blanc de l’abbaye de Saint-Denis
et les projets électroniques de l’Ecole nationale des Chartes

Olivier Guyotjeannin
École nationale des chartes
Gautier Poupeau
École nationale des chartes – DOCSI/ENSSIB
(http://www.enc.sorbonne.fr/cartulaireblanc/)

Quatre projets liés à la diplomatique médiévale sont en cours d’élaboration pour consultation sur le site web de l’École nationale des chartes (http://www.enc.sorbonne.fr). Leur variété est extrême, dans la taille, l’état d’avancement, l’originalité, le lien prédominant avec l’enseignement ou la recherche — même si l’on s’efforce de ne pas donner à l’un ou à l’autre l’exclusivité.

Une bibliographie d’orientation de diplomatique et archivistique médiévales françaises (http://www.enc.sorbonne.fr/ressources.htm), mise à jour chaque semestre, ouverte à la consultation au printemps 2001, est directement liée à l’enseignement. Divisée en sections et uniquement consultable dans une lecture cursive sur des pages-écrans, elle n’est que la transposition d’une ressource disponible depuis plusieurs années et désormais moins confidentielle. C’est plutôt comme un outil annexe, mais avec les potentialités de la base de données, que l’on prévoit de mettre à disposition, avec interrogations croisées, les notations relevées de concert avec Benoît-Michel Tock sur les styles de changement de millésime.

Un autre projet se situe à l’opposé du précédent, car il est autrement ambitieux, mais en cours de fabrication : la base BÈDE (Bibliographie des études diplomatiques et éditions de sources documentaires, Moyen Âge français). Avec l’aide des étudiants de l’École, œuvrant dans le cadre du cours de bibliographie, le projet vise la constitution d’une bibliographie rétrospective, critique et (sans illusion) exhaustive des études et éditions concernant les actes et documents d’archives médiévaux français. Le lancement du site web a été l’occasion de repenser un projet engagé plusieurs années auparavant, sur la base d’une idée de Robert-Henri Bautier : combler enfin la lacune bibliographique criante qui affecte ce domaine d’études. Projet repensé puisque l’espoir de produire une bibliographie internationale a été abandonné, mais qu’inversement l’on optait pour une analyse de contenu, même rapide, et pour les possibilités associées d’un ou plusieurs tris sur des critères comme le type, l’auteur, la période… des documents étudiés ou édités. Sans compter le recensement fin des études de diplomatique, permettre aux historiens de se constituer en quelques secondes une bibliographie sur les études et éditions consacrées aux testaments, aux comptes, aux actes d’un roi, à la production documentaire de l’ensemble d’une période et/ou d’une région données… est l’objectif essentiel de cette base des données, dont la conception est des plus classiques, et le goulot d’étranglement le renseignement des différents champs, livre ou article sous les yeux. La quête des titres est assez avancée pour les années 1965-1990, très avancée pour les années 1991-2000 (667 titres saisis).

La diplomatique, par ailleurs, apporte sa contribution à la construction et à l’enrichissement de la collection de fac-similés de l’École mis à la disposition des internautes (http://www.enc.sorbonne.fr/coursenligne.htm). C’est bien évidemment la pédagogie qui l’emporte, et de très loin, dans cette entreprise qui, à terme, pourra toutefois former un album relativement varié des différents types de documents, et donc d’autant mieux aider la recherche, même si la sélectivité est le maître-mot, par la constitution de sous-album que chacun pourra centrer sur ses propres intérêts, par des interrogations croisées sur les époques, les types d’actes et d’auteurs, les types de documents. Si le projet n’est pas évoqué ici en tant que tel, c’est que, inversant l’ordre historique d’engendrement des disciplines, la paléographie y a préparé la voie à la diplomatique : les commentaires diplomatiques sont venus se greffer sur le schéma et les modes de consultation imaginés par Marc Smith pour la présentation des fac-similés et de leur transcription ligne à ligne. Le souci de guider la consultation tout en laissant assez de liberté pour lire ou non, aussitôt ou plus tard, les « solutions » des jeux paléographico-philologico-diplomatiques proposés, a amené à suivre le découpage proposé dans le précis de Diplomatique médiévale paru dans la collection L’atelier du médiéviste : une succession d’opérations enchaînant lecture du document, compréhension factuelle et traduction, examen des parties du discours, interprétation diplomatique globale, confection d’un régeste, tout en tirant parti de multiples facilités de consultation offertes sur le réseau. Ainsi, nous nous sommes efforcés de mettre en place une interactivité avec le lecteur au moyen de bulles qui apparaissent au passage de la souris, des couleurs et de l’hypertexte.

Cette rapide revue faite, il reste un projet qui nous a semblé mériter un exposé plus circonstancié et, corrélativement, une discussion que nous souhaitons nourrie, tant les voies qui s’ouvrent à lui sont larges et incertaines. Projet « de recherche », mais fondé sur des travaux pratiques et que nous cherchons aussi à intégrer à la vocation pédagogique de l’établissement, il vise en effet la constitution d’une édition électronique « grandeur nature », projet qui à notre connaissance, dans le domaine français au moins, est déjà bien développé chez les littéraires mais fort peu chez les éditeurs de sources documentaires. Avant d’entrer dans le détail de la conception, il faut évoquer son objet, qui a déterminé le choix de l’édition électronique et guide tout aussi naturellement bien des aspects de son développement.

1. Les archives et les cartulaires de Saint-Denis

Si le projet a essentiellement une finalité « de recherche », son origine est pédagogique. Il se trouve lié en effet au souhait d’associer aussi pleinement que possible les étudiants à la production d’éditions et d’instruments de recherche. Après quelques tâtonnements, cette association suit désormais la progression des cours : préparation de transcriptions, traductions et commentaires de fac-similés pour le site web en première année ; préparation d’éditions d’actes en deuxième année ; préparation de transcriptions et de commentaires plus approfondis en troisième année.

Le travail confié aux étudiants de deuxième année a d’abord concerné des ensembles modestes, prévus pour une publication traditionnelle : les 224 actes du chartrier des Prémontrés de Saint-Yved de Braine (publiés dans les collections de l’École en 2000), les 274 formules du formulaire d’Odart Morchesne, éditées en collaboration avec des étudiants de Serge Lusignan à Montréal (ultime révision et annotation en cours). Depuis quelques années, aussi, des travaux personnels, engagés un peu par hasard, étaient venus souligner l’intérêt exceptionnel et en partie méconnu, en tout cas sous-exploité, du chartrier de l’abbaye de Saint-Denis : des cartulaires tardifs et massifs, déjà bien cernés [1] ; la survie d’un nombre appréciable d’originaux ; la conservation proprement exceptionnelle d’inventaires d’archives (au sens le plus large) médiévaux et modernes [2]. La richesse de l’abbaye et son rôle de premier plan promettaient une richesse informative qui s’est confirmée dès les premiers sondages et qui emportait la décision, justifiée encore par la nécessité impérieuse de poursuivre les programmes encore bien incertains de reprise des éditions de chartriers parisiens, où l’édition-modèle du chartrier de Saint-Magloire a été plutôt isolée.

Le chartrier de Saint-Denis, il est vrai, pose des problèmes de masse et donc d’approche, un peu aussi d’éparpillement, qui ne sont pas pour rien d’ailleurs dans la prudente abstention des éditeurs, mal stimulée sans doute aussi par l’inégale répartition chronologique de la documentation : une richesse rare, mais déjà bien prospectée, pour le haut Moyen Âge ; une indigence extrême, commune à bien des établissements parisiens, du xe à l’extrême fin du xie siècle ; une reprise puis une explosion quantitative, aux conquêtes cumulées, des années 1170 aux années 1270. Le phénomène est ici d’autant plus sensible que cette dernière période est aussi très densément couverte par le premier vrai grand cartulaire que les moines aient compilé, après quelques essais très partiels [3] : le Cartulaire blanc, avec ses deux volumes monumentaux, totalise un peu plus de 2 600 transcriptions, un premier noyau achevé vers 1277-1278 ayant été régulièrement mis à jour jusqu’en 1300 puis brusquement et presque complètement abandonné. Le relais est pris, autour des années 1320, par un projet grandiose, plus technicien, plus brouillon, inachevé, de cartulaires spécialisés par domaines, reprenant une documentation récolée, cotée et inventoriée à nouveaux frais. Tous volumes confondus, les cartulaires de l’abbaye doivent facilement livrer le texte de 3 000 actes antérieurs à 1300.

Certes guidé par le « Grand inventaire » commencé en 1680 et achevé plus de vingt ans après, l’éditeur finit par être accablé par la très satisfaisante proportion d’originaux encore conservés (près de deux sur trois pour les premiers dossiers explorés systématiquement) et par la variété des « inventaires » médiévaux : Ancien inventaire noir, qui est en fait une sorte de « digest » du Cartulaire blanc, entrepris entre 1287 et 1289 sous la direction plus ou moins proche de Guillaume de Nangis ; Ancien inventaire jaune des années 1320-1330, qui récole et recote les originaux ; Inventaire de 1520 qui, sur la base des reclassements de la fin du xve siècle, propose de nouveaux régestes, beaucoup moins intéressants du reste.

Ces richesses un peu mieux reconnues, on a été amené à repenser entièrement la stratégie d’édition. On avait en effet prévu à l’origine d’engager le travail de la façon la plus classique qui fût : partir des originaux, recenser les copies, monter assez vite une édition critique en choisissant des termes chronologiques raisonnables — laisser les hautes époques à leurs spécialistes, laisser aussi de côté un long xie siècle sur lequel une entreprise était annoncée, commencer donc à l’abbatiat de Suger, s’arrêter enfin à 1220, où explose la documentation, pour concorder au plus près avec les entreprises de recensement menées à l’IRHT par Annie Dufour, qui mettait avec la disponibilité que l’on imagine tous ses dossiers à notre disposition. Prendre, en bref, une tranche d’un siècle, qui allait ravir (peut-être) les spécialistes de l’époque, et qui une fois de plus ferait pleurer les autres ; et qui surtout allait morceler (et en fait interdire) l’analyse fine des cartulaires et des inventaires d’archives, proscrire toute vue d’ensemble sur la gestion du chartrier, questions qui n’étaient pas pour rien dans le choix de Saint-Denis. Alors que tous et chacun déplorent les lacunes dans la connaissance des sources, difficiles, du xiiie siècle, ne fallait-il sauter le pas ? Pour emporter la décision, il suffisait de lire de façon cursive quelques chapitres de Cartulaire blanc, qui montrèrent aussitôt que les sources difficiles du xiiie siècle sont aussi enthousiasmantes, pour l’historien, comme d’ailleurs pour le diplomatiste, confronté au foisonnement de formules et à l’évolution de types tout autres que figés.

2. Une édition électronique

Le pas donc a été sauté, et c’est depuis lors que le projet éditorial se développe de façon consubstantielle au projet informatique.

Pour partir d’un terrain plus sûr, l’angle d’attaque du chartrier de Saint-Denis a été déplacé vers le matériau du Cartulaire blanc, édité dans l’ordre de la compilation, et pour l’heure en suivant sa transcription. Partir d’un cartulaire, aussi massif et soigné soit-il, c’est accumuler un double défaut par rapport aux originaux conservés : omettre des textes, offrir un témoin inévitablement amoindri de la tradition. Pour compenser, au moins en partie et dès maintenant, ce double défaut, assumé mais réel, revendiqué comme provisoire, puisqu’une seconde étape doit voir apporter tous les compléments imposés à une édition scientifique, nous recherchons dès maintenant par grandes masses les originaux conservés (séries L et S, mais aussi K, Q, H des Archives nationales ; le cas échéant, Archives départementales des Yvelines) et les éditions disponibles (très largement limitées aux actes royaux et pontificaux), comme nous pistons dans les divers inventaires d’archives (Ancien inventaire jaune, Inventaire de 1520, Inventaire de 1680) le bilan de la conservation des parchemins. Mais dans cette première étape, horresco referens, le texte des originaux n’est sollicité que lorsque le texte du Cartulaire soulève un doute — la seule excuse reposant dans les tests qui ont montré une large fiabilité des transcriptions [4]. Par contre, l’intérêt pour les pratiques archivistiques nous incite, dès cette première étape, à relever et éditer non seulement les rubriques du Cartulaire, mais encore les régestes médiévaux (Ancien inventaire noir et Ancien inventaire jaune).

S’il y a une justification à des pratiques aussi barbares et arriérées aux yeux de la science contemporaine, elle est dans la conjonction d’un chiffre et d’un outil. Le chiffre, c’est bien sûr celui de la documentation disponible : le chapitre consacré à Tremblay [-en-France] est entièrement traité, le chapitre Rueil [de Rueil-Malmaison] est en cours, sans compter quelques sondages dans les chapitres Beaurain, Cergy et Cormeilles. Au rythme actuel, occupant les étudiants de deuxième année, la première phase du travail (édition « soignée  » du seul Cartulaire blanc) sera achevée en 2045 ; la collation des originaux et des autres copies, l’exploitation des autres cartulaires devraient mener tranquillement l’entreprise à l’orée du xxiie siècle. Voilà pour le chiffre. L’outil qui sauve l’honneur, et un peu plus, c’est l’édition électronique.

Nous n’entendons pas ici entrer dans le débat un peu rhétorique des avantages respectifs de l’édition traditionnelle et de l’édition électronique, mais présenter quelques choix et quelques solutions. Pour développer l’aspect pédagogique, mais aussi pour offrir un palliatif à la lenteur de l’opération, le principe de l’association des textes (ou, en attendant, de la table des chapitres, déjà réalisée, voire d’une table des actes) à une numérisation intégrale du cartulaire est retenu, en partenariat avec les Archives nationales. Pour résumer notre sentiment, l’édition électronique change tout et rien.

Rien, pour ce qui est de la préparation et de la présentation des éditions, dont la disposition typographique même, de la date à l’annotation colle même délibérément à la typographie des éditions « papier » dont nous suivons le modèle. Tout, en ce qu’elle amène à repenser tout le dispositif de consultation.

Quant à la philosophie générale du projet pour l’édition électronique, elle est simple et peut se résumer en quelques mots : accessibilité, automatisation, interopérabilité et pérennité, contextualisation et gratuité. Ces cinq expressions font référence à des domaines différents mais essentiels dans l’édition électronique.

Accessibilité dans la consultation

Cœur des éditions traditionnelles aussi bien qu’électroniques, la lecture des actes édités peut se faire par de multiples accès :

1. À partir de l’ordre du Cartulaire, chapitre par chapitre, acte par acte (une introduction étoffée détaillant, pour chaque chapitre, l’historique du domaine, la composition du chapitre, les sources complémentaires retrouvées, mais comprenant aussi un volet iconographique et pédagogique, avec des suggestions d’utilisation des actes) ;

2. À partir de diverses échelles de cartes visualisant soit les domaines, soit les quartiers de chaque finage (ce qui ne fait d’ailleurs en partie que matérialiser la démarche topographique des compilateurs) ;

3. À partir d’une table chronologique cumulative des actes, qui semble à peu près au point ;

4. Enfin, c’est le plus classique et le plus difficile à mettre en œuvre, à partir de l’équivalent d’un index, où, est-il besoin de le dire ?, nous buttons sur les problèmes de lemmatisation.

Automatisation

L’automatisation des tâches est, bien sûr, une des priorités. Le nombre d’actes contenus dans le Cartulaire blanc et l’organisation du travail nous ont imposé de trouver un système permettant d’ajouter facilement et rapidement un nouveau chapitre, de nouveaux documents et de nouveaux actes. Il n’était pas question pour nous d’utiliser le simple langage HTML et de mettre à jour « à la main » toutes les pages existantes en fonction des nouveautés.

Du point de vue technique, nous avons opté pour l’utilisation de logiciels libres. Tous les actes et toutes les informations relatives au Cartulaire blanc sont contenus dans une base de données gérée par le SGBD open-source, Mysql [5]. Il a l’immense avantage d’être gratuit et très performant, puisqu’il utilise le langage SQL, référence en la matière. Pour interfacer notre base de données avec le Web, nous utilisons le langage PHP [6], lui aussi issu de la famille des logiciels libres. Pour finir ce tour d’horizon des logiciels utilisés, il faut ajouter que nos applications tournent sur un serveur web Apache [7], lui aussi gratuit.

Concrètement, nous utilisons des interfaces d’administration web sous forme de formulaires qui correspondent aux différents champs de notre base de données. Le renseignement de la base de données ne demande donc aucune connaissance spécifique en informatique. Notre logiciel comprend, pour l’instant, trois interfaces de traitement : une pour les actes, une pour les documents associés et une pour mettre au point les index. Il est à signaler que les pages d’introduction sont pour l’instant créés directement au format HTML mais nous devrions rapidement les importer directement du format RTF vers le HTML via XML, opération qui ne requiert, là aussi, aucune connaissance informatique particulière.

Ces choix nous permettent de gérer automatiquement la construction progressive de l’édition, la mise à jour des index et des tables thématiques des actes et l’enrichissement ultérieur des collations. De plus, la base de données permet une interrogation précise et nous permet d’envisager sereinement la mise en place d’un index général à tous les chapitres du Cartulaire, par exemple.

Interopérabilité et pérennité

La question de l’interopérabilité, essentielle, est bien sûr liée à la question de la pérennité de notre édition. Il ne s’agit pas d’un article de médecine appelé à être caduque quelques mois plus tard, mais, bien d’une édition de sources historiques appelée à être encore disponible dans cent ans. Il était donc indispensable pour nous de mener une réflexion pour assurer la pérennité de notre contenu, son interopérabilité avec les futures machines ou son portage vers d’autres supports que le Web, comme le papier ou les futurs e-book par exemple. Nous nous sommes donc rapidement tournés vers le langage XML, issu des recommandations du W3C [8] et héritier du SGML. Ce langage promis à un grand avenir a divers avantages. Il s’agit d’un méta-langage. Chaque utilisateur choisit les balises qu’il veut utiliser d’après le type de documents. Ces balises sont définies dans une DTD (Definition Type Document). Les balises définies par l’utilisateur suivent la composition sémantique du texte et non sa composition physique. Nous ne sommes pas tenus par telle ou telle présentation et pouvons envisager sereinement le portage de notre édition sur le papier ou vers des formats permettant la lecture sur des e-books comme le PDF.

Ainsi, nous avons entamé une réflexion sur la mise en place d’une DTD spécifique à l’édition de sources diplomatiques. Cette DTD sera le cœur de la chaîne de traitement qui permettra le passage automatique de l’acte du format RTF du traitement de texte vers le XML. L’utilisateur pourra ensuite choisir le format de sortie du document : HTML, XML ou PDF en fonction de ses besoins. De notre côté, la mise au point de l’édition papier ne nous demandera pas de saisir à nouveau l’ensemble des actes, mais simplement la récupération et le formatage des données XML.

Enfin, assurer la pérennité de notre édition consiste aussi à s’assurer de sa consultation et donc son référencement par les moteurs de recherche. Un effort particulier est mis sur le renseignement des métadonnées qui permettent aux robots des moteurs de recherche d’indexer le site. Nous avons donc opté pour la mise en place de deux types de métadonnées. Tout d’abord, les métadonnées traditionnelles qui suivent les recommandations du W3C ont été renseignées normalement. D’autre part, nous avons tenu à utiliser une norme mis au point depuis quelques années : le Dublin Core. Elaborée par Dublin Core Metadata Initiative [9], organisme international, cette norme vise à promouvoir une interopérabilité entre les méta-données et à développer un langage spécifique pour la description des ressources présentes sur le réseau. « La norme du Dublin Core comprend 15 éléments dont la sémantique a été établie par un consensus international de professionnels provenant de diverses disciplines telles que la bibliothéconomie, l’informatique, le balisage de textes, la communauté muséologique et d’autres domaines connexes »[10].

Contextualisation

Un des gros problèmes de l’édition électronique réside dans le phénomène de délinéarisation du texte et donc de décontextualisation. En effet, l’hypertexte, utilisé par le Web, impose la fragmentation du texte en pages-écrans reliées par des liens hypertextes. Cette atomisation des textes provoque une rupture physique dans leur argumentation que les spécialistes ont eu l’habitude d’appeler la décontextualisation du discours. Il a fallu donc résoudre ces problèmes.

Tout d’abord, il nous a fallu définir le contenu d’une page-écran. Devait-elle contenir un certain nombre de mots ou l’équivalent d’une partie du discours ? Cette question a été résolue assez facilement grâce à la nature de notre édition. En effet, nous avons décidé d’afficher à chaque page-écran un acte accompagné de son régeste, de sa tradition, de son apparat critique et des documents qui lui sont associés.

De plus, pour éviter le phénomène de décontextualisation, nous avons utilisé les différentes formes de tabularité du texte déjà existante sur le support papier. Ainsi, nous avons mis au point des introductions générales à chaque chapitre, des tables récapitulatives des chapitres et du contenu de chaque chapitre traité, des sommaires, des index de noms (bientôt complétés par des index matières). Cela permet au lecteur de se repérer au mieux dans l’édition. L’utilisateur peut, en plus, faire des recherches en texte-intégral et dispose de documents cliquables qui sont un autre moyen pour lui de se repérer.

Gratuité

La dernière considération est d’ordre économique. Soutenu par le ministère de la recherche dans le cadre du plan quadriennal 2002-2005, ce projet implique une mise à disposition gratuite des résultats de la recherche. Ainsi, il n’est demandé aucun achat de licence et aucune identification pour la consultation du Cartulaire blanc. Il nous a semblé normal de mettre en place cette gratuité, selon le principe de bien public que nous appliquons à cette édition. Nous avons donc facilité l’impression des documents par les utilisateurs, par exemple.

De plus, selon les principes de l’open-source, le logiciel que nous mettons au point pour l’élaboration et la mise à jour de notre édition sera disponible gratuitement et toutes les institutions pourront en faire la demande pour mettre au point une édition du même type en leur sein. En revanche, le contenu des bases de données (actes, documents, introduction et index) est régi par le principe de la propriété intellectuelle et donc soumis à un usage privé, de recherche ou de pédagogie et ne peut faire état d’une commercialisation sans l’autorisation de l’École nationale des chartes.



[1]. Rolf Grosse, « Remarques sur les cartulaires de Saint-Denis aux xiiie et xive siècles », dans Les cartulaires, actes de la table ronde organisée par l’École nationale des chartes et le GDR 121 du CNRS, Paris 5-7 décembre 1991, éd. Olivier Guyotjeannin, Laurent Morelle et Michel Parisse, Paris-Genève, 1993 (Mémoires et documents de l’École des chartes, 39), p. 279-288.

[2]. Premières approches dans Olivier Guyotjeannin, « La science des archives à Saint-Denis, fin du xiiie-début du xvie siècle », dans Saint-Denis et la royauté, études offertes à Bernard Guenée, Paris, 1999 (Histoire ancienne et médiévale, 59), p. 339-353, et « La tradition de l’ombre : les actes sous le regard des archivistes médiévaux (Saint-Denis, xiie-xve siècle) », Charters, cartularies and archives : the preservation and transmision of document in the medieval west, Toronto, 2002 (Papers in medieval studies, 17), p. 81-112.

[3]. On ne mentionne que pour mémoire les cartulaires précédents, outre un petit cartulaire-dossier du xie siècle : un cartulaire du convent, compilé vers la fin des années 1220 (dit à tort « cartulaire de l’Aumônerie »), il est repris un demi-siècle plus tard (volume dit tout autant à tort « cartulaire de la Pitancerie », et assez vite, peut-être dès l’origine, considéré comme un troisième tome du Cartulaire blanc) ; le « Livre des privilèges », qui compile bulles et diplômes, sans omettre ni la pseudo-Donation de Constantin ni le premier « testament » de Suger dans les décennies centrales du xiie siècle.

[4]. À tout le moins pour les actes en latin, et où les étourderies se dénoncent le plus souvent d’elles-mêmes. La situation est toute différente pour la langue vulgaire : la collation avec les originaux montre une extrême variabilité des graphies.

[5]http://www.mysql.com/

[6]http://www.php.net/

[7]http://www.apache.org/

[8]. Le World Wide Web Consortium ou W3C est un consortium indépendant chargé de normaliser les langages utilisés sur le http://www.w3.org/

[9]http://www.dublincore.org

[10]. Diane Hillmann, Guide d'utilisation du Dublin Core, 2001 :
http://www.bibl.ulaval.ca/DublinCore/usageguide-20000716fr.htm

 

© CNRS - IRHT 2004 - Contacts - Infos légales - Rédaction