Le Médiéviste et l’ordinateur
Le Médiéviste et l’ordinateurHistoire médiévale, informatique et nouvelles technologies
n° 40 (Automne 2001) : La numérisation des manuscrits médiévaux
Previous PageTable Of ContentsNext Page

Actes et sceaux

Florence Clavaud
Archives nationales
florence.clavaud@culture.gouv.fr

1. Panorama

2. La problématique actuelle ; quelques éléments de réflexion

3. Conclusion

Comme prévu par les organisateurs de la journée d'étude, mon propos concernera uniquement la numérisation proprement dite des actes et sceaux (moulages et empreintes originales) du Moyen Âge.
Ce domaine est encore beaucoup moins exploré en France par les organismes chargés du patrimoine écrit ou par les chercheurs, que celui des manuscrits littéraires ou scientifiques ; un panorama des expériences en cours en témoignera. Je m'attacherai donc surtout à aborder les paramètres et facteurs spécifiques qui entrent en jeu dans de tels projets.

1. Panorama

Je me suis surtout penchée, pour me faire une idée de la situation, sur l'Internet. Un tel média me semble celui de l'avenir pour la communication des sources primaires, de leurs éditions et de leur étude critique ; j'y reviendrai. Cette approche présente, soyons-en bien conscients, un inconvénient majeur : l'Internet a été plus tardivement utilisé par les organismes détenteurs des documents que le CD-Rom, produit éditorial fini susceptible d'intégrer assez facilement des collections d'images de bonne qualité et de grosses bases de données. Ceci explique, en partie, la rareté des réalisations en ligne.
En effet, si l'on cherche sur le Web des images numériques des actes et sceaux du Moyen Âge, on en trouvera, certes, mais le plus souvent il s'agira de quelques documents présentés comme un florilège ou comme un échantillon représentatif d'un fonds. Beaucoup de services français d'archives procèdent pour l'instant de la sorte. Si l'on cherche des réalisations lourdes, traitant de fonds d'archives ou de collections entières, on est frappé de la rareté de tels produits.
On trouve en fait beaucoup plus souvent, et surtout sur des sites étrangers ou développés par des universités ou instituts, des corpus d'éditions de texte ou des bases de données analysant les documents... mais bien peu souvent les documents eux-mêmes.
Je me contenterai ici de citer plus précisément trois sites étrangers dont le contenu est intéressant pour notre propos, à des titres divers. Le premier est celui de l'université d'Oxford (http://image.ox.ac.uk, Early manuscripts at Oxford University). Ce site donne à voir essentiellement des manuscrits littéraires, mais aussi des actes diplomatiques tels le cartulaire de l'hôpital et prieuré Saint John the Baptist à Dublin (Ms Rawl B498, Bodleian Library). Non exhaustive, cette banque de données en ligne est surtout remarquable par la qualité extraordinaire des images numériques, qui donne au chercheur un confort et des facilités de travail incomparables, au prix de quelques minutes d'attente nécessaires au téléchargement. Les choix techniques faits par les auteurs du projet me semblent à cet égard un modèle à suivre.
Un autre site dont le contenu est très significatif est celui de la bibliothèque de l'université de Yale en Californie (http://www.library.yale.edu/Ilardi/il-toc.htm, The Ilardi microfilm collection of Renaissance diplomatic documents). Il s'agit d'un catalogue de 1 856 bobines de microfilms reproduisant 2 millions de documents de la seconde moitié du XVe siècle conservés dans les bibliothèques et services d'archives européens ; certains documents ont fait l'objet d'une numérisation partielle, la qualité assez moyenne et la petite taille des images ne permettent pas au chercheur de lire les textes. Ce qu'il faut noter c'est qu'une institution américaine, qui ne détient que des reproductions des actes, est en train de construire ce qu'un groupement d'organismes européens pourrait faire, sans aucun doute mieux car à partir de reproductions couleur et d'analyses plus fines des documents..., si un tel groupement se constituait et se donnait les moyens d'une telle opération.
Le troisième et dernier site que je voudrais citer me paraît constituer, pour les détenteurs français de fonds organiques volumineux d'archives médiévales, un exemple à suivre, qui ne restera pas sans doute isolé longtemps. Les archives d'État de Florence ont mis en ligne en mars 2000 (http://www.archiviodistato.firenze.it/Map, Mediceo avanti il Principato), les 165 articles d'archives formant le fonds d'archives de la famille Medici avant 1537, intégralement numérisés et consultables après recherche dans un ensemble d'outils reliés entre eux (index, inventaire sommaire, inventaire analytique).

Revenons en France. Après un tel constat de rareté, j'ai cherché des informations sur l'existence de projets de numérisation systématique d'actes médiévaux non encore aboutis. Me trouvant à la direction des Archives de France, j'ai concentré mes recherches sur les services d'archives. Les rapports annuels d'activité de la DAF depuis 1995 m'ont livré quelques pistes, ainsi que le site « numérisation du patrimoine culturel » géré par la mission de la recherche et de la technologie de notre ministère de tutelle, le ministère de la Culture et de la Communication. Les fiches de projet présentées sur ce site jusqu'à la fin juin 2001 ne concernaient que les opérations en partie financées par le ministère dans le cadre du plan national de numérisation. En juin 2001, le ministère de la Culture a publié sur son site un nouveau catalogue des fonds culturels numérisés (http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_02.htm) destiné à recenser tous les projets de numérisation en cours ou achevés, dans les organismes placés sous tutelle du ministère, quel que soit leur financement ; sur les 107 fiches de projet relatives au Moyen Âge, 2 seulement concernent des sceaux et 5 des manuscrits. J'ai donc décidé de faire ma propre enquête en diffusant sur la liste de discussion de l'Association des archivistes français un questionnaire détaillé. Je remercie vivement les confrères qui m'ont répondu, le plus souvent par un message, et ceux qui m'ont donné au téléphone des informations très précises sur leurs projets. On trouvera le résultat de ces recherches dans le tableau en annexe. J'ai mis à jour les informations recueillies au 6 août 2001. En tout huit services d'archives français ont donc commencé à numériser des fonds ou collections de documents médiévaux, un neuvième service a préparé une telle opération. Autant dire que ce type d'opérations est très marginal par rapport aux millions de pages de registres paroissiaux et d'état civil, de plans et matrices cadastraux, de documents figurés plus récents, en cours de numérisation dans les services français dépendant de la DAF (voir sur le site Internet de la DAF le tableau des opérations de numérisation de registres paroissiaux, d'état civil et des tables décennales,
http://www.archivesdefrance.culture.gouv.fr/fr/archivistique/index.html, cliquer sur numérisation). Parmi les services identifiés, la plupart, d'ailleurs, ont des programmes de numérisation plus larges.
Les documents concernés sont divers, du cartulaire aux sceaux originaux, en passant par le chartrier et les brèves notariales. Les services qui ont les premiers traité ce type de documents ont d'abord privilégié les opérations ponctuelles limitées à quelques centaines d'images, donc souvent des cartulaires ou des sceaux (AD Aveyron, AD Haut-Rhin). Les projets plus lourds portant sur des volumes importants sont récents et en cours de réalisation. Les modalités techniques aussi sont variables ; elles dépendent de l'existence ou pas de supports intermédiaires (photos ou microfilms) et d'ateliers de numérisation internes. En revanche, la banque de données en ligne (en Intranet ou beaucoup moins souvent sur Internet) est citée comme le mode de consultation souhaité par 6 services sur 8. Dans l'immédiat, seul le Centre historique des Archives nationales dispose d'une banque d'images sur Internet pour communiquer les documents numérisés (ARCHIM : www.culture.gouv.fr/documentation/archim/accueil.html). Dans plusieurs cas, les fonds d'archives traités peuvent être complétés par des sources conservées ailleurs, ce qui a suscité des projets coopératifs (AD Aube et Bibliothèque municipale de Troyes ; AD Aveyron et AD Haute-Garonne). Parfois aussi la collaboration avec des chercheurs ou centres de recherche est importante pour mener à bien l'analyse des documents (AC Douai, AD Haut-Rhin, AD Saône-et-Loire). Ainsi malgré le faible niveau d'activité dans ce domaine en France, il semble que certaines tendances voient déjà le jour.

2. La problématique actuelle ; quelques éléments de réflexion

J'essaierai maintenant de définir la problématique et d'apporter quelques éléments de réponse ou pistes de réflexion aux questions posées.

2.1. Pourquoi numériser des actes ou sceaux du Moyen Âge ?

Redisons-le d'abord, la numérisation n'est jamais une fin en soi, mais un moyen d'atteindre un objectif. Dans le domaine qui nous occupe et sans doute encore plus que pour les manuscrits littéraires ou scientifiques qui sont pour la plupart catalogués à l'exemplaire, la numérisation permet de communiquer facilement des séries importantes d'actes peu connus ou inédits. Leur diffusion sur Internet (dans une moindre mesure, sur CD) permet au chercheur de localiser rapidement (sous réserve que son moteur de recherche trouve le gisement de documents, et que la banque de données qui les contient y donne accès facilement), de télé-charger, d'étudier chez lui, armé de toute sa documentation et bibliographie, de manipuler, imprimer, confronter entre elles, commenter, transcrire, intégrer dans son propre corpus, des reproductions électroniques des sources primaires, sans passer par le truchement d'une édition, quand celle-ci existe. Il pourra faire subir à l'image numérique des manipulations que jamais le document original n'aurait pu supporter ou permettre (agrandissements, extraction de la page, recompositions, segmentations, annotations...). Le service détenteur des originaux aura ainsi protégé ce fonds, qui ne sortira plus à l'avenir du magasin d'archives pour subir dans la salle de lecture un choc thermique, une lumière intense, sans parler des risques mécaniques.
La question, pour le responsable du fonds, est donc bien de déterminer si celui-ci est suffisamment connu ou consulté pour susciter l'intérêt d'un nombre significatif de chercheurs. Or la réponse est souvent négative : aujourd'hui les publics des salles de lecture et les correspondants éloignés des services d'archives ne s'intéressent que rarement aux fonds diplomatiques médiévaux. En l'an 2000, au Centre historique des Archives nationales, qui détient des fonds extrêmement prestigieux et connus, les chercheurs en histoire médiévale ne représentaient que 5 % du public inscrit (476 chercheurs sur 9 711). Une nuance doit être apportée àces affirmations dès lors que l'on parle de manuscrits enluminés ou de sceaux, car ceux-ci peuvent concerner en outre les historiens d'art d'une part, des publics émergents d'autre part, tels que les éditeurs et iconographes, les enseignants et publics scolaires.
Pour les archivistes cela ne va donc pas de soi de numériser un fonds d'actes médiévaux. Un tel fonds devra se distinguer sans conteste par son intérêt national ou international pour être inclus dans un programme de numérisation.
Bien sûr il est assez facile de prendre ce raisonnement à contre-pied. Tout fonds numérisé et diffusé sur Internet suscitera l'intérêt et sera plus consulté qu'avant. Si certains programmes aboutissent, on peut être sûr qu'ils orienteront et développeront la recherche en histoire médiévale dans certains domaines. Si le concepteur de la banque de données en ligne pense à des interfaces de consultation simples et conviviales (indexation générique, glossaires, transcriptions et traductions, parcours guidés...), les publics émergents et le grand public en général, pourront se pencher sur des sources qui leur apparaissent aujourd'hui trop difficiles à aborder.
On peut cependant comprendre que la numérisation des fonds médiévaux ne soit pas prioritaire dans les programmes lancés par les détenteurs de ces fonds.
Il est donc extrêmement intéressant de constater que des projets de numérisation de documents médiévaux conservés dans les services publics d'archives voient le jour dans les unités et instituts de recherche. Outre les travaux de l'Institut de recherche et d'histoire des textes qui font l'objet d'un article dans le présent numéro, je citerai le projet d'une équipe pluridisciplinaire coordonnée par P.Y.. Laffont, maître de conférences à l'université du Maine (mél : py.laffont@wanadoo.fr), qui vise à publier sur Internet une banque d'images numériques des registres d'estimes du Vivarais de 1464 conservés aux Archives départementales de l'Ardèche (14 000 pages en tout, déjà numérisées en niveaux de gris à partir d'un microfilm ; trois index des anthroponymes, des toponymes et des matières sont en cours de réalisation). Il est certain que des initiatives extérieures peuvent aider un service d'archives à convaincre la collectivité territoriale ou l'organisme dont il dépend de financer ou soutenir ce genre d'opération, qui, même ponctuelle, en entraînera souvent d'autres.

2.2. Quelles techniques utiliser ?

Évoquons maintenant les paramètres techniques. Ceux-ci ont évolué très vite, de sorte que ce qui était très difficile voire impossible il y a trois ans est aujourd'hui possible. L'on peut en effet dire qu'il est maintenant possible de numériser n'importe quel type de document d'archives, y compris les actes médiévaux originaux.
Les techniques de numérisation indirecte, autrement dit de numérisation de supports intermédiaires (photographies ou microfilms) sont largement répandues en France et bien éprouvées. Des chaînes de production de type industriel ont été organisées par des sociétés privées qui jouent le rôle de prestataires de service, et peuvent numériser par jour plusieurs milliers d'images de microfilms en niveaux de gris, ou traiter des diapos ou ektachromes en lots montés sur des châssis. Ces entreprises ont élaboré des procédures de contrôle de qualité et de post-traitement des images, qui permettent d'en vérifier la résolution, le cadrage, le rendu colorimétrique le cas échéant, d'en réaliser la compression et l'enregistrement sur CD.
Comme de nombreux fonds d'archives anciens ont été microfilmés ou photographiés, cette solution s'applique dans de nombreux cas. Mais elle suppose tout de même de disposer de supports intermédiaires de qualité. Ceci signifie d'abord qu'il convient d'utiliser les masters des microfilms ou des copies de première génération des masters pour la numérisation, et non les copies de consultation trop rayées ou oxydées. De même, des photos couleur vieillies (la durée de vie d'un phototype couleur avoisine les vingt ans dans les meilleures conditions de conservation) ne seront pas de bons supports de travail. La qualité médiocre des microfilms argentiques noir et blanc datant des années 1960-1970, époque des premières campagnes systématiques de microfilmage, peut rendre une opération de numérisation difficile voire impossible. Les lacunes et flous, notamment, mais aussi des changements fréquents du taux de réduction, des densités faibles, peuvent devenir à ce point gênants qu'il vaut mieux parfois recourir au document original. Ce sera le cas, par exemple, pour les registres de la chancellerie royale française conservés au Centre historique des Archives nationales.
Les appareils professionnels de numérisation directe ont fait de très importants progrès ; le grand public et les chercheurs en voient les retombées dans les magasins où sont vendus des appareils photo numériques capables de repro-duire correctement une charte médiévale dans la salle de lecture d'un service d'archives. Dans un atelier professionnel, il est désormais possible de numériser directement à haute définition, grâce à des dos numériques, en exploitant les performances de l'optique traditionnelle, des documents dont la taille peut varier de quelques centimètres à un mètre carré ou plus. Des scanners grand format de très haute qualité sont capables de traiter, éventuellement en plusieurs morceaux ensuite « recollables », des registres anciens ou des rouleaux de parchemin. Ceci a un coût parfois important, mais toujours moindre que celui de l'exploitation et de l'entretien d'une chaîne photographique analogique. Le gain de temps est également important, puisqu'aucun développement n'est nécessaire. Le temps du microfilm et de la photo analogique est compté ; dans une dizaine d'années tout au plus on numérisera tout.
Cependant les documents médiévaux originaux restent bien souvent parmi les plus délicats à numériser, comme ils l'étaient déjà à photographier. Cela tient à une présentation matérielle qui varie considérablement d'un acte à l'autre, qu'il s'agisse du format, de la qualité et de l'état du support parchemin, de l'existence ou pas de plis rétifs et de sceaux. Dans ces conditions, toute prise de vue numérique directe requiert une manipulation souvent longue et délicate de l'original, l'entrée de nouveaux paramètres dans l'ordinateur qui pilote la numérisation, un nouveau réglage de l'objectif, voire des opérations de restauration (mise à plat) préalables. Le registre sera en général plus facile à numériser que le chartrier, le cartulaire que le recueil factice d'actes montés sur onglets. Toutes ces considérations incitent à la prudence, et conduisent souvent à faire le choix de créer un atelier interne de numéri-sation pour ces documents éminemment hétérogènes, tout en sous-traitant la production de masse à partir de microfilms ou photos.
Dans tous les cas il aura fallu bâtir un cahier des charges précis, incluant un plan de nommage des images numériques, réfléchir aux modalités de contrôle, de post-traitement et d'archivage de ces images. Le service détenteur du fonds aura besoin de constituer une équipe pluridisciplinaire où les compétences et moyens informatiques seront indispensables, les savoir-faire photographiques (notamment ceux liés à la maîtrise de la colorimétrie) des atouts très appréciables. Remplir toutes ces conditions n'est pas facile pour un service d'archives ou pour l'organisme de tutelle. Si elles sont remplies, le service détenteur des documents pourra ainsi obtenir des archives numériques dont il dérivera, systématiquement ou sur demande, toute image de moins grande taille et volume, destinée par exemple à être diffusée sur Internet, à intégrer un CD-Rom multimédia, ou à être imprimée en grand format.
Arrêtons-nous un instant sur la question essentielle et générale du poids des images numériques. Chacun sait que si l'on utilise un ordinateur standard muni d'un modem classi-que et connecté via une ligne téléphonique à l'Internet, il faudra entre trente secondes et une minute pour télécharger une image faisant 150 Ko, consultable intégralement sur un écran en 800 x 600 points. Cette image ne sera satisfaisante que pour les sceaux ou les chartes de petit format. Une image de grand format dont la résolution d'origine est à 300 dpi peut grâce à des techniques de compression bien maîtrisées, permettre une lecture très facile d'un document original plus grand, pour un volume de 200 à 300 Ko et un temps d'attente supérieur à une minute. Si l'on veut télécharger par le Web une image à très haute définition qui seule permettra de voir tous les détails de l'écriture du texte ou du grain du parchemin, il faudra attendre plus longtemps. Mais toujours moins longtemps que si l'on prenait l'avion ou le train pour se rendre dans le centre d'archives concerné ! Le poids unitaire des images n'est donc pas le problème, d'autant plus que le débit des réseaux va augmenter. Le problème est celui de la gestion sur un serveur de quantités très importantes d'images pour un trafic et un nombre de connexions élevés. Ce problème est en cours d'étude dans plusieurs services français d'archives et au ministère de la culture.
Tout ceci pour dire que qui numérise aujourd'hui des actes médiévaux (ou d'autres documents) doit de préférence miser sur la qualité de la numérisation, et s'organiser en conséquence.
Qu'en est-il, maintenant, de la reconnaissance automatique de formes ou de caractères appliquée aux manuscrits ? La reconnaissance automatique de caractères manuscrits, le jour où elle sera opérationnelle, permettra entre autres de faire transcrire un acte par l'ordi-nateur et de l'indexer automatiquement en plein texte. Divers projets de recherche français, comme PHILECTRE, ont abouti pour l'ins-tant au « nettoyage » automatique des images, et à la reconnaissance automatique de formes ou de segments de texte. La plupart de ces projets sont basés sur des corpus de documents assez récents, mais leurs résultats intéressent le traitement des images numériques d'actes médiévaux. L'un d'entre eux (projet européen DEBORA, Digital accEss to BOoks of the RenAissance, http://debora.enssib.fr) a permis de développer un programme de reconnaissance des formes typographiques et éléments de décoration d'incunables. Un second, piloté notamment par les Archives départementales de la Mayenne, relatif à des documents du xixe siècle, a déjà permis de mettre au point un systè-me de découpage de documents en zones physiques définies par leur position, et de reconnaissance des chiffres arabes manuscrits. Un tel outil pourrait sans doute s'appliquer facilement pour identifier automatiquement dans un registre du Moyen Âge le début et la fin d'un acte, son numéro d'ordre dans la marge, son titre, la foliotation du registre de façon à automatiser ou à faciliter l'indexation du document. Les robots mis au point ont ceci d'intéressant qu'ils sont capables de s'adapter eux-mêmes à de nouvelles situations et d'apprendre de nou-velles formes. Ces recherches sont très prometteuses et devraient aboutir assez vite en archives à des réalisations concrètes ; il faut souhaiter que les technologies mises au point en laboratoire puissent ensuite se répandre.

2.3. Quels traitements documentaires réaliser ?

Pour exploiter les images numériques, il faut les analyser dans une base de données, ou plus exactement analyser les documents numérisés. Choisir un logiciel, élaborer une grille descriptive, développer une application, faire toutes les vérifications et recherches historiques nécessaires pour réaliser une analyse exacte, saisir les analyses et index, les contrôler et les homogénéiser, associer les images aux notices descriptives, toutes ces tâches constituent en fait le travail le plus long et le plus difficile pour l'équipe qui mène à bien un projet de numérisation. La production proprement dite des images numériques est toujours plus rapide. Ce fait explique en général à lui seul pourquoi des projets lancés depuis plusieurs années ne sont pas encore terminés.
Comme Laure Cedelle l'a déjà dit, les services détenteurs des fonds d'archives et des manuscrits du Moyen Âge ont pour mission de communiquer les documents au public, et ne se substituent pas aux chercheurs. Pour cette raison, et aussi parce qu'ils ne disposent pas dans leur service des moyens humains nécessaires, les archivistes ne réalisent pas la transcription ou l'édition des actes numérisés. Seule exception parmi les projets listés dans le tableau, celle des sceaux, dont les légendes sont transcrites voire traduites dans les notices descriptives. Bien sûr, lorsque les éditions de textes existent, il est techniquement possible de les scanner et de les associer à la notice du document, sous réserve d'avoir obtenu l'autorisation de l'auteur de l'édition ou de son ayant droit. Le plus souvent pour l'instant, on se contente de mentionner les éditions existantes dans le champ consacré aux notes bibliographiques.
C'est donc la rédaction de « notices points d'accès » aux documents qui est l'objectif de l'archiviste. Ce travail n'est pas tout à fait comparable à celui de la rédaction d'un instrument de recherche papier classique, puisque des représentations numériques des documents seront incluses dans la banque de données. La part de l'indexation y sera très importante, et certaines informations telles que la présentation matérielle ou les dimensions du document original, non fournies par l'image numérique, y auront souvent leur place. Par contre l'image viendra à l'appui de l'analyse : on pourra donc dans certains cas, décider de réaliser une analyse et une indexation minimales dans une grille descriptive très légère, considérant que le chercheur trouvera les autres informations en lisant le document numérisé, ou bien renseigner les champs jugés essentiels en reportant un travail plus fin à une date ultérieure.
Les choix sont d'abord faits en fonction du volume de documents à traiter. Il est le plus souvent impossible pour un service d'archives, sauf à y passer dix ans ou plus, d'analyser pièce à pièce des dizaines de milliers de brèves dans des registres de notaires, des dizaines de cartons ou de registres d'une série organique ou d'un fonds d'archives. Confronté à ce problème de traitement de masse, l'archiviste choisit de subdiviser l'ensemble d'images numériques en lots comprenant chacun quelques dizaines d'images, chaque lot d'images correspondant à un sous-dossier ou à un groupe d'actes, selon un découpage intellectuel (tranche chronolo-gique, subdivision thématique...) et de réaliser les notices décrivant les dossiers ou groupes d'actes. Chacune des notices sera ensuite associée à un lot d'images. Le travail pourra s'appuyer sur le répertoire numérique du fonds lorsqu'il existe ; cependant le répertoire décrit sommairement un carton, un registre ou un dossier dans leur ensemble ; il faudra créer des niveaux de description plus fins.
Cependant bien souvent le besoin se fera sentir d'une analyse à la pièce, pour des docu-ments bien individualisés tels que les sceaux, mais aussi pour les actes d'un cartulaire ou d'un chartrier. Par chance, de nombreux fonds d'archives médiévales ont été depuis le XIXe siècle l'objet d'une attention toute particulière et des générations d'archivistes, de chercheurs et d'érudits ont établi des inventaires analytiques ou rédigé des fiches. Souvent donc, la conver-sion rétrospective de ces instruments de recherche facilite le travail. L'existence de tels inventaires est même un élément important dans le choix des documents à numériser.
La conversion rétrospective des instruments de recherche est malgré tout rarement simple. Des strates successives d'instruments de recherche décrivant les mêmes séries ou collections peuvent exister, de sorte qu'il est souvent nécessaire de recomposer un nouvel inventaire à partir d'extraits des précédents. Passer de notices non structurées à des données réparties dans les champs d'une base informatique ne va pas toujours de soi. Plus l'inventaire est ancien, plus longue sera la phase de contrôle (contrôle de cohérence : le document a-t-il toujours la même cote ? contrôle scientifique : la recherche historique récente confirme-t-elle les informa-tions portées dans l'inventaire ?). Des compléments devront souvent être apportés à ces notices anciennes. Dans tous les cas le recours au document original sera indispensable. Enfin la conversion rétrospective de grandes quantités de fiches ou de livres a un coût important et implique de mettre en place des procédures de validation lourdes.
En ce qui concerne la structure des informations constituant la notice descriptive, les archivistes disposent depuis 1993 d'une norme internationale, l'ISAD(G), norme générale et internationale de description archivistique élaborée par le Conseil international des archi-ves, dont la deuxième édition est parue en 2000 (www.ica.org/). L'application de cette norme en France n'en est malgré tout qu'à ses débuts. Dans le domaine informatique, elle trouvera sans aucun doute un vecteur de diffusion extrêmement puissant dans la DTD-EAD (Encoded Archival Description), DTD écrite pour SGML et XML en 1998 par les archivistes américains, compatible avec l'ISAD(G) (voir le site officiel de l'EAD : www.loc.gov/ead/ ). La mise en oeuvre de ce standard est essentielle dans le cas de projets de banques de données destinées au public et à la communauté scientifique : utiliser pour les notices une même structure et un même balisage de contenu indépendants des plates-formes permet ensuite d'archiver, d'échanger et de diffuser très facilement des informations. Sans entrer dans le détail, disons que pour la première fois, les détenteurs de fonds d'archives disposent d'un ensemble de règles communes pour la saisie informatique des instruments de recherche, qui prennent en compte les principes de la description par niveaux et du respect des fonds. Disons aussi que du même coup les bases de données existantes sont aujourd'hui autant d'instruments de recherche à restructurer. Ajoutons que cette DTD prévoit des éléments de lien susceptibles notamment de permettre l'affichage des images des documents décrits. Les quelques projets pilotes lancés dans ce domaine en France aboutiront dans l'année.
La DTD conçue dans le cadre du projet européen MASTER (Manuscript Access Through Standards for Electronic Records, www.cta.dmu.ac.uk/projects/master/index.html, avec la participation, entre autres, de l'IRHT, pour encoder des descriptions très précises de manuscrits médiévaux, concerne plutôt les oeuvres littéraires. Mais elle est susceptible d'évoluer pour s'adapter à la description des actes. Une bibliothèque de balises corres-pondant aux parties du discours diplomatique permettrait par exemple de structurer en XML les transcriptions des actes et faciliterait les recherches très fines au sein de corpus importants. Rien n'interdit techniquement de combiner l'une et l'autre des DTD ; cette voie n'a pas encore été explorée.
Il est tout aussi essentiel, afin d'éviter sur le Web la cacophonie si nuisible à la recherche d'informations, de définir des règles communes pour l'indexation des documents : règles sémantiques (par ex. : quel vocabulaire choisir pour les matières, pour les catégories intel-lectuelles de documents ? comment répondre aux besoins de tous les publics, amateurs, scolaires, iconographes, chercheurs et autres ?), règles syntaxiques (par ex. : comment libeller une entrée d'index dans un index des noms de personnes ou de lieux ? où trouver des fichiers d'autorités ?). Les grandes institutions de recherche ou de conservation ont élaboré leurs propres règles en s'appuyant sur les normes édictées par l'AFNOR, sur les travaux de la Bibliothèque nationale de France, sur les vocabulaires et thesaurus génériques ou spécialisés existants. Lorsqu'ils se lancent dans des projets de numérisation ou de création de bases de données, les autres services sont tentés de créer aussi leurs propres règles, faute de référentiel commun. Il me paraît donc urgent de réunir des équipes interdisciplinaires, comprenant des archivistes, bibliothécaires et chercheurs, pour élaborer ensemble des règles d'indexation communes. Ceci vaut bien entendu notamment pour les actes et sceaux du Moyen Âge et pour toutes les autres catégories de documents primaires.

2.4. Quelles interfaces de consultation ?

Je me contenterai ici de dire que tout ou presque est encore à construire. L'essentiel, du point de vue technique, est sans doute d'utiliser des architectures informatiques évolutives, capables d'intégrer les nouveautés techniques telles que l'EAD, des quantités de données et d'images importantes, ou de nouvelles « briques » telles des éditions de texte récupérées ou issues (bientôt peut-être) de la reconnaissance automatique de caractères manuscrits. En ce qui concerne les points d'accès aux documents, un moteur de recherche en texte intégral et des index contrôlés peuvent coexister, et répondre tour à tour aux besoins du chercheur ou de l'amateur. Le feuilletage performant d'images (feuilletage des pages d'un cartulaire ou d'une collection de sceaux), l'affichage sur demande d'images à haute définition, la mosaïque d'images, le zoom, sont autant de fonctionnalités bien présentes sur les cédéroms, et encore très rares en France sur Internet.
Le produit en ligne présente un grand avantage par rapport au cédérom multimédia de ressources : il peut être mis à jour à volonté, qu'il s'agisse de corrections ou d'ajouts. Des problèmes de gestion de volumes d'images et de trafic réseau se posent cependant, comme dit plus haut. Mais ces problèmes seront résolus. La banque de données en ligne rompt radicalement avec l'instrument de recherche papier, car elle n'oblige ni à l'exhaustivité ni à la perfection éditoriale, étant modifiable par ses auteurs. Ceci peut encourager les détenteurs de fonds à se lancer dans un projet pilote, qui se métamorphosera sans cesse, mais dont même la première version pourra rendre de grands services au public.
Une banque de données en ligne peut même être ouverte en écriture, en prévoyant éventuellement un système de codes d'accès, à des chercheurs répartis sur un territoire, qui effectuent des saisies en réseau et enrichissent ainsi les notices existantes de leurs connaissances pointues, en identifiant par exemple un nom de lieu, une personne, un autre exemplaire du document décrit, ou qui rédigent une édition critique de l'acte. L'informatique pourrait ainsi aider de nouvelles formes de collaboration entre chercheurs et détenteurs des fonds à voir le jour.
L'indexation des sites eux-mêmes et leur référencement dans des annuaires spécialisés, tels Ménestrel, sont bien sûr la dernière étape très importante pour le succès d'une banque de données en ligne. Enfin, l'analyse statistique de la consultation d'un site peut apporter des éléments de réflexion très utiles à son amélioration.

3. Conclusion

Pour conclure, je voudrais juste insister sur un point que j'ai souvent abordé dans ces quelques lignes. Il me semble que la coopération entre archivistes et bibliothécaires, infor-maticiens, laboratoires de recherche, prestataires de service et universités constitue aujour-d'hui une des clés de la réussite d'un projet de numérisation. Chaque partenaire y a son rôle et y apporte ses propres compétences. Les moyens financiers dégagés sont plus importants, les travaux scientifiques plus riches, la numérisation plus rapide, les perfor-mances techni-ques des systèmes bien meilleures. Souhaitons que les projets coopératifs existants réussissent et que de telles synergies se multiplient.

>> en annexe, tableau des projets de numérisation d'actes et sceaux du Moyen Âge dans les services d'archives publics français

 

Previous Page Table Of ContentsNext Page

© CNRS - IRHT 2004 - Contacts - Infos légales - Rédaction