Numérisation et paléographie
Marc Smith École nationale des chartes msmith@enc.sorbonne.fr
Acteurs des développements actuels
On peut imaginer que vers 1475, le copiste, au petit matin, en réchauffant son encre gelée, devait parfois se demander : à quoi bon ? Ne ferais-je pas mieux d'investir dans les nouvelles technologies, et de m'établir imprimeur comme mon beau-frère qui a réussi ? Mais... comment être sûr que ceci tuera cela ?
C'est un lieu commun : nous sommes aujourd'hui dans un état d'incertitude comparable. Sans parler de l'avenir du livre en général, que nous laisserons aux futurologues, mais en nous limitant au sujet d'aujourd'hui, les manuscrits et documents médiévaux, il est assez difficile d'avoir une vision claire non seulement de l'avenir, mais même du présent. Les progrès techniques se succèdent d'année en année, voire de mois en mois. Beaucoup de projets de numérisation sont en cours. Un certain nombre ont été annoncés mais végètent ou ont été abandonnés. D'autres ont abouti mais restent, dans la pratique, difficiles à évaluer dans leur ensemble ; ou, du moins, leur impact reste insuffisant. La majorité donnent en effet lieu à des CD-Rom dont on peut parvenir à trouver les références (notamment grâce à la Gazette du livre médiéval) 3, mais dont on voit encore trop peu la couleur dans nos bibliothèques, pour des raisons soit financières, soit techniques, soit d'habitudes de travail 4. Une minorité, mais comprenant des projets d'un intérêt notable, sont en revanche disponibles, au moins partiellement, en ligne sur Internet 5. Il existe aussi, heureusement, un peu de littérature publiée par les promoteurs de diverses entreprises, qui permet notamment au profane de s'initier à un certain nombre de problèmes techniques 6, et de nourrir quelques réflexions théoriques 7.
Numérique et analogique
Pourquoi numériser ? Au-delà de l'intérêt intrinsèque qu'il y a à expérimenter des techniques nouvelles, qu'est-ce que le numérique peut apporter de plus que la reproduction « analogique » ; c'est-à-dire que la reproduction photographique sur papier ou sur microforme, que nous pratiquions jusqu'ici sans même savoir que c'était de l'analogique (de même que le copiste faisait, à son insu, des manuscrits : il pensait faire des livres). Que gagne-t-on, ou que perd-on, dans le numérique, par rapport à ces reproductions classiques, voire par rapport à l'examen de l'original lui-même ?
L'investissement financier et humain dans les nouvelles techniques débouche-t-il uniquement sur la sophistication des moyens employés ou bien peut-il profiter aussi à la connaissance de l'écrit médiéval ? Comment être sûr que c'est bien la fin qui justifie les moyens et non l'in-verse ? Il importe de garder la question à l'es-prit, non pas par méfiance gratuite à l'égard du progrès technique, mais parce que, dans l'octroi des financements et des soutiens institutionnels en général, l'heure paraît souvent être à la promotion de l'innovation dans les méthodes, plus spectaculaire peut-être, ou du moins plus facile à mesurer, pour les non-spécialistes appelés à juger, que la qualité et la pertinence des résultats : les nouvelles technologies offrent aux administrateurs de la science un dénominateur commun un peu trop commode.
Le présent rapport étant le premier de la journée, profitons-en pour rappeler quelques aspects techniques élémentaires, qui dépassent le cadre de la paléographie.
Il a été reconnu depuis longtemps, depuis l'époque lointaine du vidéodisque, que l'image numérique n'a de sens et d'utilité que liée à un ensemble de données qui en permette le repérage et l'exploitation. Mais envisageons pour commencer l'image en elle-même. L'image numérique a plusieurs avantages évidents 8 :
- Un coût relativement faible 9, qui permet des reproductions nombreuses, même en couleur ; d'où la possibilité de passer plus facilement de la reproduction sélective à des entreprises de couverture systématique : a) intégralité d'un manuscrit, y compris des détails, la reliure, etc. ; ou b) couverture extensive de collections, de fonds d'archives entiers. Cet avantage économique appartient aussi à d'autres procédés, comme la microfiche en couleur 10. La paléographie progresse par la comparaison du plus grand nombre de pages écrites : la seule augmentation des fac-similés ne peut déjà que nous réjouir.
- La maniabilité de l'outil numérique favorise aussi la comparaison, du moment qu'on peut faire apparaître sur le même écran deux pages conjointement, ou un nombre potentiellement infini en succession rapide, d'une manière autrement plus efficace qu'avec de grands albums de fac-similés. Idéalement, chaque chercheur pourra même, par copie, par capture des images, constituer ses propres dossiers de fac-similés numériques, très maniables, structurés, et sans perte de qualité visuelle, contrairement à la photocopie.
- Autre avantage spécifique, différents traitements peuvent être appliqués à l'image, surtout quand la numérisation a été faite directement sur l'original 11 : par exemple, a) de très forts agrandissements, supérieurs à ceux d'une photographie classique et potentiellement illimités ; ceux-ci permettent de mieux examiner un détail minime ou de procéder à une mesure beaucoup plus précise des dimensions d'une lettre ; b) le paramétrage des couleurs, des contrastes etc., peut faire ressortir plus clairement un texte difficile à lire, il peut permettre une restauration virtuelle, le nettoyage de taches, jusqu'à dégager dans un palimpseste la scriptio inferior de la scriptio superior 12 ; par ailleurs, la juxtaposition, voire la superposition par transparence d'échantillons d'écriture découpés dans une page permet des comparaisons morphologiques précises. La superposition du recto et de l'image inversée du verso doit permettre aussi d'isoler les traces d'encre qui ont traverséla feuille (comme on pouvait le faire manuellement en joignant dos à dos deux photocopies devant une source lumineuse). La paléographie y gagne indubitablement, ici surtout dans une perspective analytique et pour l'étude de documents difficiles.
- Ce qui est loin d'être résolu, malgré les espoirs des uns et les craintes des autres, c'est la reconnaissance optique des caractères manuscrits, la lecture automatique 13. On a aussi cherché à élaborer des programmes pour comparer automatiquement des mains, ou pour en représenter un certain nombre de caractéristiques sous une forme mathématique, à partir de mesures soit automatiques soit manuelles. Si toutes ces études pionnières ne paraissent pas devoir déboucher dans l'immédiat sur des pratiques généralisées, ne serait-ce qu'en raison des compétences nécessaires 14, il est certain que le traitement numérique peut faciliter au moins une phase préliminaire de mensuration et de classement, voire la constitution de bases de données illustrant tous les détails graphiques que l'on voudra 15.
L'image numérique a aussi des inconvénients qu'il ne faut pas sous-estimer. (Passons sur les problèmes juridiques, et sur le risque théorique de voir l'habitude de la consultation virtuelle remplacer la fréquentation des originaux) 16. L'obstacle principal, à l'heure qu'il est, est encore l'espace de mémoire nécessaire. Ces gros fichiers freinent principalement la distribution en ligne : les images à haute définition ne sont encore aisément exploitables qu'en local, notamment sur Cdrom. Or jongler avec plusieurs CD-Rom (fonctionnant sous des logiciels divers), pour comparer des corpus différents, n'est pas nécessairement plus commode que de jongler avec des volumes in-folio. Le CD-Rom, voire le DVD, céderont sans doute la place une fois que les réseaux à haut débit auront rendu superflu le recours à un support matériel pour le transport de gros fichiers.
Le problème du niveau de définition des images est donc certainement provisoire - et ce serait une grave erreur que de déterminer la qualité des prises de vue numériques en fonction des limitations actuelles, à moins que l'on ne veuille recommencer dans cinq ans les mêmes campagnes photographiques. La précision de l'image est évidemment cruciale pour les paléographes : l'écriture nécessite en effet un niveau de résolution supérieur à celui qu'exige l'image (même la miniature), disons quelque 300 ppp, ne serait-ce que pour être correctement lisible, sans parler d'observations de détail et des agrandissements démesurés évoqués ci-dessus. En tout état de cause, une écriture sera toujours plus difficile à lire, à sa dimension réelle, sur écran que sur papier. La comparaison entre écritures différentes est aussi rendue plus incertaine par des reproductions de finesse inégale, sans parler de l'échelle (d'autant que l'échelle est très généralement inconnue, la dimension de l'original n'étant pas indiquée au lecteur).
S'y ajoute un problème d'ergonomie lié à la dimension limitée de l'écran, qui est souvent inférieure à celle du document. C'est le cas pour de vastes diplômes comme pour les manuscrits in-folio. La plus grande gêne est causée par les textes (surtout des documents) qui dépassent l'écran en largeur : le défilement vertical est un mode de lecture naturel, mais le va-et-vient horizontal à chaque ligne rend la lecture très vite insupportable et surtout multiplie à l'infini le risque d'erreurs de repérage visuel, donc d'omissions. On n'y remédie que partiellement en fournissant du même document une « imagette » qui permet au moins d'en avoir au préalable une vision d'ensemble. La possibilité théorique de comparer plusieurs pages sur un même écran suppose à plus forte raison un écran de grandes dimensions. Et plus on voudra enrichir les informations fournies avec l'image, plus le problème ergonomique sera crucial. Certaines présentations existantes, qui multiplient les fenêtres pour juxtaposer l'image, sa transcription, son commentaire et d'éventuels instruments de navigation, sont aussi pratiques que la manipulation des Chartae latinae antiquiores dans une cabine téléphonique.
Acteurs des développements actuels
Les collections numériques ne constituent en effet pas que des albums à feuilleter au hasard. Leur valeur ajoutée vient de l'organisation du matériau, d'une structuration calculée, en général par le recours à une base de données, et de son enrichissement par des informations diverses, en fonction de l'exploitation prévue. De ce point de vue, on peut dire que, parmi les entreprises actuelles, seule une minorité ont une perspective paléographique affirmée. La plupart ne sont faites ni par des paléographes ni pour eux. En revanche, les différentes perspectives qu'elles traduisent peuvent toutes intéresser, de manière complémentaire, les paléographes.
Dans la paléographie proprement dite, les réalisations pédagogiques semblent commencer à bouillonner plus que les projets scientifiques 17. Citons parmi les plus intéressantes le Cdrom Ductus développé par Bernard Muir, de l'université de Melbourne (écritures livresques) 18, et le cours de paléographie (documentaire) réalisé par Dave Postles de l'université de Leicester avec le West Sussex Record Office, limité à quelques chartes mais qui associe étroitement le document et son contenu, soit la paléographie, la diplomatique, l'histoire du droit, de la langue, etc. 19. Ces réalisations ne concernent pas directement la recherche, mais les solutions techniques et ergonomiques utilisées peuvent aussi servir à inspirer des projets scientifiques, dans l'intégration parfois très astucieuse du document, de sa transcription et de toute la matière ajoutée, commentaire et annotation.
La première structuration possible de grands ensembles de documents numérisés lie les images à un catalogue ou à un inventaire électronique. Un rôle moteur, de ce point de vue, revient aux institutions de conservation, bibliothèques et archives. Leur but est de valorisation et de conservation : il s'agit de placer à la disposition du public, d'un public le plus large possible, des documents soit prestigieux soit très demandés - mais aussi, dès maintenant, des fonds entiers, des collections complètes -, tout en mettant les originaux à l'abri des manipulations. Les besoins du public historien peuvent être satisfaits en ligne par des documents d'archives d'une qualité volontairement limitée mais suffisante pour la lecture, les fichiers haute définition étant seulement consultables sur place. On connaît la base Archim des Archives nationales 20, et des programmes prometteurs sont en cours dans certains départements, ou sur l'ensemble de certaines catégories de documents, comme l'état civil d'Ancien Régime 21.
En Allemagne, la ville de Duderstadt a déjà mis sur Internet tous ses fonds anciens jusqu'au XVIIe siècle 22 ; de même Florence, l'intégralité d'un fonds essentiel, le Mediceo avanti il Prin-cipato 23. Ces cas sont peut-être plus éloquents que les exemples français : on dispose ainsi à distance d'ensembles documentaires supérieurs à tout ce qu'il pouvait y avoir jusqu'ici en France de fac-similés d'écriture allemande ou italienne. Dans une qualité variable : à Duderstadt du noir et blanc lisible, sans plus, mais en plein écran ; à Florence d'admirables numérisations en couleur, mais dans une assez petite fenêtre.
Dans les bibliothèques, chez les conservateurs habitués à cataloguer des manuscrits, le souci paléographique est peut-être plus sensible, par exemple dans la numérisation des manuscrits du Vatican en partenariat avec IBM, dans les projets des bibliothèques anglaises, à Londres, Oxford et Cambridge, ou dans le projetDigital Scriptorium, qui associe différentes bibliothèques universitaires américaines 24.
Malgré les motifs de satisfaction, il reste que, pour des raisons tant budgétaires que juridiques, les numérisations extensives de ce type seront toujours tributaires des objectifs propres aux archives et aux bibliothèques, plus que des besoins des différentes spécialités de recherche. Les choix de notre Bibliothèque nationale, désormais orientés en priorité vers le « développement culturel », en offrent un exemple caricatural : au-delà des problèmes déjà connus (comme la numérisation des imprimés en mode image), on ne peut qu'être frappé de voir la BnF conforter le public dans l'idée, déjà trop enracinée, que le département des Manuscrits est un musée de l'enluminure.
Mais, à l'inverse, combien y aurait-il de chercheurs universitaires prêts à s'atteler à cette tâche de longue haleine qu'est le catalogage des manuscrits, et d'abord à reconnaître une entière dignité à cette austère et exigeante discipline ? En Italie, deux entreprises d'avenir montrent la voie de la collaboration, non sans susciter un peu de saine polémique. Deux collections complémentaires de catalogues y sont en train de se dédoubler, entre support papier et CD-Rom : d'une part le Catalogo dei manoscritti datati d'Italia, initiative qui appartient en propre aux paléographes, et d'autre part les catalogues régionaux des manuscrits, qui relèvent au premier chef des institutions de conservation mais qui sont pilotés en partie par les mêmes spécialistes universitaires. Ainsi le catalogue des manuscrits de Toscane (contrairement aux précédents catalogues sur papier, non illustrés) complétera désormais les notices par des reproductions de pages des manuscrits, le tout géré par le logiciel Isis que distribue l'Unesco 25. De même, un CD-Rom des rouleaux liturgiques médiévaux de l'Italie méridionale a inauguré en 1999 une collection publiée sous le double sceau de l'université de Cassino et du ministère italien de la Culture ; faisant suite à une exposition, il se situe dans une perspective de conservation, de pédagogie et de recherche tout à la fois, visant non seulement les savants mais aussi le grand public 26.
Une perspective inverse à celle des grands catalogues est la mise en oeuvre fouillée et techniquement sophistiquée d'un seul document. Des développements techniques particulièrement utiles dans ce sens viennent du côté des philologues : s'intéressant en premier lieu au contenu textuel, ils n'ont pas dû attendre l'image numérique pour traiter par l'informatique la matière même des documents, le document intégral par opposition à la simple notice catalographique. Les sites proposant des textes édités sur Internet, sans compter les CD-Rom, sont sans comparaison plus nombreux déjà que les projets portant sur les images de manuscrits (cf. le recensement effectué par René Pellen pour Ménestrel).
Mais ce qui est plus prometteur pour nous, c'est une étape plus récente : les éditions hypermédia, l'association étroite du texte numérique avec l'image des divers documents qui peuvent servir à mieux le comprendre, et en premier lieu du ou des manuscrits. L'exemple a été donné par plusieurs initiatives consacrées chacune à un texte ou à une catégorie de textes, et qui sont d'ailleurs loin de se limiter au Moyen Âge, puisque les manuscrits contemporains, voire l'histoire de l'édition, constituent des chantiers comparables en complexité. Sans empiéter plus longtemps sur le terrain qui ici relève plutôt de R. Pellen, on peut citer au moins des recherches d'intérêt général comme le projet Philectre (Philologie électronique), mené sous l'égide du CNRS entre 1994 et 1997 27, ou le programme européen Bambi (Better Access to Manuscripts and Browsing of Images) 28 ; et quelques mises en oeuvre qui peuvent servir de modèles, comme le projet franco-américain Charrette sur Chrétien de Troyes 29, ou les diverses entreprises anglaises, en ligne ou sur CD-Rom : Electronic Beowulf, Canterbury Tales, Piers Plowman, York Doomsday Project (théâtre médiéval)... 30 Les meilleures de ces entreprises permettent de combiner les approches de la philologie, de la codicologie et de la paléographie.
Formats électroniques
Ce que les spécialistes des textes ont apporté d'essentiel, c'est une méthode de balisage des textes qui en fait des hypertextes, susceptibles de divers modes d'interrogation et d'exploitation, et enrichis de liens multiples vers des documents divers. L'image brute du manuscrit était restée jusqu'ici un matériau inerte, animé seulement par l'oeil et le cerveau du lecteur. En l'absence de reconnaissance automatique des caractères, ce n'est pas un vrai texte exploitable en tant que tel par une machine, avec des outils textuels. En revanche, on aperçoit désormais, du moins au stade du prototype (Philectre), des moyens plus ou moins automatiques pour établir des liens logiques entre cette image et la transcription qui en a été faite (transcription qui reste manuelle). L'image de la page peut être découpée, de manière plus ou moins automatique, en lignes, voire en mots, associés par la machine aux lignes ou aux mots du texte 31. Par conséquent, il devient possible d'effectuer des recherches sur le manuscrit par l'intermédiaire de la transcription.
Cela suppose certes un travail de préparation important, un balisage de la transcription comme on en pratique déjà surtout pour le contenu des textes, en vue d'études littéraires ou linguistiques. La paléographie demande la multiplication des balises correspondantà des caractéristiques graphiques (ou codicologiques) : types d'écriture, variantes morphologiques d'une lettre, changements de main, de cahier, etc. 32. En gros, cela revient à supprimer ou du moins à réduire la séparation inévitable dans les éditions de texte traditionnelles, entre d'une part la transcription, qui traduit la variété d'un ou plusieurs manuscrits dans l'homogénéité d'un texte typographique, et d'autre part le commentaire courant de cette hétérogénéité originelle, variantes textuelles et particularités graphiques, qui est rejeté dans l'apparat critique. Cela n'économisera pas le travail du premier paléographe qui examine le texte, mais rendra son travail directement vérifiable et réutilisable par les suivants, condition sine qua non de tout progrès scientifique.
Les besoins des paléographes sont à mi-chemin entre ceux des philologues, travaillant sur des textes que la machine sait interpréter elle-même, et ceux des historiens de l'art, qui accèdent directement aux images, jusqu'ici essentiellement par une indexation plus ou moins normalisée, mais qui commencent aussi à parler d'hyperimages, c'est-à-dire d'attacher directement aux images des balises et des liens, pour les rendre signifiantes, intelligentes, sans même passer par l'intermédiaire d'un texte ou d'une base de données 33. On voit que la paléographie se trouve ici au carrefour de différentes dimensions du manuscrit et de différentes approches spécialisées, visant à créer une sorte de reproduction active ou intelligente, dans laquelle on pourrait « naviguer » de manière plus souple que dans l'original lui-même. Mais la solution bipède, philologique, texte-image, bien que plus lourde, l'emportera sans doute du point de vue des paléographes, pour qui le texte est en même temps un ensemble de formes, ou vice versa.
Pour ne donner qu'un exemple, supposons un manuscrit dont les cahiers aient été remaniés, redistribués, voire partagés entre deux volumes ; on peut imaginer un instrument logiciel qui permette de rétablir virtuellement l'ordre originel des feuillets. Un instrument qui combinerait la rigueur des schémas de cahiers chers aux codicologues et la souplesse des plans de montage ou « chemins de fer » des logiciels professionnels de mise en pages : dans la recherche d'une cohérence d'origine du manuscrit, cohérence codicologique mais aussi paléographique et textuelle, la permutation même tâtonnante de groupes de feuillets numérisés pourrait être accompagnée automatiquement, dans la transcription, de la permutation des sections de texte qui correspondent - en même temps que le schéma codicologique se mettrait à jour. Pour le moment, tout ce que le virtuel permet de faire, c'est de recomposer cette succession originelle sans toucher à l'original, mais a posteriori : après que l'opération intellectuelle de reconstitution a été faite par des moyens traditionnels, comme on l'a illustré récemment pour un manuscrit de Boccace 34. Mais l'hypothèse d'une telle réflexion codicologique assistée par l'ordinateur ne paraît pas, à moyen terme, hors de portée.
Au total, les entreprises de catalogage et les initiatives textuelles entrouvrent donc déjà aux paléographes les deux voies d'approche complémentaires dont ils ont besoin : comparaison sommaire et sérielle entre des documents en grand nombre et examen détaillé d'un témoin particulier. Reste à rendre accessible globalement toute cette matière, en surmontant la diversité des supports et des formats. C'est ce qui fait tout l'intérêt des normes qui se développent actuellement, et plus précisément de l'extension du domaine des textes balisés au détriment des bases de données relationnelles classiques. En termes plus techniques, comme on le sait, au sein du standard SGML (Standard General Markup Language), ont été développés, outre HTML (HyperText Markup Language), désormais familier, le standard XML (eXtendable Markup Language) 35, aussi adapté à la diffusion sur Internet mais plus souple, et des initiatives sectorielles mais étroitement coordonnées qui ont l'avantage inespéré de rapprocher le format des textes et celui des catalogues, et de rendre notamment ces catalogues interrogeables indépendamment d'un logiciel donné : pour les textes, c'est la TEI (Text Encoding Initiative) 36 ; pour les inventaires d'archives, EAD (Encoded Archival Description) 37, norme américaine dont l'adaptation est en cours d'étude à la direction des Archives de France ; pour les manuscrits, aux États-Unis c'est EAMMS (Électronic Access to Mediaeval ManuScripts) 38 et en Europe MASTER (Manuscript Access through STandards for Electronic Records) 39.
La définition de normes globales et de structures souples rapproche catalogue et texte intégral, elle permet même d'imaginer des liens directs, voire un rapport d'inclusion, entre un catalogue et le texte intégral des manuscrits qui y sont décrits. Évidemment, nous ne sommes pas à la veille de convertir dans un format unique de ce type l'ensemble des catalogues existants : ni ceux qui sont sur papier, la plupart, ni ceux qui fonctionnent déjà sous forme de bases de données. Un dernier avantage de tels formats de texte balisé est que les documents peuvent être indéfiniment enrichis : on peut ajouter de nouveaux marqueurs dans un texte en fonction des questions supplémentaires qu'on veut lui poser, et on peut de même ajouter progressivement de nouvelles catégories d'informations à un catalogue. Ce qui est en germe pour les manuscrits s'applique au moins aussi bien aux documents diplomatiques. Le CD-Rom du Thesaurus diplomaticus, pour le moment, contient des images légères, qui montrent l'aspect d'ensemble du document mais ne sont guère utilisables pour l'analyse de l'écriture. Là aussi, il devrait être possible dans les années qui viennent de coupler des catalogues ou éditions de documents diplomatiques avec des images plus précises et surtout des images « actives », par des liens qui permettent d'associer, par exemple (imaginons), les différentes mains avec les intervenants nommés dans les souscriptions ou mentions hors teneur, de manière à suivre d'un acte à l'autre la trace d'un même homme, trace autographe ou non, et ainsi de mieux comprendre qui fait et qui fait faire.
Que faut-il donc numériser en priorité ? Tout est possible, et il ne s'agit évidemment pas de fixer un cap unique pour tous. Il y aura indubitablement un nombre croissant de campagnes de numérisation extensives par fonds d'archives, par collections de manuscrits ; c'est très bien, et tous en profiteront. Mais quels corpus spécifiques envisager pour nos études ? À moins de rêver que les limites techniques ne se desserrent très vite et très largement, il faut envisager des corpus voués à des traitements différenciés, plus intensifs ou plus extensifs selon les cas, selon une répartition qui correspondrait en gros à un axe chronologique, ou plus exactement à l'expansion du matériau écrit dans le temps. Je veux dire des numérisations de très haute qualité et avec des annexes plus fouillées pour les documents les plus anciens et les plus rares, et des campagnes plus massives mais plus sommaires pour les siècles les plus tardifs.
Faut-il refaire les Codices latini antiquiores, les Chartae latinae antiquiores, ces pierres de touche de toute recherche sur les premiers siècles du Moyen Âge, qu'il serait certainement utile de pouvoir manier plus facilement ? Mais ne faudrait-il pas alors revenir aux originaux, puisque la numérisation de fac-similés imprimés (et tramés et en noir) ne pourrait pas supporter une définition très élevée ? Chaque institution détentrice de collections de reproductions sera aussi amenée à se poser les mêmes questions - et à négocier, le cas échéant, les droits des institutions conservant les originaux (voire ceux des photographes !).
Pour ma part, peut-être par penchant personnel, je crois qu'un des domaines où la numérisation peut être le plus féconde est celui des écritures les plus tardives. Il y a là une masse face à laquelle les outils traditionnels ont montré leur insuffisance, leur impuissance, et qu'on pourrait mieux affronter avec des numérisations extensives. Ce serait le moyen de sortir de l'artisanat, du pièce à pièce et de l'identification d'une main après l'autre. La typologie et l'évolution générale des écritures tardo-médiévales et surtout modernes sont paradoxalement, on le sait, une terra quasi incognita. Le dernier grand essai de synthèse documentée, sur toute l'Europe, reste celui de Giorgio Cencetti 40, vieux d'un demi-siècle, travail admirable par ses ambitions mais, pour la période en question, et surtout pour les pays non italiens, condamné au pointillisme par l'indigence des fac-similés que Cencetti avait à sa disposition ; et il n'y en a guère plus aujourd'hui. La numérisation convient là à la fois par sa maniabilité et par son coût.
Rêvons donc un peu, quitte à devoir affronter ensuite les problèmes techniques (et financiers) immédiats, ici quelque peu négligés au profit des motifs d'espoir. En attendant, le marché des fac-similés reste dominé par les manuscrits à peintures imprimés sur support papier, et les éditeurs spécialisés allemands ou suisses continuent à prospérer en publiant des volumes à dix, vingt ou cinquante mille francs (français). Ce qui nous rappelle au moins que les paléographes et leurs bibliothèques désargentées, même dans l'univers « analogique », n'ont pas toujours constitué le « coeur de cible » commercial des reproductions de manuscrits. Mais dans le numérique plus que jamais, bien qu'ils puissent encore tirer parti indirectement de fac-similés réalisés dans des contextes divers, s'ils ne veulent pas se contenter de vivre de micis quae cadunt de mensa, il leur faut définir à nouveau des instruments qui leur soient propres.
3 .La chronique bibliographique réserve une rubrique à part aux microformes et publications électroniques, outre la rubrique consacrée aux nouveautés de l'Internet.
4 .Un recensement des CD-Rom disponibles dans un certain nombre de bibliothèques se trouve sur le site Ménestrel [http://www.ccr.jussieu.fr/urfist/medcdrom.htm]. On peut y noter la très faible part des fac-similés par rapport aux textes édités, aux catalogues ou aux dictionnaires.
5 . Voir aussi le recensement de ces sites sur Ménestrel [http://www.ccr.jussieu.fr/urfist/paleo/Paleo_accueil.htm].
6 . Sur les aspects techniques, voir le support de cours sur la numérisation, de Thierry Buquet et Gilles Kagan, issu du stage organisé depuis trois ans à l'IRHT, en ligne sur le site [http://www.irht.cnrs.fr/formation/cours/intro.htm]
7 . Voir notamment Le médiéviste et l'ordinateur, nos 37 et 38 (hiv. 1998-hiv. 1999), consacrés au thème Le texte médiéval sur Internet ; le riche volume Les documents anciens, éd. Jacques André, Marie-Anne Chabin, n° spécial de Document numérique, t. 3, n°1-2 (juin 1999) ; les actes du colloque tenu à l'École nationale supérieure des sciences de l'information et des bibliothèques (Villeurbanne, 6-7 déc. 1999), Vers une nouvelle érudition : numérisation et recherche en histoire du livre [http://histoire.enssib.fr /6ar chives/Colloques_journees/Nouvelle_erudition/intro.html].
8 .Un aperçu commode de ces aspects : la conférence d'Ambrogio M. Piazzoni, « Vers une paléographieélectronique ? L'expérience de numérisation des manuscritsà la bibliothèque Vaticane : quelques réflexions », dans Gazette du livre médiéval, n° 33, 1998, p. 10-19.
9 .Même en prenant en compte le poids souvent important des opérations préparatoires et périphériques : le prix d'un document numérique, susceptible de la plus large diffusion, n'est pas à comparer avec celui de la photographie ou du microfilm, mais avec celui d'une publication imprimée.
10 .Principalement pratiquée à l'heure actuelle par l'éditeur Lengenfelder (Munich).
11 .Outre A. M. Piazzoni, art. cité, une intéressante comparaison entre numérisation directe et numérisation de photographies a été menée par Markus Brantl, « Vergleichende Auswertung digitalisierter handschriftlicher Originalquellen und photographischer Reproduktionen : ein Erfahrungs-bericht über die Möglichkeiten der Bildverarbeitung-komponente des Datenbanksystems KLEIO », communicationà l'atelier « Digitales Archiv » (Göttingen) du Max-Planck Institut für Geschichte, 27 janvier 1997 ; la version en ligne [http://www.lrz-muenchen.de/~GHW/mb.html], promet une publication dans la collection Halbgraue Reihe zur historischen Fachinformatik.
12 .Outre A. M. Piazzoni, art. cité, p. 14, voir par ex. Manoscritti palinsesti criptensi : lettura digitale sulla banda dell'invisibile, éd. D. Broia, C. Faraggiana di Sarzana, S. Lucà, Ravenne, 1998.
13 .Les difficultés évidentes liées à la diversité infinie des lettres manuscrites - mentionnées par ex. chez Gusnard de Ventabert [pseud. collectif], « Représentation et exploitationélectroniques de documents anciens (textes et images) : à propos d'expériences du projet Philectre », dans Les documents anciens..., p. 57-73, citant G. Lorette et J.-P. Crettez, « Reconnaissance de l'écriture manuscrite », dans Traité d'informatique, Techniques de l'ingénieur, 1998, ch. H 1358, p. 1-15 - ne sont qu'un aspect du problème. S'y ajoute le rapport extraordinairement complexe entre formes et sens, et une difficulté d'analyse fondamentale : la machine ne sait pas comme le cerveau humain lire en termes de mouvement une écriture déjà tracée (la reconnaissance d'écriture manuscrite ne fonctionne que si la machine suit la main en temps réel : les organiseurs de poche eux-mêmes en sont maintenant capables).
14 .Sur les problématiques de l'analyse visuelle et mécanique des écritures, voir les travaux pionniers de Colette Sirat, notamment L'examen des écritures, l'oeil et la machine : essai de méthodologie, Paris, 1981 ; L'écriture : le cerveau, l'oeil et la main, actes du colloque international du CNRS, Paris, 1988, éd. C. Sirat, Jean Irigoin, Emmanuel Poulle, Paris, 1990 ; Methoden der Schriftbeschreibung [colloque, Marburg, 1990], éd. Peter Rück, Stuttgart, 1999. Un projet dont j'ignore les suites, celui de John B. Friedman (univ. de l'Illinois) d'étude de l'évolution d'une main dans le temps, était présenté brièvement dans une demi-page du New Scientist, 6 avril 1991 (« The who's who of medieval characters ») ; copie aimablement fournie par Michelle Brown (British Library).
15 .Une suggestion en passant : la définition et le calcul extrêmement complexes du « poids » de l'écriture selon la formulation de Léon Gilissen (L'expertise des écritures médiévales, Gand, 1973, chap. iii) ne pourraient-ils être remplacés par la mesure automatique de la densité relative de l'écriture en pixels ?
16 . La question juridique fait à juste titre couler beaucoup d'encre. Pour le point de vue particulier des études médiévales, voir Le médiéviste et l'ordinateur, n° 38.
17 .Voir en général Literary and Linguistic Computing, t. 14, n° 2, 1999, Special issue on teaching the Middle Ages with Technology, ed. Martha W. Driver et Deborah McGrady, notamment Mary Kay Duggan, « Teaching Manuscripts from a Digital Library on the Web », p. 151-160 (utilisation pédagogique du site Digital Scriptorium à Berkeley), et surtout Meg Twycross, « Teaching Palaeo-graphy on the Web », p. 257-283 (expérience à l'université de Lancaster), riche de considérations techniques sur le fac-similé numérique. Je remercie Michelle Brown de m'avoir amicalement signalé ce fascicule.
18 .http://www.medieval.unimelb.edu.au/ductus/.
19 .http://www.le.ac.uk/elh/pot/medfram.html.
20 .http://www.culture.gouv.fr/documentation/archim/accueil.html Présenté par Florence Clavaud, « Archim : banque d'images numériques pour le Centre historique des Archives nationales », dans Les documents anciens, p. 39-55.
21 .Voir Catherine Dhérent, « La numérisation dans les archives de France », ibid., p. 13-27, et la contribution de Florence Clavaud dans le présent numéro du Médiéviste et l'ordinateur.
22 . http://www.archive.geschichte.mpg.de/duderstadt/dud.htm. La ville de Ratisbonne publie quant à elle une série de CD-Rom. http://bhgw15.kfunigraz.ac.at/fcr/fcr_base.htm
23 . http://www.archiviodistato.firenze.it/Map/.
24 .http://sunsite.Berkeley.EDU/scriptorium/. Les sites par-ticuliers de bibliothèques sont aussi répertoriés dans Ménestrel.
25 .Stefano Zamponi, « Esperienze di catalogazione di manoscritti medievali », dans Libro, scrittura, documento nella civiltà monastica e conventuale del basso Medioevo (secoli xiii-xv) : atti del convegno di studio (Fermo, 1997), éd. G. Avarucci, R.M. Borraccini Verducci, G. Borri, Spoleto, 1999 , p. 471-498, plaide pour ce travail et contre les réticences des paléographes.
26 .Exultet : testo e immagine nei rotoli liturgici dell'Italia meridionale, Cassino, 1999.
27 .Présenté dans plusieurs publications, notamment dans Gusnard de Ventabert, art. cité.
28 .Présenté dans diverses publications par Andrea Bozzi, notamment : son volume Better Access to Manuscripts and Browsing of Images..., Bologne, 1997 ; « Pour un système de philologie numérique », dans Les documents anciens..., p. 93-101 ; Sylvie Calabretto, A. Bozzi, Jean-Marie Pinon, « Numérisation des manuscrits médiévaux : le projet européen Bambi », dans le colloque Vers une nouvelle érudition, cité [http://histoire.enssib.fr/6archives/ Colloques_journees/Nouvelle_erudition/calabretto.html].
29 .http://www.mshs.univ-poitiers.fr/cescm/lancelot/.
30 . Références dans Ménestrel [http://www.ccr.jussieu.fr/ urfist/paleo/paleo-03editions.htm]. Sur quelques autres projets anglais, on peut voir la brève synthèse de Christopher Kitching, « Les publications archivistiques au Royaume-Uni », dans La Gazette des archives, n.s., 182-183, 3e-4e trim. 1998, p. 246-253, surtout p. 251-252. Article aimablement communiqué par O. Guyotjeannin.
31 .Des études comparables sont en cours concernant les documents d'archives : segmentation automatique, reconnaissance des dates, etc. (Archives nationales et Irisa de Rennes). Voir F. Clavaud dans le présent numéro.
32 .Les caractères graphiques sont déjà partiellement pris en compte par la philologie numérique, par exemple les signes de ponctuation ou d'abréviation. Un mode de balisage incluant les faits graphiques (basé sur la TEI : voir plus bas) est à l'étude dans le cadre du projet Digital Scriptorium, et le site présente l'état de la réflexion.
33 . Voir le projet HyperIconics de l'université de Leyde [http://www.let.leidenuniv.nl/kennismedia/ip/hyp.html].
34 .S. Zamponi, « Genesi e metamorfosi del Libro segreto del Boccaccio : un'indagine fra filologia e codicologia (con un progetto di restauro virtuale) », dans Convegno internazione `I nuovi orizzonti della filologia' : ecdotica, critica testuale, editoria scientifica e mezzi informatici elettronici... (Roma, 1998), Rome, 1999, p. 37-51.
35 . http://www.w3.org/TR/REC-xml.
36 . http://www.uic.edu/orgs/tei/. Voir aussi TEI light, éd. François Role, n° spéc. de Cahiers GUTenberg, n° 24, juin 1996, avec divers exemples de traitement conjoint de texte et images.
37 . http://www.loc.gov/ead/.
38 . http://www.hmml.org/eamms/index.html.
39 .Lou Burnard et Peter Robinson, trad. Muriel Gougerot et Élisabeth Lalou, « Vers un standard européen de description des manuscrits : le projet Master », dans Les documents anciens, p. 151-169.
40 .G. Cencetti, Lineamenti di storia della scrittura latina, Bologne, 1954, nouv. éd. 1997.