Le Médiéviste et l’ordinateur
Le Médiéviste et l’ordinateurHistoire médiévale, informatique et nouvelles technologies
article précédent autres articles article suivant
N° 45, 2006 : Formes et couleurs dans les manuscrits, élaboration d’un outil

Manuscrit médiéval et techniques de reconnaissance :
les enjeux scientifiques

Auteur

Dominique Poirel
poirel@irht.cnrs.fr
Institut de recherche et d’histoire des textes (CNRS)
site : http://www.irht.cnrs.fr


Citer cet artcile

Dominique Poirel, « Manuscrit médiéval et techniques de reconnaissance : les enjeux scientifiques », Le Médiéviste et l’ordinateur, 45, 2006 (Formes et couleurs) [En ligne] http://lemo.irht.cnrs.fr/45/ enjeux-scientitiques.htm

Mots clés

Reconnaissance automatique de formes, nouvelles technologies de l’information et de la communication appliquées au manuscrit médiéval, reconnaissance de structure, classification automatique

Résumé

En se tournant vers des spécialistes en traitement de l’image, l’IRHT avait, touchant le manuscrit médiéval, des attentes scientifiques précises dans trois domaines. D’abord, la reconnaissance de la structure de la page : séparation du texte et de l’image, division du texte en colonnes et en lignes, mise en évidence des marginalia. Ensuite, l’analyse de l’écriture, pour définir des « types » objectifs, ou pour reconnaître des mots précis, tel « incipit », d’une grande importance pour signaler le début d’une œuvre. Enfin l’analyse de l’enluminure, pour repérer les parties peintes, reconnaître des formes simples ou des motifs ornementaux récurrents, rapprocher divers témoins ayant une palette de couleurs commune.

Communication

Toute recherche s’enracine dans un questionnement. C’est pourquoi, avant de laisser la parole à ceux qui ont produit des outils et obtenu des résultats, il importe de revenir en arrière et de se remettre en mémoire les enjeux scientifiques de l’entreprise. Pourquoi des historiens, spécialistes du manuscrit médiéval, se sont-ils engagés dans un partenariat avec des chercheurs en génie informatique ? Quelles étaient leurs attentes ?

Élisabeth Lalou l’a rappelé, le projet « Formes et couleurs » s’inscrit dans une tradition déjà longue à l’IRHT d’intérêt pour l’informatique et de recours à ses formidables capacités de tri. Une nette accélération s’est marquée à la fin des années 1990, lorsque les campagnes de reproduction de manuscrits, que l’IRHT mène depuis sa fondation en 1937, ont fait place au numérique. D’abord pour les seules parties enluminées, ensuite pour les manuscrits complets, soit directement et en couleur à partir de ceux-ci mêmes, soit, à plus large échelle, à partir de ses vastes collections de microfilms en noir et blanc.

Le choix de la photographie numérique s’imposait pour plusieurs raisons scientifiques. La première et la plus évidente est de faciliter l’étude des manuscrit, en particulier de leurs contenus textuels, musicaux et iconographiques, en les mettant en ligne sur le Web. Par là même, l’accumulation au même endroit d’images numériques en grand nombre offre des possibilités inédites de classement, de tri et de reconnaissance automatique dans trois directions principales :

En s’appuyant sur quelques exemples commentés, on voudrait présenter, dans chacun de ces trois domaines, quels éléments sont à reconnaître et pourquoi.

I. Reconnaissance de structure

 IRHT_Montpellier_BU_H 43
Figure I : Montpellier, Bibliothèque interuniversitaire, Section de Médecine, H 43 (xive s.), f. 2v-3r

Un exemple assez ordinaire de structure est fourni par un manuscrit de la Bibliothèque interuniversitaire de Montpellier (Sect. de Médecine, H 43), qui contient la traduction en français d’un ouvrage de l’écrivain latin Boèce († 525), la Consolation de la Philosophie1. La photographie ci-dessus reproduit le début du texte (recto du premier feuillet et verso du deuxième feuillet). Chaque page est divisée en deux colonnes homogènes de 45 lignes2.

Structure générale de la page

En haut à gauche de la première page, une miniature représente deux personnages : l’auteur et une allégorie de la philosophie : cela est naturel puisque l’ouvrage consiste en un dialogue entre ces deux interlocuteurs. De part en part, au fil du texte, on observe aussi les traces d’une décoration secondaire : sept éléments végétaux stylisés autour de l’enluminure, juste au-dessous la lettrine « E » filigranée, des pieds de mouche de couleur rouge, marquant le découpage du texte en unités textuelles correspondant à des paragraphes, plus rarement des pieds de mouche de couleur bleue suivis de mots latins encadrés de bleu3 : cette irruption du latin dans un texte français sert de renvoi au texte original, afin que le lecteur puisse faire le va-et-vient entre l’ouvrage de Boèce et sa traduction en français.

Autour de ces quatre colonnes, on note quelques traces écrites. En haut d’abord, où l’ouvrage est désigné par ces trois mots, à cheval sur les deux pages du livre ouvert : « boesse / de consolation ». Dans la marge supérieure de la page de droite, on lit deux nombres ; l’un, dans le coin supérieur droit, est moderne et en chiffres romains : « 3 » ; l’autre au milieu, est en chiffres romains : « .Cxxvii. ». La comparaison avec les feuillets suivants montre qu’il s’agit dans les deux cas d’une numérotation des feuillets. On peut donc en conclure que le manuscrit a perdu une partie de son texte correspondant sans doute à cent vingt-cinq feuillets. En deux endroits, sur la page de gauche, on lit le mot « Nota » (écrit « Noa ») : c’est une invitation à lire le passage en regard, jugé remarquable.

Parmi les éléments qu’on vient de passer en revue, certains sont généralement stables, non seulement pour un même manuscrit tout entier, mais aussi pour d’autres manuscrits issus du même atelier d’écriture : ainsi du nombre de colonnes par page et du nombre de lignes par colonne. Si donc on peut trier des masses d’images numériques sur ces données et, par exemple, demander tous les manuscrits dont les pages sont copiées sur deux colonnes de 45 lignes, on disposera d’indices utiles, surtout couplés avec d’autres informations, pour rapprocher les manuscrits originaires d’un même atelier d’écriture. Plus largement, une reconnaissance informatique de la structure permettra d’établir sur des données statistiques une histoire matérielle du livre au Moyen Âge, de ses influences sur les pratiques de la lecture.

Par son aspect général, la reproduction suivante est assez semblable à celle du Boèce de Montpellier. Le manuscrit ouvert présente à nouveau des pages écrites sur deux colonnes, cette fois de 32 (page de gauche) et 33 lignes (page de droite). S’il n’y a plus de miniature, on remarque un « Q » peint et orné de filigranes, de nombreux pieds de mouche, rouges et bleus en alternance, découpant le texte en petites portions. En haut, vers le milieu de la page de droite, se lit, sinon un titre, du moins la division du texte : « .I. d. 2 » (c’est-à-dire : première partie, deuxième distinction) ; et tout à droite, le nombre « 13 » tracé deux fois, d’une main médiévale et d’une main moderne, indique le numéro du feuillet.

figeac, Musée Champiolion inv. 0391
Figure II : Figeac, Musée Champollion, inv. 03-091 (xive s.), f. 12v-13r

Réclames

Des éléments nouveaux apparaissent cependant. Dans la marge inférieure de la page de gauche, on lit dans un encadré à l’encre : « 7 p 9ñs. », qui se lit « et per consequens ». Il s’agit d’une réclame, destinée à faciliter la mise en ordre des cahiers dont se compose le livre manuscrit, notamment en moment de la reliure. Généralement, un livre se compose de cahiers formés de trois, quatre ou cinq – le plus souvent quatre – grandes feuilles de parchemins pliées en deux et cousues ensemble. Pour pouvoir retrouver l’ordre des cahiers et restaurer la continuité du texte, deux solutions existent : l’une consiste à les numéroter, l’autre à noter à la fin de l’un les premiers mots du cahier suivant : telle est la solution retenue ici. De fait, la réclame « et per consequens », dans la marge inférieure du feuillet 12v, se lit bien au début du feuillet 13r, en haut à gauche de la première colonne.

figeac, Musée Champiolion inv. 0391
Figure III : Figeac, Musée Champollion, inv. 03-091 (xive s.), f. 12v
Réclame « 7 p 9ñs. » « et per consequens », marge inférieure.

Bref, le repérage des réclames est un excellent moyen de reconstituer la composition matérielle de l’ouvrage et par là d’avoir quelques indices sur son histoire. Si des réclames apparaissent invariablement tous les six, huit ou dix feuillets, il est probable que le manuscrit est complet. Si en revanche leur succession est irrégulière, il y a lieu de vérifier si un feuillet manque ou a été rajouté, avec ou sans conséquence sur le texte. La même reproduction montre à quoi ressemble un feuillet coupé près de la reliure ; mais en l’occurrence il ne semble pas y avoir de perte textuelle.

figeac, Musée Champiolion inv. 0391
Figure III : Figeac, Musée Champollion, inv. 03-091 (xive s.), f. 8v-9r

Annotation marginale

Par ailleurs, les marges du texte portent quelques traces écrites, assez brèves sur cette reproduction ; elles sont plus étendues sur la reproduction suivante, où l’on observe deux longues gloses marginales. Sous-étudiés, ces paratextes méritent l’attention des chercheurs. Pouvoir trier les manuscrits qui en comportent en grand nombre serait d’une grande utilité, pour plusieurs raisons, selon la nature de ces gloses marginales :

figeac, Musée Champiolion inv. 0391
Figure III : Figeac, Musée Champollion, inv. 03-091 (xive s.), f. 8v
Annotation marginale, marge inférieure

 

figeac, Musée Champiolion inv. 0391
Figure III : Figeac, Musée Champollion, inv. 03-091 (xive s.), f. 8v
Annotation marginale, marge supérieure

Il se trouve qu’ici ces notes sont particulièrement importantes : en effet, le manuscrit contient une version inédite et inconnue d’un texte de Duns Scot, et le texte présent dans les marges pourrait transcrire des additions du maître4. On serait donc dans la dernière catégorie de gloses marginales, celles qui reflètent la pensée de l’auteur lui-même et permettent de reconstituer la genèse d’un ouvrage.

II. Reconnaissance de l’écriture

IRHT_Maz_0717_151v_152
Figure IV : Paris, Bibliothèque Mazarine, 717 (xiie s.), f. 151v-152r

Le manuscrit suivant est célèbre auprès des spécialistes de l’école et de l’abbaye de Saint-Victor, un des principaux centres intellectuels dans l’Occident du xiie siècle : il conserve une large partie de la « mise au propre » des œuvres d’Hugues de Saint-Victor, réalisée peu après sa mort en 1141 à l’initiative de l’abbé Gilduin († 1155). Des dizaines de copies manuscrites, peut-être des centaines, ont été réalisées d’après cet exemplaire prestigieux, conservé comme modèle de référence à l’abbaye de Saint-Victor5.

Les types d’écriture

La présentation est sobre, soignée, homogène : l’écriture se déploie encore sur deux colonnes par page, chaque colonne comptant un nombre stable de 42 lignes. Pourtant, sur l’exemple choisi, l’œil exercé n’a aucun mal à reconnaître une différence d’écriture entre la page de gauche et sa voisine de droite. Non seulement le feuillet 152 n’est pas de la même main que le feuillet 151, mais il est aussi d’une époque fort distante : milieu du xiie siècle à gauche, xve siècle à droite. Néanmoins, la lecture du texte et la comparaison avec les éditions en témoigne : c’est bien le même traité qui est copié de part et d’autres, à trois siècles de distance. Que s’est-il passé ? On a dit que le manuscrit 717 avait servi de modèle à d’autres témoins. Pour faciliter la copie, il a été dérelié : cela se marque à plusieurs indices, pagination, comparaison avec les copies qui en ont été faites. Ce faisant, on courait le risque que des feuillets disparaissent. C’est précisément ce qui s’est produit : les feuillets 152-155 se sont égarés, et il a fallu les refaire, sans doute d’après une copie du manuscrit 717. Pour diverses raisons, esthétiques et pratiques, on s’est alors ingénié à imiter le plus possible la présentation générale des feuillets précédents, par exemple en redoublant à droite comme à gauche la première lettre d’une phrase par un petit trait d’encre rouge. Même l’apparence générale de l’écriture a été tant bien que mal conservée : le feuillet 152r est donc d’une écriture du xve siècle qui imite autant que possible celle du xiie.

Cette bizarrerie, qui n’est pas si rare dans les manuscrits du Moyen Âge, a en outre l’avantage de poser clairement la question de la typologie des écritures. Depuis longtemps, les codicologues rêvent de pouvoir dater et localiser un manuscrit par les particularités de son écriture. Or, pour cela, ils disposent de nomenclatures anciennes, nombreuses et contradictoires. Fondées sur des critères qui ne sont pas strictement physiques, elles s’accordent tout au plus sur quelques grandes catégories générales (caroline, gothique, humanistique), mais au-delà de ces grands types, faciles à reconnaître, chaque paléographe distingue des espèces et sous-espèces différentes, qu’il sépare et nomme par des clivages et des noms différents6. Aussi Denis Muzerelle, responsable de la section de paléographie de l’IRHT, appelle-t-il de ses vœux un instrument qui permettrait, non de « lire » les écritures anciennes, mais de les répartir en des types rigoureusement définis. En d’autres termes, il s’agirait moins de rapprocher un « a » carolin d’un « a » gothique, que de comprendre ce qui, à l’intérieur d’une même écriture, rapproche cet « a » carolin d’un « b » carolin, cet « a » gothique d’un « b » gothique. Bref, il s’agit non de déchiffrer, mais de classer rigoureusement, en sachant sur quel critère physique on se fonde pour définir que deux écritures sont plus proches entre elles que chacune d’une troisième.

Début des œuvres

Vers le bas de la seconde colonne, on note le début d’un nouveau texte, perceptible à plusieurs signes : une lettre initiale attire l’attention par sa couleur rouge et bleue, sa grande taille qui la fait même déborder dans la marge et sa décoration bouclée : c’est la première lettre du texte. Au-dessus, on remarque une mention tracée à l’encre rouge : Incipit de substantia dilectionis. C’est, si l’on veut, le titre de l’ouvrage ; ou plus précisément, puisque ce type de mentions comporte souvent plus que le titre (nom d’auteur ou, comme ici, mot introductif incipit, c’est-à-dire : [ici] commence), on préfèrera parler d’une « rubrique », parce qu’elle est souvent tracée en rouge (rubrum en latin), ou mieux encore d’un « intitulé de début ». Ce dernier a parfois pour pendant un « intitulé de fin », qui commence alors par le mot desinit ou explicit : [ici] s’achève.

Ces éléments sont d’une grande importance quand on écrit le contenu textuel des manuscrits. En effet, au contraire de nos livres imprimés qui en règle générale correspondent chacun à une œuvre distincte, bien souvent un manuscrit est à lui seul une petite bibliothèque comprenant plusieurs œuvres, qu’il est plus ou moins facile d’identifier ; bien des collections de manuscrits attendent pour cette raison d’être décrites convenablement. Supposé donc qu’on puisse repérer automatiquement les lettrines peintes et décorées d’un grand module, les portions de texte tracées à l’encre rouge et les diverses occurrences de mots comme incipit, explicit, desinit (éventuellement complétés de leurs formes plurielles : incipiunt, expliciunt, desinunt), on pourrait quasiment extraire la table des matières d’un manuscrit. À tout le moins, on disposerait d’une première approche de sa structure textuelle.

III. Reconnaissance de l’enluminure

IRHT_Mulhouse_MH_Ms1_f029v-030
Figure V : Mulhouse, Musée historique, manuscrit non coté (1) (xvie s.), f. 29v-30r

Le Musée historique de Mulhouse possède dans un manuscrit (non coté) un bel armorial du xvie siècle écrit en langue allemande et peint aux armes des diverses familles concernées. Par là, ce manuscrit offre un excellent exemple des diverses questions liées à la reconnaissance des formes et des couleurs dans les manuscrits enluminés.

Préparation d’un inventaire photographique

Certaines de ces questions sont très pratiques. Par convention avec le ministère de la Culture et de la Communication et celui de l’Éducation nationale, de l’Enseignement supérieur et de la Recherche, l’IRHT mène une double campagne de reproduction photographique dans les bibliothèques publiques de province et dans quelques grands établissements parisiens : 1) microfilmage en noir et blanc des manuscrits entiers, 2) numérisation directe en couleur des parties peintes et décorées. Une application susceptible de reconnaître les parties enluminées et de les associer à leur emplacement dans le manuscrit (indication du numéro de feuillet et de la précision « recto » ou « verso ») serait d’une grande aide pour ce travail spécifique de l’IRHT : elle permettrait de constituer un premier inventaire préparant la campagne de reproduction en couleur. Plus largement, elle permettrait de trier dans un vaste corpus photographique et d’en extraire, à l’intention des chercheurs en histoire de l’art, ceux des manuscrits qui sont enluminés.

Formes simples

Un second objectif consiste en la reconnaissance de quelques formes simples : croix, épées, écus, ou plus complexes : mains, personnes humaines, scènes de crucifixion. Jusqu’à présent, cet axe de recherche soulève encore de nombreuses difficultés. Il est vrai que même une forme simple comme un écu peut revêtir des formes très diverses, à supposer d’abord qu’on parvienne à n’en retenir que le contour extérieur, sans les « meubles » qui le diversifient. Sur la reproduction ci-jointe du manuscrit de Mulhouse, six écus, pourtant tracés dans un même style général par le même artiste, se ramènent en réalité à trois formes différentes et plus ou moins tourmentées. Comment enseigner à l’ordinateur qu’elles sont toutes équivalentes au dessin d’un écu sous sa forme la plus simple, sorte de mixte d’un rectangle, par le haut, et d’amande verticale, par le bas ?

Motifs ornementaux

Plus faciles à repérer et non moins instructifs sont les motifs ornementaux, stylisés et récurrents, qui décorent les lettres initiales, tels les sept motifs végétaux qui entourent le cadre peint de la figure I, ou les filigranes qui rehaussent les initiales des figures II et III. Patricia Stirnemann a montré que de tels éléments de décoration obéissent à des effets de mode, grâce à quoi il devrait être possible de s’appuyer sur leur reconnaissance pour obtenir des datations relativement fines des manuscrits7. À un plus haut degré de précision, on devrait pouvoir désigner non seulement une période et un atelier, mais peut-être même un artiste. L’enjeu serait alors de pouvoir rapprocher entre eux des éléments décoratifs simples et relativement stables, alors même qu’ils n’auront jamais la régularité d’un ornement typographique puisqu’ils sont effectués à la main.

La palette de couleurs

La reproduction du manuscrit de Mulhouse met en regard deux parties peintes, chacune sur une page : leur comparaison ne fait pas seulement apparaître des formes analogues, tels les écus, le panache blanc des personnages de droite ou encore la petite croix blanche sur les deux écus supérieurs, mais aussi des couleurs très proches. D’abord l’œil est attiré par les taches rouges des écus, mais la même couleur apparaît dans l’habillement, la coiffure de trois personnages et le livre du quatrième. Ensuite on remarque les vert, rose, mauve et bleu pastels du paysage : les deux arrière-plans ont en commun la même gamme de teintes. Enfin, les blancs et les bruns complètent la palette du peintre, relativement stable d’une peinture à l’autre (ici cependant la page de droite se distingue de l’autre par son jaune clair plus insistant), si bien qu’en extrapolant à tout le manuscrit il semble possible de caractériser le manuscrit par un certain assemblage de couleurs favorites. Une telle indication se prêterait alors à des tris fort utiles entre manuscrits : grâce à elle, on espère pouvoir, par exemple, réunir la production artistique d’un enlumineur ou d’un atelier, ou détecter au contraire la présence d’une enluminure refaite à l’intérieur d’un manuscrit globalement homogène.

Structure de la page, écriture, enluminure… en chacun de ces domaines, le manuscrit médiéval présente une diversité foisonnante, qui semble défier toute entreprise de classification. À la limite, chaque règle a ses exceptions, chaque cas est une anomalie et l’historien auscultera de préférence les exemples les plus provocants, parce que souvent aussi ils lui paraissent les plus instructifs. Toutefois, l’étude des singularités ne suffit pas. Comprendre le manuscrit du Moyen Âge, de sa confection à sa diffusion, c’est aussi être attentif aux effets de groupes, pour compter des occurrences, dégager des types et ordonner des masses en ensembles. Derrière cet effort de classification où l’ordinateur donne toute sa mesure, on retrouve le besoin général des médiévistes de situer chaque manuscrit dans une époque, une région, un milieu, ou plutôt de le suivre d’époque en époque, de région en région et de milieu en milieu ; bref, de l’inscrire dans une histoire. C’est du moins cet enjeu qui nous a rapprochés de nos collègues les chercheurs en traitement d’image, à qui je me hâte donc de donner la parole.

Bibliographie

Lalou É., « Reconnaissance de formes, restitutions virtuelles d’objets, réalisations et projets » dans Le Médiéviste et l’ordinateur, L’apport cognitif, 41, 2002. [En ligne] ] http://lemo.irht.cnrs.fr/41/mo41_04.htm

Poirel D., « Formes et couleurs des manuscrits médiévaux : élaboration d’un outil de recherche » dans Colloque Société de l’information. Bilan du programme interdisciplinaire de recherche du CNRS 2001-2005. ENS-LSH – Lyon, 19, 20 et 21 mai 2005. Actes édités par J.-L. Lebrave, Lyon, 2005, p. 248-251.

Notes

1  Sur les traductions françaises de Boèce, voir art. « Boèce », dans Dictionnaire des Lettres françaises, Paris, 1992, p. 204-208 ; A. Thomas et M. Roques, « Traductions françaises de la Consolatio Philosophiae de Boèce », dans Histoire littéraire de la France, t. 38, Paris, 1938, p. 419-488 et 544-545.

2  On trouvera une présentation claire et dense du livre manuscrit au Moyen Âge dans tous ses aspects matériels, textuels et historiques, dans : P. Géhin, Lire le manuscrit médiéval : observer et décrire, Paris, 2005 (Collection U : Histoire).

3  Hec que prima referimus vers le milieu de la première colonne, Quotiens ergo, Paulinum consulare, Quibus autem deferentibus dans la deuxième, Ac si cuius criminis, Nam de compositis dans la troisième, Et cuius unquam facinoris dans la quatrième

4  C. Bourlet, « Un nouveau témoin du commentaire des sentences de Duns Scot », dans Les amis de l’IRHT. Bulletin de l’association, Paris, octobre 2004, p. 4-5.

5  D. Poirel, Livre de la nature et débat trinitaire au xiie siècle. Le De tribus diebus de Hugues de Saint-Victor, Turnhout, 2002 (Bibliotheca Victorina, 14), p. 27-86 et 427-445.

6  Citons en dernier lieu A. Derolez, The Palaeography of Gothic Manuscript Books from the Twelfth to the early Sixteenth Century, Cambridge, 2003 (Cambridge Studies in Palaeography and Codicology, 9) ; voir bibliographie Géhin, Lire le manuscript…, p. 116-121.

7  P. Stirnemann, « Fils de la vierge. L’initiale à filigranes parisienne : 1140-1314 », Revue de l’art, 90, 1990, p. 58-73 [En ligne ] http://www.persee.fr/ : Ead., « La décoration », dans : Lire le manuscrit médiéval. Observer et décrire, dir. Paul Géhin, Paris, 2005 (Collection U, Histoire), p. 123-155.