Le Médiéviste et l’ordinateur
Le Médiéviste et l’ordinateurHistoire médiévale, informatique et nouvelles technologies
article précédent autres articles
N° 45, 2006 : Formes et couleurs dans les manuscrits, élaboration d’un outil

Discussions et perspectives d’avenir

Auteur

Dominique Poirel
Institut de recherche et d’histoire des textes
http://www.irht.cnrs.fr/


Citer cet artcile

Dominique Poirel, « Discussions et perspectives d’avenir », Le Médiéviste et l’ordinateur, 45, 2006 (Formes et couleurs) [En ligne] http://lemo.irht.cnrs.fr/45/discussions.htm

Mots clés

reconnaissance automatique de formes, nouvelles technologies de l’information et de la communication appliquées au manuscrit médiéval, reconnaissance de structure, classification automatique.

Résumé

Les interventions des partenaires ont suscité un dialogue avec la trentaine de personnes venues prendre part à la table ronde ; d’abord sous la forme de questions posées après chaque intervention, puis sous celle de débats finaux sur les perspectives d’avenir.

Sommaire

  1. Discussions
    1. Contribution du LIRIS
    2. Contribution du LIFO
    3. Contribution de l’ENST
  2. Perspectives d’avenir

I. Discussions

Contribution du LIRIS

En réponse aux questions posées sur le logiciel de foliotation, les représentants du Laboratoire d’Informatique en Image et Systèmes d'information estiment que leur outil permet de diviser le temps de travail par vingt  ; en revanche, il ne paraît pas apte encore à traiter les chiffres romains, qui soulèvent des problèmes particuliers.

Concernant la recherche de mots par similarité, Marc Smith, professeur de paléographie à l’École nationale des chartes, observe que le procédé employé fait ressortir en somme le rythme de l’écriture et sera sûrement utile à ce titre pour des travaux sur la typologie des écritures. À son avis, il convient d’analyser les formes en tenant compte de l’angle d’écriture (c’est-à-dire de l’orientation des plus fortes graisses), au lieu de leur appliquer par défaut un axe vertical : on minimisera ainsi la perte d’information, seuls les déliés étant sacrifiés. Il fait remarquer aussi que la séquence « egypt » choisie à titre d’expérience contient des traits globalement peu fréquents dans l’alphabet (dans g et surtout y), ce qui améliore d’autant le résultat. Odile Lépinay, membre de la Section des sources iconographiques de l’IRHT, demande si la technique du « wordspotting » ne peut pas être appliquée à des motifs décoratifs simples : il s’agirait alors d’un « symbolspotting ». La question doit être étudiée, car la trop grande variabilité d’un motif pourrait exiger un temps de travail dissuasif. Pour améliorer les recherches, la proposition est faite de se concentrer dans un premier temps sur des manuscrits numérisés directement en couleur.

Contribution du LIFO

Les résultats obtenus dans la classification des images par la couleur et leurs conséquences sur l’origine et la datation des manuscrits sont probablement transposables à d’autres catégories d’images, comme les peintures murales dont s’occupe le Centre d’Études Supérieures de Civilisation Médiévale, à Poitiers. Des tentatives devront être faites en ce sens.

Contribution de l’ENST

Une difficulté récurrente provient du fait que les images disponibles sont souvent accompagnées d’une portion de texte. Ces cadrages répondent à une décision scientifique : l’image s’insère dans un texte et prend sens par rapport à lui. Toutefois, la présence de parties textuelles altère les résultats dans la mesure où l’ordinateur tient compte aussi de la couleur du parchemin et de celle de l’encre. Pour les améliorer, il conviendrait de détourer les images, ce qui demande beaucoup de temps. Gilles Kagan, responsable du service Photographie, images, médias de l’IRHT estime que des instruments existent pour faire cette opération de façon automatique. (revenir à l’article de l’ENST)

II. Perspectives d’avenir

Au vu des résultats obtenus, l’ensemble des participants s’accorde pour souhaiter un prolongement du programme « Formes et couleurs ». Dans cet esprit, Hubert Emptoz propose une candidature collective, animée par le LIRIS, à l’Action concertée incitative « Masses de données » qui sera probablement déposée au printemps 2006. Le projet de recherche « Formes et couleurs » a en effet permis d’explorer un grand nombre de pistes, de dégager les plus prometteuses, d’en suggérer de nouvelles : il serait donc logique de donner aux recherches initiées le prolongement robuste qu’elles méritent. On propose les volets suivants :

Pour qu’une telle candidature aboutisse, des réunions par modules sont à prévoir dans l’automne 2005, en sorte que la synthèse soit prête pour avril 2006.

La question de recherches dans le domaine de la restauration étant évoquée, Thierry Delcourt observe que de nombreux logiciels existent et qu’avant de lancer des recherches de ce côté il conviendrait de faire un état de l’art. D’autre part, il recommande de consulter sur le futur projet des historiens moins strictement spécialisés dans l’étude du manuscrit, diplomatistes par exemple, de façon à ce que les résultats en soient utiles à une large communauté. En outre, il est important qu’après la recherche fondamentale, étape indispensable du travail, les travaux projetés aboutissent à la réalisation de produits utilisables, sans quoi l’investissement en temps et en énergie, du côté des partenaires en sciences humaines, n’aurait guère de sens. Cette position obtient un large consensus. En particulier, on s’accorde à dire que les travaux sur la reconnaissance de mots par similarité et sur la foliotation doivent déboucher aussi tôt que possible sur une application directement utilisable par les bibliothécaires et les historiens, soit avec l’aide d’un partenaire privé et donc sous la forme d’un produit commercial proposé à un prix raisonnable ; soit, mieux encore, comme produit libre, gratuitement communicable aux collègues ou aux personnes intéressées. Après tout, n’est-ce pas la mission de l’État de distribuer des produits qu’il a aidés à concevoir ? Dans tous les cas, il importe que les recherches aboutissent à des produits largement diffusés.