Le Médiéviste et l’ordinateur
Le Médiéviste et l’ordinateurHistoire médiévale, informatique et nouvelles technologies
n° 42 (Printemps 2003) : La diplomatique

La Base de données des Chartes Originales de l’ARTEM [1]
sous Idealist

Marie-José Gasse-Grandjean
Base des Chartes Originales de l’ARTEM
Marie-Jose.Gasse-Grandjean@univ-nancy2.fr

La base de données réunissant les 5000 chartes originales conservées en France et antérieures à 1121 est aujourd’hui bien connue [2]. Les diplomatistes et les historiens l’interrogent. Les chercheurs venus d’autres disciplines, les philologues et les géographes par exemple, commencent à l’utiliser. Souvent pour vérifier l’attestation d’un terme ou d’une acception, pour obtenir un texte ou une reproduction sur support numérique. Pourtant la base ARTEM, comme elle est souvent appelée (chacun sait aujourd’hui qu’Artem suivi d’un numéro désigne un acte juridique du Haut Moyen Âge), recèle bien d’autres possibilités. Aussi il a semblé opportun de souligner ses spécificités dans un numéro du Médiéviste et l’Ordinateur consacré à la diplomatique.

La Base Artem est gérée depuis plusieurs années sous Idealist [3]. Au départ, ce logiciel a été retenu pour sa facilité de mise en oeuvre et le lien très commode qu’il autorisait entre texte et documentaire. Aujourd’hui bien des logiciels proposent une interrogation croisée facilitée, des interfaces conviviales, mais les avantages d’Idealist restent bien réels. Il combine une syntaxe de recherche, une indexation et une mise en œuvre soignées et surtout très souples.

1. L’élaboration de la base des Originaux sous Idealist

La Base des Originaux de l’ARTEM comprend trois volets, un volet analytique, les textes et les reproductions des documents. L’ensemble est organisé autour d’une cinquantaine de champs ou rubriques.

Le logiciel Idealist est très souple à mettre en oeuvre. Il est très facile de créer de nouvelles rubriques ou de nouveaux boutons de fonctions. Des boutons de tri par exemple, chronologique, géographique, par auteurs d’actes, par destinataires… Des boutons empilant ou au contraire dépilant les corpus de recherche successifs, affichant les termes de la recherche en cours ou tous les mots d’un même texte. Il est simple de redimensionner et améliorer la mise en page, d’aménager des menus déroulants, de prévoir plusieurs formats d’impression.

Mais le grand atout d’Idealist est surtout sa compatibilité. Ce logiciel intègre parfaitement les outils de gestion informatiques standards parmi lesquels Word ou Filemaker [4]. On peut par exemple importer le texte d’une ou plusieurs rubriques sous Word. Plus précisément on peut sélectionner les actes des évêques de Langres, puis exporter les rubriques Cote, Nature du document, Date, Analyse, Editions, Texte, pour finalement obtenir un corpus de travail utilisable sous Word. Une macro, écrite par Philippe Demonty, organise les données selon les normes de l’édition diplomatique. Le basculement sous Word est précieux également lorsqu’un problème se pose, concernant une rubrique ou une fonction. Chaque fichier système est éditable sous Word et donc facilement modifiable.

2. L’interrogation de la Base des Originaux sous Idealist

Comment interroger le texte ?

Lorsque le chercheur interroge la Base Artem pour la première fois, il peut très vite réaliser des interrogations croisées complexes, simplement en utilisant le cadre de saisie qui reprend 28 rubriques principales de la base.

click pour avoir l'image complète

Vue partielle de la copie d'écran
Cliquer sur l'image pour voir la copie d'écran complète

 

Il peut ainsi demander : aqu* [ET] molendin* dans la rubrique Texte. 302 textes sont concernés. S’il ajoute le code fonction Auteur RE (pour rex), la machine triera 51 diplômes, répertoriant entre autres la formule campis, pratis, silvis, aquis aquarumve decursibus, molendinis… Toutes les rubriques peuvent être combinées à l’interrogation, via ce cadre de saisie et les fonctions Elargir, Affiner ou Exclure. A tout moment l’utilisateur peut visualiser l’index des termes de sa recherche. S’il consulte l’index généré par la recherche aqu* [ET] molendin*, il pourra par exemple repérer les aménagements liés à l’eau par les termes aquaeductus et aquaductile.

Comment trier et sélectionner les actes ?

La syntaxe de recherche apporte une plus-value précieuse à cette interrogation croisée assistée de l’index. En plus des opérateurs booléens traditionnels [et], [ou], [non], l’opérateur [à] permet de rechercher tous les enregistrements qui contiennent des termes se trouvant dans un intervalle donné. Exemple : Pour trouver les actes donnés entre 1005 et 1025, il suffit d’entrer dans la rubrique millésime la commande 1005 [à] 1025.

La syntaxe permet aussi une recherche dans les limites du paragraphe, de la phrase ou d’une distance maximale : [près] (équivalent de [near] des moteurs Internet) permet de rechercher deux termes dans le même paragraphe. [.] permet de rechercher deux termes dans la même phrase. [10] permettra de rechercher deux mots séparés au plus par 10 autres mots.

Enfin, les variantes orthographiques latines étant nombreuses et peu adaptées au traitement informatique, une autre syntaxe est très utile : mettre entre guillemets un mot lance une recherche des homophones de ce mot. L’index généré par la recherche « tempus » par exemple permettra de repérer des orthographes fantaisistes comme temporebus, tempure ou tenpora, et surtout de prendre en compte chaque occurrence du mot coupée par les crochets signalant les restitutions.

Le chercheur dispose aussi d’une série de signes « mathématiques » ou plus simplement graphiques qui, insérés avant le terme de recherche, peut l’aider à affiner son interrogation. La commande > 500 pourra extraire tous les grands actes dont la hauteur est supérieure à 500 mm. De la même façon, on dispose de < (inférieur à), = (contient), <> (différent de), >= (supérieur ou égal à), <= (inférieur ou égal à), == (strictement égal à).

Cette panoplie de signes et d’opérateurs est accompagnée d’interfaces très conviviales.
Prenons un exemple de boîte de dialogue, celle intitulée Trouver Enregistrements :


Cette fenêtre affiche à droite l’index général de la base de données, avec en face de chaque terme sa fréquence. A gauche, on a recherché dans le champ Texte le mot palatio. Dans l’index, les mots concernés par la recherche s’affichent en gras (Palayon figure en grisé car il s’agit d’un nom propre utilisé dans un autre champ, sa fréquence est masquée). Palatium apparaît neuf fois dans les chartes originales, palatiolum un seule fois mais palatio 222 fois. Par défaut donc la recherche se fait sur l’ensemble de la base mais celle-ci peut-être affinée de deux manières, par le choix d’un champ particulier et par un menu déroulant qui permet de sélectionner diverses options de tri comme contient l’expression, un mot commençant par , un mot finissant par , un mot contenant , un mot comme (pour les homophones), est égal à , est vide, n’est pas vide, est différent de , ne contient pas l’expression

 

Un autre moyen d’interrogation plus empirique mais très utile est offert avec la commande Hypertexte. On peut sélectionner une donnée dans n’importe quel champ de la base, et d’un seul clic obtenir à l’écran toutes les occurrences de cette donnée dans l’intégralité de la base. Exemple : en sélectionnant Saint-Denis, puis en cliquant sur l’icône Pas, on obtient les actes qui ont pour auteur ou destinataire Saint-Denis (ou un prieuré dépendant), les actes donnés à Saint-Denis, les analyses d’actes où il est question de Saint-Denis et les références bibliographiques relatives à l’abbaye de Saint-Denis.

Comment dresser des listes d’actes ?

Idealist permet aussi d’établir toute sorte de tables. Dans la base des originaux, la fonction Survol fournit une table par défaut. On peut ainsi obtenir la liste des documents d’une sélection avec le numéro de l’acte, l’auteur de l’acte, son destinataire et sa date.

Table Survol par défaut

click pour avoir l'image complète

Vue partielle de la copie d'écran
Cliquer sur l'image pour voir la copie d'écran complète

 

Chaque corpus d’interrogation peut donner lieu à l’établissement d’autres listes utiles. Dans la boîte de dialogue Survol Sélection, à droite, un menu déroulant Champ(s) permet de choisir les champs utiles et d’élaborer la table adéquate. Si on veut par exemple trier les actes utilisant un chrisme codé (C) dans les textes, on définit le corpus de recherche en tapant (C) dans la rubrique texte du cadre de saisie, on obtient 1056 réponses. On peut ensuite trier ces actes par auteurs, par destinataires, par fonctions, par région, par incipit des textes (pour repérer les chrismes de début de texte par exemple)… et obtenir autant de listes de travail.

 

Sélection des actes avec chrismes

Table des auteurs de ces actes avec chrismes, classés dans l’ordre des fonctions : AE pour archevêque, CA pour chanoine, CO pour comte…
Vue partielle de la copie d'écran
Cliquer sur l'image pour voir la copie d'écran complète

Ajoutons qu’il est possible de créer, préalablement à l’interrogation, une liste de synonymes. On peut aussi affiner l’interrogation en modifiant la liste des caractères indexables. Au final, les termes de la recherche apparaissent toujours surlignés à l’écran et cette recherche peut être sauvegardée puis reprise ultérieurement. Chaque fois, la fonction Idealist est très permissive, fournissant au départ une réponse très large qu’il est possible d’affiner. De la même façon, la mise en évidence par la couleur des réponses à une interrogation, parce qu’elle est étendue à l’ensemble des rubriques, s’est révélée utile dans de nombreuses situations, tant au moment de l’élaboration de la base qu’à l’interrogation.

Cette base documentaire des Chartes Originales antérieures à 1121 et conservées en France recèle une masse d’informations encore largement inexploitée. Et son plus grand atout reste qu’elle bénéficie du soutien d’un logiciel très ouvert et efficace. Couplée à une base Photos proposant la reproduction des chartes et à une base Bibliographie, cette base de données sera disponible à terme sur CD-Rom ; aujourd’hui elle est consultable sur place à Nancy 2, à l’UMR 7002 Moyen Âge, à l’Atelier des Textes Diplomatiques.


[1]. Atelier de Recherche sur les Textes Médiévaux, UMR 7002 Moyen Age, Faculté des Lettres et Sciences Humaines de Nancy 2, 23 bd Albert Ier, 54015 Nancy.

[2]. L'histoire du projet a été présentée récemment dans La diplomatique française du Haut Moyen Âge. Inventaire des chartes originales antérieures à 1121 conservées en France, sous la direction de Benoît-Michel Tock, par Michèle Courtois et Marie-José Gasse-Grandjean, Brepols, 2001 (Artem 4). Pour une présentation de cette base, voir aussi :
http://www.univ-nancy2.fr/RECHERCHE/MOYENAGE/Diplomatique/accueil/diplo.htm

[3]. Ce logiciel de la société anglaise Blackwell est aujourd'hui distribué par Bekon
(http://www.bekon.com/index.shtml).

[4]. Deux BDD complémentaires, une base des noms propres et une base bibliographique, sont gérées sous ce logiciel.

 

© CNRS - IRHT 2004 - Contacts - Infos légales - Rédaction