Ce travail s’applique aux sciences de l’Antiquité et à l’organisation des connaissances (Gnoli et al., 2006; Gnoli, 2012; Gnoli, 2014). Son objectif est de travailler sur la mise en lien entre les annotations appliquées à des sources primaires textuelles et des métadonnées employées pour décrire la littérature scientifique qui en découle. Plus spécifiquement, il s’agit d’étudier la façon dont sont organisés, par le biais de deux instruments terminologiques, des thèmes communs pour la description de contenus relatifs à l’Antiquité. L’un est destiné à l’analyse de textes antiques (Index de Memorata Poetis) et le second à l’indexation documentaire de publications scientifiques contemporaines (Thésaurus PACTOLS). L’objectif est de créer des relations conceptuelles entre les deux instruments, bien qu’ils ne servent pas à décrire le même type d’objets initialement, pour en améliorer l’utilisation par les usagers dans le cadre de la recherche scientifique, mais aussi d'une mise à disposition à un plus large public (Insertion de liens de références dans Wikipedia). Il fait suite au travail initié par Lamé et Caputo, 2015 sur les dispositifs épigraphiques et l'emploi de cet index thématique de Memorata Poetis http://www.memoratapoetis.it.
Pour cet exercice de mise en relation, nous avons choisi de privilégier une thématique familière aux spécialistes de l’Antiquité et au grand public : les dieux et héros de la mythologie grecque et latine. Leurs noms sont fréquemment employés dans la description des objets archéologiques décorés, notamment la céramique ou la sculpture antique et dans l'analyse des textes anciens. Cette thématique est traitée dans les deux outils en question de façons différentes. Le sujet s’attache donc à comparer la façon dont les deux instruments présentent ces éléments de la mythologie antique, l’un à partir de textes primaires, l’autre à partir de l’analyse des publications scientifiques.
Le projet Memorata Poetis (MP) est un projet de recherche intertextuelle (site Internet en cours de finalisation). Il consiste à mettre en lien de courts poèmes (épigrammes épigraphiques et littéraires) composés et transmis de l’Antiquité à nos jours selon des thèmes et des motifs, c’est-à-dire, des schémas récurrents (ex.: La mort, Hercule...). Le corpus contient, à la date de soumission, 15307 textes et s’appuie sur une édition de référence en langue originale (latin, grec, italien anglais et arabe). Il s’agit, au travers de rapprochements textuels et de mises en parallèle, d’identifier l’évolution de l’expression des thèmes et des phénomènes intertextuels qui ont accompagné la transmission, la traduction et la création de ce type de poèmes au travers du temps et des cultures. Ces caractéristiques confèrent au corpus de sources primaires constance et homogénéité, deux critères de sélection importants pour le travail de rapprochement lexicologique.
Ces thèmes sont organisés au sein d’une liste contrôlée et hiérarchisée, l’index rerum notabilium, lentement consolidée par plusieurs générations de philologues, selon une arborescence à trois niveaux et six thématiques classiques (Animalia, Arbores et Virentia, Dei et Heroes, Homines, Loca, Res). Il s’agit donc d’explorer une documentation dite primaire et éditée, en amont de la production d’articles scientifiques.
Avec plus de 1300 termes qui le composent ont été traduits, de manière collaborative, une première fois en italien, anglais, allemand, français, grec moderne, avec comme langue de référence le latin en s’en tenant au cadre d’usages disciplinaires de la philologie La traduction entre dans la seconde phase qui consiste à valider ou non des synonymes et des variations linguistiques pour chaque terme.
En aval de ce processus d’élaboration de la connaissance, on retrouve des instruments pour analyser le contenu de la production scientifique. PACTOLS est un thésaurus multilingue (6 langues européennes et l’arabe) développé par la Fédération et Ressources sur l’Antiquité (FRANTIQ), groupement de services du CNRS (Centre national de la recherche scientifique français) http://www.frantiq.fr. Il constitue un outil d’indexation de publications scientifiques spécialisées en archéologie, depuis la Préhistoire jusqu’aux périodes contemporaines et en Sciences de l’Antiquité dans tous les domaines. Il est en particulier exploité dans le Catalogue Collectif Indexé de FRANTIQ (520.000 notices bibliographiques). Le thésaurus est organisé en sept branches (Peuples et Cultures, Anthroponymes, Chronologie, Toponymes, Oeuvres, Lieux, Sujets), elles-mêmes découpées en sous thèmes. Comme dans tout thésaurus, les descripteurs s’inscrivent dans un contexte terminologique précis, spécifié par des relations complexes : hiérarchiques, bien sûr, mais aussi d’équivalences, de synonymie,... Ils sont décrits à l’aide d’une définition et d‘une note d’application. Chacun est traduit dans six langues : le français est la langue de référence ; les traductions en allemand, anglais, arabe, espagnol, italien, néerlandais sont mises à jour au fur et à mesure des mises à jour du thésaurus. Certains descripteurs sont illustrés. Enfin, le thésaurus suit la norme ISO 25964 sur l’interopérabilité des thésaurus : chaque terme est identifié par une URI (Unique Resource Identifier) de type ARK ( Archival Resource Key - https://fr.wikipedia.org/wiki/Archival_Resource_Key). Cet identifiant lui confère une identité unique dans le web des données et le rend citable. Son format de données est conforme à SKOS (Simple Knowledge Organization Systems) du W3C. Par exemple http://ark.frantiq.fr/ark:/26678/pcrtGYtuX6F7A0 renvoie au concept Némésis et à son environnement sémantique ainsi qu’aux notices liées du Catalogue Collectif Indexé de FRANTIQ.
Ce thésaurus a été créé en 1987 et il est mis à jour en continu par des spécialistes des domaines traités. Il compte aujourd’hui 33.000 descripteurs. Il est utilisé par des bibliothécaires et des documentalistes dans le cadre de catalogues et de bases de données documentaires, comme dans l’enrichissement de bases de données de la recherche. Par exemple, les publications indexées sur la thématique que nous avons retenue dans le cadre de cette présentation sont soit des éditions de textes littéraires antiques, soit des ouvrages avec une riche iconographie : traités sur la sculpture, la mosaïque, les décors architecturaux ou les céramiques…
On le voit, les deux outils présentés ont été conçus pour répondre à des exigences scientifiques complémentaires qui appartiennent à un même processus global d’élaboration des connaissances. L’organisation des termes comme leurs langues de référence et le multilinguisme des outils et des contenus sont le reflet de l’usage pour lequel ils ont été pensés.
Cependant, des concepts communs se retrouvent, tout au moins sur certaines thématiques. Nous avons choisi de confronter les deux vocabulaires sur les thèmes Dieux et Héros de l’Antiquité classique : comment ces domaines sont-ils traités par l’un, dans le cadre d’analyse du texte antique comme document primaire et par l’autre dans le cadre des publications scientifiques, documents secondaires par excellence ? Comment l’archéologie, l’épigraphie et la littérature élaborent-elles des connaissances sur des sujets similaires ?
Le domaine “Dieux et Héros” de l’Index rerum notabilium de Memorata Poetis est bien défini: Mythologie, Chrétienne, Musulmane, Religion et Supertitions. Il s’agit d’aligner ce sous-ensemble et ses traductions, avec les branches Anthroponymes/Divinités/Divinités grecques, Divinités romaines, Anthroponymes/Héros/Héros grecs, Héros romains, ainsi que le groupe de termes de Sujets/religion des thésaurus PACTOLS. En effet, les Dieux et Héros de l’Antiquité classique sont regroupés différemment et les termes relatifs à la religion plus généralement sont intégrés à la branche Sujets des PACTOLS, alors que l’ensemble est rassemblé en un seul dossier dans l’Index de MP.
Dans la mesure où seul le thésaurus PACTOLS est formaté en SKOS avec des identifiants pérennes, nous procéderons à un alignement manuel, terme par terme, avec discussion et ajustement de chacun des systèmes et de son lexique. Les rapprochements stricts ou relatifs des termes, mais aussi l’absence de tel autre dans l’un ou l’autre des outils sont des indicateurs majeurs de positionnement disciplinaires complémentaires qui concernent des moments et des cultures épistémologiques différents. Les théories, méthodes et instruments produits dans le cadre des humanités numériques devraient permettre d’accueillir et de faire converger ces univers terminologiques sur le rapprochement desquels nous travaillons et ce d’autant plus facilement qu’ils en respecteront leurs caractéristiques et les amèneront à dialoguer : exploitation et traitement du réseau de relations entre les termes, confrontation des traductions des vocabulaires, prise en compte, si nécessaire, de l’élaboration d’un métaformalisme commun. Ciotti, 2013, illustre les limites ontologiques rencontrées par les seuls thèmes et motifs. Si ce travail méthodologique de comparaison et de rapprochement entre différents KOS (Knowledge Organization System) ne cherche pas, dans un premier temps à produire un outil numérique, il vise à en préparer l’élaboration.
Par exemple, l’Index rerum notabilium contient un seul terme pour identifier Apollon, alors que les PACTOLS comptent neuf façons différentes de qualifier le dieu. L’étude des termes met aussi en avant les écarts contextuels révélateurs des périodes pendant lesquelles ces instruments d’analyse ont été élaborés : par exemple, PACTOLS, bien que régulièrement révisé, gagnerait à être réorganisé pour en faciliter la consultation et mieux suivre l’évolution des connaissances et de la discipline, tout en conservant des descripteurs adaptés aux publications plus anciennes. L’Index s’est construit sur une très lente et longue sélection progressive dont les débuts remontent aux origines de la philologie. Il se caractérise par son unité et sa stabilité mais aussi comme étant un témoin évolutif de la transmission intertextuelle elle-même. Il est destiné à s’enrichir au travers de la mise en parallèle intertextuelle, ce type de recherche scientifique ayant pour but d’identifier des motifs culturels et leurs transformations à l'intérieur des textes.
Bien que les deux instruments se situent sur deux niveaux d’analyse, nombre de concepts se rejoignent et il y a une utilité à pouvoir créer des liens d’un niveau d’analyse à l’autre afin de naviguer transversalement au travers des collections d’informations primaires (ex. textes, ici des épigrammes littéraires et épigraphiques) et secondaires (la littérature scientifique qui en émane). La comparaison des deux instruments permettra aussi leur enrichissement réciproque : les PACTOLS ajouteront les termes latins à ses traductions, l’Index bénéficiera d'une troisième phase d'enrichissement de ses traductions, d'une amélioration de sa navigation tout en conservant sa structure traditionnelle. Mais surtout, l’alignement des vocabulaires doit permettre de tirer des conclusions concrètes sur les évolutions que chacun des outils doivent suivre afin de permettre aussi bien au chercheur, mais aussi au grand public de naviguer avec fluidité dans le mare magnum documentaire primaire et secondaire en entrant par une même porte conceptuelle.
La mise en forme manuelle de ce matériel lexicologique devrait permettre de confronter dans un second temps deux hypothèses. La première est organisationnelle : un système à facettes peut-il permettre une meilleure utilisation de ces connaissances ? L’autre relève de la normalisation : SKOS employé dans le système PACTOLS pourrait-il à terme constituer une évolution nécessaire de l’Index pour finaliser la communication entre les deux systèmes d’indexation ? Les passerelles entre les environnements faciliteront ainsi le passage de l’un à l’autre, au profit des usagers dans la mesure où l’utilisation de termes identiques pour un même concept crée des ponts et des ouvertures à la connaissance en favorisant le dialogue entre les disciplines (archéologie, épigraphie, philologie). La thématique choisie pour cet exercice est bien connue aussi du grand public et fait partie de l’héritage culturel des sociétés gréco-romaines antiques. Pour favoriser encore la circulation des connaissances, nous compléterons les articles Wikipédia avec les termes des vocabulaires pour favoriser l’accès aux ressources primaires (les textes anciens utilisé par Memorata Poetis) ou secondaires (les publications scientifiques indexées avec PACTOLS). Il s’agit donc d’ajouter des liens d’autorité externes à la fin de ces articles de l’encyclopédie.
Les résultats de cette analyse appliquée, via l’alignement, au sous-ensemble des dieux et héros de la Mythologie doit permettre d’étendre le travail à l’ensemble des deux vocabulaires, avec un reversement et un enrichissement réciproque des termes traduits dans plusieurs langues européennes et du pourtour du bassin méditerranéen.
Le thésaurus PACTOLS (http://pactols.frantiq.fr) est utilisé par 40 bibliothèques de la Fédération et ressources sur l’Antiquité et par la Très Grande Infrastructure de Recherche française Huma-Num dans son moteur de recherche ISIDORE. Il est l’une des contributions françaises à l’infrastructure européenne DARIAH. Il est aussi impliqué dans des projets européens comme MULTITA, piloté par les Musées royaux de Belgique et dans ARIADNE, infrastructure européenne pour la recherche archéologique.
Le projet Memorata Poetis (financement national PRIN 2010/11 - http://www.memoratapoetis.it/public en cours de finalisation) est dirigé par le Professeur Paolo Mastandrea et implique huit unités universitaires ainsi que de recherche: les Universités de Venise “Ca’ Coscari”, de Cagliari, de la Calabre, de Padoue, de Pérouse, de Rome "La Sapienza", de Rome "Tor Vergata", et l'Istituto di Linguistica Computazionale "A. Zampolli” du Consiglio Nazionale delle Ricerche (CNR) à Pise.