Contribution numérique : cultures et savoirs

WikiTopia Archives

WikiTopia Archives

Un levier pour inciter les collectionneurs à ouvrir leurs collections

Jean-Olivier Gransard-Desmond

Jean-Olivier Gransard-Desmond, « WikiTopia Archives », dans Marta Severo, Roch Delannay (dir.), Contribution numérique : cultures et savoirs (édition augmentée), Les Ateliers de [sens public], Montréal, 2024, isbn : 978-2-924925-29-4, http://ateliers.sens-public.org/contribution-numerique/chapitre7.html.
version 0, 15/06/2024
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

Introduction

Si les collections publiques sont aisément identifiables et deviennent de plus en plus faciles d’accès, il n’en est pas de même des collections privées. Ces dernières représentent une littérature grise dont l’accès permettrait de répondre à des problématiques en cours, voire de générer de nouvelles pistes de travail.

À travers la genèse et le fonctionnement du programme WikiTopia Archives mené par l’association ArkéoTopia, une autre voie pour l’archéologie, nous évoquerons l’importance scientifique et sociétale d’inciter les collectionneurs privés à ouvrir leur collection ainsi que la difficulté du respect de l’anonymat des propriétaires privés. L’ensemble permettra également d’aborder la question de plus en plus cruciale de l’espace physique d’intérêt général qu’il faudrait pouvoir trouver afin d’assurer la pérennité d’accès à des données relevant des communs.

Observatoire : WikiTopia Archives

WikiTopia Archives est un programme de numérisation des sources archéologiques mené par l’association ArkéoTopia®, une autre voie pour l’archéologie. Lancé en mars 2018, avec un premier corpus de lettres datant du XIXe siècle, le programme s’adresse aux particuliers amateurs d’archéologie et aux archéologues, aussi bien étudiants que chercheurs. Il a pour objectif de les encourager à numériser puis publier leurs sources historiques sur Wikimedia via les outils du Libre. Cette mise à disposition permettra aux divers documents d’être accessibles au plus grand nombre, partout dans le monde et d’encourager la recherche à leur sujet.

Voir la fiche complète sur le site de l’observatoire.

Pourquoi s’intéresser à des collections privées ?

Comme le souligne le spécialiste de l’histoire culturelle André RauchVoir le billet de blog « Paroles de chercheur : André Rauch ».↩︎, il convient de pratiquer les collections privées comme n’importe quelle autre bibliothèque ou lieu d’acquisition d’informations.

La raison de cet intérêt est double. Tout d’abord, les collections privées contiennent des informations pouvant être très utiles aux chercheurs. C’est ce dont témoignent Abdelhamid Boujdad Mkadem et Paul Nieuwenhuysen quand ils évoquent des bibliothèques privées « bien connues des chercheurs nationaux et même étrangers » dans la Gazette du livre médiéval n°58/1Voir « Les défis du financement des projets de numérisation des manuscrits. Le cas des associations culturelles au Maroc », 2012.↩︎ ou encore Marie Goupil-Lucas-FontaineVoir le billet de blog « Collections privées, collections publiques : le petit format des familles ».↩︎ en 2021 pour l’étude de la chanson française du XXe siècle. Ensuite, rendre visible des collections restées invisibles ou peu visibles peut contribuer à l’apparition de nouveaux sujets de recherche. Dominique Pety l’a bien compris. Professeure de littérature française et chercheure au laboratoire LLSETI (Laboratoire Langages, Littératures, Sociétés, Études Transfrontalières et Internationales) - EA 3706, elle évoque le cas de la place du timbre postal dont le statut a changé entre le XIXe siècle et le XXe siècle ainsi que, pour la même période, la place même des artefacts par rapport aux textes. Elle note également que l’amateur du XIXe siècle, comme le particulier contributeur sur les plateformes, « valorisent l’échange informel, l’investissement créatif qui sont source de nouveaux contenus culturels et patrimoniaux ».

S’intéresser à des collections privées représente donc un moyen supplémentaire de comprendre une époque, de retrouver la trace de lieux ou de documents ayant disparu et bien d’autres possibilités indispensables à l’élaboration de l’Histoire humaine. Cependant, à la différence des collections publiques, il n’existe pas encore de moteur de recherche permettant de les interroger directement même si des échanges ont souvent lieu entre collectionneurs sur internet notamment pour l’identification de leurs pièces. Les collectionneurs ne souhaitent pas divulguer leurs coordonnées pour différentes raisons dont celle de la sécurité de leur collection.

En tant qu’organisme défendant la recherche archéologique et participant à la production scientifique, ArkéoTopia est ouverte à des échanges avec des particuliers en capacité de fournir de nouvelles données sur les origines de la recherche archéologique en France et les débuts de l’archéologie celte du XIXe siècle. L’opportunité d’un programme de recherche de ce genre représente également l’occasion d’une démarche de science ouverte propre à servir d’exemple afin d’inciter les collectionneurs à ouvrir leurs collections, qu’il s’agisse d’archives ou de tout autre type de collections comme la numismatique, les objets d’art et, plus encore, ceci dans le respect de la législation en vigueur.

Figure 1. Les différentes composantes de la science ouverte selon la recommandation de l’UNESCO sur une science ouverte / CC BY-SA 3.0 IGO – UNESCO 2021

Un échange avec des collectionneurs privés s’est présenté en décembre 2017 lors d’une vente sur le site Delcampe, avec l’identification par David Commarmond, archéologue amateur et membre de l’association ArkéoTopia, de six lettres écrites entre 1838 et 1850 par Ambroise Comarmond. La possibilité de réaliser un travail sur des archives privées au sein de collections privées allait voir le jour.

WikiTopia Archives, genèse d’un programme

L’acquisition de ce premier corpus s’est faite avec l’appui du réseau de l’association. Le contenu des lettres a alors incité à acquérir un second corpus, rassemblant cette fois 207 documents envoyés à Anatole de Barthélémy et provenant d’expéditeurs variés. En effet, si Ambroise Comarmond (1786-1857) était médecin de formation, il fut par la suite conservateur des musées Archéologiques de la ville de Lyon, actuel musée des Beaux-Arts. Il fut également membre de plusieurs sociétés savantes ce qui explique le contenu des lettres échangées avec le Secrétaire général de la préfecture des Côtes-du-Nord de l’époque, également porté sur l’archéologie et proche de Prosper Mérimée : Anatole de Barthélemy (1821-1904).

Figure 2. Lettre du corpus d’Anatole de Barthélemy envoyée par Joseph de Fontenay le 1er mars 1844 / CC0 via Wikimedia Commons

La condition, pour les acquéreurs, était de permettre à ArkéoTopia de numériser les documents afin de les rendre publics, de telle sorte qu’une étude puisse en sortir, mais également que d’autres scientifiques puissent en profiter. En plus des différentes dimensions liées à l’archéologie (découvertes, questionnements, confrontations), les lettres témoignent de considérations touchant à la vie socio-économique et aux relations avec les autorités de l’époque qu’entretenaient les épistoliers, ce qui intéressera les historiens contemporanéistes notamment.

En mars 2018, la première séance du programme de recherche WikiTopia Archives est lancée, via l’espace projet des WikiTopia Party sur Wikipédia, afin de commencer la numérisation des archives. Cette activité, inédite pour l’association, nécessita une organisation de plusieurs mois pour que les différents outils utiles au bon fonctionnement du programme soient mis en place. Commencée à trois, l’équipe se structure et sept personnes en moyenne en composent l’ossature. Elle rassemble des archéologues professionnels, bénévoles et amateurs ainsi que ponctuellement des citoyens. Via la page projet sur le site d’ArkéoTopia, tout le monde peut participer à la première étape qui consiste à numériser, téléverser et transcrire ces archives.

Figure 3. Les étapes du programme de recherche WikiTopia Archives / CC BY-SA ArkéoTopia - Gransard-Desmond

Si l’objectif premier était de permettre de rassembler ces documents vendus séparément et acquis par des particuliers afin de les mettre à disposition de tous, il fallait déterminer un espace de mise à disposition qui puisse être aisé à manipuler, pérenne et ne nécessitant ni contraintes d’installations complexes, ni contraintes financières de long terme. 

Stocker et diffuser la matière première, choisir son espace juridique

Le programme WikiTopia Archives nous a d’emblée amené à considérer les dimensions juridiques et éthiques vis-à-vis des données de recherche.

L’enjeu était de penser les questions de l’espace de stockage de toute cette matière première ainsi que l’espace au sein duquel la diffuser, de façon à pouvoir répondre à nos besoins en respectant au mieux les dimensions susmentionnées.

La complexité de répondre à un tel enjeu se situe dans la diversité des formats et objets que nous traitons dans ce projet, parmi lesquels nous retrouvons : les archives elles-mêmes, leurs métadonnées ainsi que leur transcription.

Un laboratoire, comme un scientifique, se doit aujourd’hui de se poser la question de la diffusion des données avant même d’avoir commencé à travailler. Les cas de suppression des données par le gouvernement Trump et les risques matériels (financement notamment) ont mis en évidence la dimension cruciale de cette question.

Initié en novembre 2016 à l’université de Pennsylvanie (États-Unis), le projet Data Refuge a pour objectif de garantir une préservation des données factuelles accumulées par les organismes scientifiques fédéraux américains sur les modifications climatiques en cours afin d’éviter une suppression par le gouvernement Trump comme évoqué dans l’article « Burning the Data. Attacks on Climate and Energy Data and Research ». D’autres avaient déjà brûlé des livres ou supprimé des écrits pour des raisons idéologiques, un espace institutionnel n’est donc pas forcément gage de sécurité pour les données scientifiques.

Le problème ne concerne pas seulement les risques dus à une personnalité politique, mais également à la gestion des ressources. Une plateforme numérique implique un serveur et une maintenance, donc un financement, garantissant la pérennité de l’espace numérique. Sans cela, l’espace et son contenu sont voués à disparaître. C’est ainsi que l’importante bibliothèque numérique scientifique Persée s’est retrouvée menacée de disparition le 10 mai 2011, générant un appel à pétition de son équipe sur portailpersee.wordpress.com.

À la recherche d’un espace numérique neutre respectant les principes FAIR, ArkéoTopia a fait le choix de concentrer son travail sur les projets de la galaxie Wikimedia développés par la Wikimedia Foundation pour la diffusion dont j’ai déjà présenté les intérêts pour la recherche scientifique sur le site de l’Acfas en 2022. De plus, si des espaces numériques institutionnels existent comme Scripto, leur facilité de mise en œuvre n’est pas aussi évidente que le projet Wikisource de la galaxie Wikimedia. Répondant aux normes open software de la science ouverte, Wikimedia Commons permet la diffusion des doubles numériques des archives et Wikisource permet d’assurer leur transcription en licence CC BY-SA. La fouille de données s’effectuera dans un second temps à partir d’une plateforme développée sous Isilex en licence OpenGPL et développée par Xavier-Laurent Salvador.

Figure 4. La galaxie des projets Wikimedia hébergée par la Wikimedia Foundation / CC BY-SA Wikimedia Foundation

Une fois l’espace numérique de travail identifié, il convenait de mettre en place la procédure permettant d’assurer l’anonymat des collectionneurs tout en permettant que d’autres chercheurs puissent les contacter via ArkéoTopia.

Anonymat des collectionneurs, comment faire ?

La matière du programme WikiTopia Archives est constituée d’archives privées remontant au XIXe siècle. Si le droit ne concerne plus les auteurs dont la propriété intellectuelle est tombée dans le domaine public, il n’en va pas de même des supports qui relèvent de collections privées. Selon l’article L111-3 du code de la propriété intellectuelle (CPI), un acquéreur n’est investi d’aucun droit sur l’acquisition qu’il effectue. Il l’achète, il n’en est donc pas l’auteur. Cependant, si l’œuvre n’a jamais fait l’objet d’une publication, la publication à titre posthume assure au propriétaire des droits d’exploitation selon l’article L123-4 du CPI.

Afin d’assurer une transmission des documents dans la durée et pour respecter également le RGPD (Règlement général sur la protection des données), il convenait d’établir une convention autorisant l’association, d’une part à publier les archives sous la licence libre la moins contraignante et d’autre part à pouvoir fournir les coordonnées à un scientifique ou toute personne réalisant des recherches sur le document.

Le collectionneur privé n’étant pas l’auteur, nous avons organisé la traçabilité à partir de Wikimedia Commons en recourant aux rubriques institution pour le propriétaire et à la rubrique source pour le contact avec ArkéoTopia. Pour cette dernière rubrique, une normalisation de la présentation a été réalisée sous la forme : « Ce document a été placé sur Wikimedia Commons par ArkéoTopia, une autre voie pour l’archéologie dans le cadre du projet WikiTopia party - Archive ». Un courriel générique étant associé dans le profil ArkéoTopia au sein de la galaxie Wikimedia, la mention permet à toute personne intéressée de prendre contact avec l’association.

Figure 5. Conserver l’anonymat du propriétaire tout en assurant la possibilité de le contacter via l’organisme de recherche, c’est possible sur les projets de la galaxie Wikimedia comme ici avec WikiSource / CC0

Pour assurer la liaison avec le propriétaire, un tableur, accessible uniquement par les membres d’ArkéoTopia intervenant pour le service Recherche, relie le nom de l’archive à son double numérique avec le nom du propriétaire pour lequel figure également le détail de ses coordonnées sur un principe proche du suivi des transcripteurs.

Figure 6. Tableur de suivi des transcriptions en cours avec le nom des transcripteurs anonymisé pour l’occasion et des tâches à réaliser / CC BY-SA ArkéoTopia - Gransard-Desmond

Au sein de ce triptyque, une difficulté demeure : le suivi des propriétaires dans le temps. Outre les déménagements et autres changements de coordonnées possibles, la question de la cession des archives à d’autres personnes est également une difficulté dès que le nombre de propriétaires atteint une masse critique.

Conclusion : ouvrir les collections privées, un enjeu pour la recherche et les Communs

À l’ère de la science ouverte, le programme WikiTopia Archives constitue un levier pour inciter les propriétaires privés à ouvrir leurs portes à la communauté scientifique afin que des données intéressant l’Histoire de l’Humanité puissent être libérées.

Ce programme permet donc :

  1. de renforcer l’importance des acteurs non-professionnels comme cela a été montré par la thèse Plateformes contributives patrimoniales. Entre institution et amateur de Marta SeveroVoir par exemple l’article « Professionnels, bénévoles, amateurs et citoyens : des acteurs de la recherche pour quels apports ? » et plus récemment par le rapport de 2022 sur l’Étude relative au bénévolat et à la participation de la société civile aux politique des patrimoines.↩︎ ;

  2. de mettre en évidence les outils issus du mouvement du logiciel libre dont la galaxie Wikimedia est une des extensions ;

  3. d’apporter sa contribution à la question des relations entre biens communs et Communs développé dans le rapport de 2022 Archéologie & bien commun. Figures de la propriété et du préjudice archéologiques.

Toutefois, le programme met également en évidence une limite : la traçabilité à long terme des propriétaires. Si l’accès au double numérique est assuré, qu’en est-il de l’accès aux originaux sur le temps long ? L’achat par un particulier le 12 mars 2023 d’une lettre de Robespierre à Danton datée de 1793 montre combien certains scientifiques sont encore attachés au travail sur original. À la différence de l’État français, un particulier n’est pas soumis à la protection du domaine public en matière d’acquisition ce qui laisse ladite acquisition aliénable et prescriptible. De fait, elle peut passer de main en main plus ou moins rapidement ce qui rend son suivi difficile. S’il s’avérait que le double numérique présente des lacunes du fait de l’évolution des outils d’acquisition numérique ou tout simplement d’une mauvaise reproduction, comment s’assurer de la possibilité d’un nouveau travail sur le document original ?

Contenus additionnels

Observatoire : WikiTopia Archives

WikiTopia Archives est un programme de numérisation des sources archéologiques mené par l’association ArkéoTopia®, une autre voie pour l’archéologie. Lancé en mars 2018, avec un premier corpus de lettres datant du XIXe siècle, le programme s’adresse aux particuliers amateurs d’archéologie et aux archéologues, aussi bien étudiants que chercheurs. Il a pour objectif de les encourager à numériser puis publier leurs sources historiques sur Wikimedia via les outils du Libre. Cette mise à disposition permettra aux divers documents d’être accessibles au plus grand nombre, partout dans le monde et d’encourager la recherche à leur sujet.

Voir la fiche complète sur le site de l’observatoire.

Programme WikiTopia Archives par Arkéotopia

Accéder à la présentation du programme WikiTopia Archives par ArkéoTopia.

Crédits : Arkéotopia

Source (archive)

Notes prises lors du forum

Notes 9. Bulliot, Bibracte et moi

Jean-Pierre Girard

L’intervenant commence par exposer le projet. Ce dernier est financé par le ministère de la Culture, autour des carnets archéologiques de Jacques-Gabriel Bulliot. Au cours du XIXe siècle, cet archéologue organise chaque été des fouilles sur le mont Beuvray (Saône-et-Loire), persuadé qu’il s’agit du site de l’ancienne cité Bibracte. Il laisse un grand nombre de carnets de fouilles. Ils sont partiellement transcrits par divers chercheurs au cours du temps, mais jamais mis à disposition, notamment pour des questions de droits.

Le projet réunit plusieurs institutions (dont les propriétaires desdits carnets) pour transcrire les carnets numérisés. Des ateliers organisés sur le site de Bibracte et au musée d’Archéologie de Roanne ont abouti à la construction d’une équipe de transcription amateur. Pour outiller le projet, un logiciel de reconnaissance d’écriture manuscrite (Transkribus) est employé. Les participants travaillent dans un premier temps à transcrire intégralement une centaine de pages, qui serviront à entraîner le moteur de transcription. La transcription est ensuite réalisée automatiquement, mais les participants relisent. La transcription doit être aussi fidèle que possible, en incluant les fautes, les ratures, les orthographes anciennes. Ce sont les bénévoles qui ont défini, ensemble, l’organisation de leur travail.

Les motivations des contributeurs sont variées : intérêt pour l’archéologie, recherche d’une dynamique de groupe, etc. En période de confinement, des ateliers sont encore organisés avec des outils de coordination à distance (mais pas de visio). Un article scientifique a été écrit par les contributeurs dans le cadre de l’appel à articles du FabPart Lab.

Notes 10. Les 7 Portes

Christine Coulange (Sisygambis)

Christine Coulange se présente en tant que réalisatrice et productrice de documentaires multimédias. Elle mène des projets qui mêlent création, interfaces immersives et contribution.

Après avoir montré le site de son projet (Sisygambis, elle évoque un webdocumentaire sur les ports, réalisé avec des étudiants de Paris 8, en partenariat avec le Mucem. Les contributions ont eu lieu depuis le tournage et l’enregistrement de la bande audio par différents groupes (communautés souffi au Maroc, massaï aux Comores, académie de musique de Zanzibar…). La rencontre réelle est extrêmement importante pour travailler ces contributions et entrer en relation avec les contributeurs. Ce projet contributif a abouti à l’interaction de la musique traditionnelle et électronique avec des images immersives, qui ont été diffusées sur des écrans dans les espaces publics, en complément de l’exposition au musée.

Un autre projet a été conduit pour travailler avec le centre universitaire de Mayotte pour créer le premier audioguide de Mayotte, en français, anglais, mais aussi dans les langues de Mayotte. L’audioguide est disponible gratuitement en ligne.

L’intervenante évoque un nouveau projet de webdocumentaire nommé Traversée. Les tournages ont eu lieu à Madagascar et à Mahjanga, avec des musiciens, des bateaux, et des trains. C’est la première fois que certains étudiants participaient à ce type de projet. Ils l’ont fait dans le cadre de deux « master class », la première concernant l’écriture numérique autour de l’ouverture au monde et de la contribution et la seconde sur la musique assistée par ordinateur, autour des enregistrements réalisés.

Enfin, l’intervenante évoque la résidence qu’elle a réalisée à la Friche (Marseille), à l’occasion de laquelle elle a accueilli des jeunes de Mayotte et des Comores. Ils sont venus via des séjours culturels organisés à Paris, et ont notamment participé à une formation à la contribution Wikipédia organisée avec Wikimédia France (aboutissant à la création de l’article « Cuisine mahoraise »).

Notes 23. WikiTopia Archives / ArkéoTopia

Jean-Olivier Gransard-Desmond (Icono-archéologue, ArkéoTopia)

L’intervenant présente le concept de science 4.0 incarné par le projet WikiTopia Archives. Cette plateforme s’intéresse aux propriétaires privés de manuscrits pour leur mise à disposition et leur étude, comme les archives épistolaires de savants du XIXe siècle. Il traite également de nouvelles données sur les origines de la recherche archéologique et sur les données collectées sur l’archéologie celte au XIXe siècle. On y trouve enfin 213 lettres administratives et d’échanges scientifiques.

En tout, sept personnes font partie des contributeurs : archéologues professionnels, bénévoles (formées, mais non payées) et amateurs (sans formation). La plateforme permet de numériser, téléverser et transcrire ces documents. Plus spécifiquement, voici la chaîne du processus : numérisation → transformation des images → téléversement sur Wikimédia Commons → création du lien → transcription. Pour la transcription, la plateforme Wikisource est utilisée car elle permet un accès direct, tout en assurant la traçabilité et l’anonymat.

Quels sont les enjeux ?

  • Accessibilité

    1. A des données sans restriction géographique

    2. Propriétaires privés, mais anonymat

    3. Utilisation libre (open data) assure la pluralité des acteurs

    4. Toutes les disciplines

  • Multilinguisme

  • Principes FAIR : il faut que les données soient faciles à trouver, accessibles et décrites en licence libre CC-BY-SA.

  • Traçabilité des données et modifications

  • Accès à de nouvelles problématiques

  • Réplication (reprise d’études archéologiques)

  • Facilité de mise en œuvre par rapport à d’autres outils

  • Valorisation : engagement du public