Forces et limites de la « gouvernementalité » par les plateformes collaboratives
Le projet « Bulliot, Bibracte et moi »
Jean-Pierre Girard,
« Forces et limites de la « gouvernementalité » par les
plateformes collaboratives », dans
Marta Severo,
Roch Delannay (dir.),
Contribution numérique : cultures et
savoirs (édition augmentée), Les Ateliers de [sens
public], Montréal, 2024, isbn : 978-2-924925-29-4, http://ateliers.sens-public.org/contribution-numerique/chapitre4.html.
version 0, 15/06/2024
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA
4.0)
Introduction
Le projet collaboratif Bulliot, Bibracte et moiGrousset, Jean-Robert et al.. 2021. Bulliot, Bibracte et moi. Étude-action (rapport scientifique) remis au ministère de la Culture à l’issue du projet. Télécharger le PDF.↩︎ s’est déroulé de septembre 2019 à juin 2021, en très grande partie au plus fort de la pandémie du COVID-19.
Observatoire : Bulliot, Bibracte et moi
Bulliot, Bibracte et moi est une plateforme de transcription dédiée aux carnets sur la recherche archéologique sur le site celtique de Bibracte-Mont Beuvray. La transcription se focalise notamment sur les carnets de fouille (1867-1882) de Jacques-Gabriel Bulliot qui sont des documents scientifiques incontournables pour comprendre les débuts de cette nouvelle science, l’archéologie, et pour tous ceux qui travaillent et s’intéressent à Bibracte. La transcription des carnets sera ensuite mise en ligne sur la plateforme Persée en liaison avec les publications imprimées de Jacques-Gabriel Bulliot. Ces archives seront également intégrées à la médiation mise en œuvre au musée de Bibracte pour expliciter la chaîne opératoire de l’archéologie, dans une perspective historiographique concernant la découverte de la protohistoire européenne.
L’engagement pris était de transcrire l’intégralité des carnets de fouille de Jacques-Gabriel Bulliot – premier véritable archéologue du site gaulois de Bibracte sur le mont Beuvray, de 1867 à 1895 – grâce à un dispositif associant intelligence artificielle et science participative, afin de publier cette transcription, en une version augmentée par des liens sémantiques, dans la bibliothèque numérique Persée. Les carnets de J.-G. Bulliot représentent 808 pages en onze volumes, soit de 700 à 750 pages réelles (en tenant compte des pages vierges, pages de titre, etc.), à transcrire, relire et corriger par les participants. Compte tenu des trois phases de relectures successives, ce sont, au total, plus de 2 600 pages manuscrites qui ont ainsi été scrutées par une « team Bulliot » d’une quinzaine de personnes.
Cet article n’est pas une réflexion épistémologique sur le processus mis en œuvre pour mener à bien ce projet mais, plus modestement, un compte-rendu de cette expérimentation de science participative sous l’angle de l’expérience utilisateur, en contexte multi-plateformes.
Ce que font les plateformes et ce qu’elles ne font pas
À l’issue d’un atelier liminaire avec les participants, une « chaîne d’information » a été construite ; la plateforme de reconnaissance d’écriture manuscrite Transkribus (en amont) et la plateforme de diffusion scientifique Perséide (en aval) ont été articulées avec trois outils choisis pour leur simplicité et leur souplesse d’usage :
- Slack, plateforme de messagerie augmentée ;
- DropBox, plateforme de partage de documents dans le « cloud » ;
- Hypotheses.org, plateforme de blogs scientifiques et de carnets de recherche.
Transkribus
La plateforme Transkribus (accessible à travers une application ou à travers un navigateur sous forme de webApp) offre (et formate) un environnement de travail complet : transcription manuelle page à page de textes manuscrits depuis des scans de pages téléchargés sur la plateforme puis traités automatiquement pour en isoler les lignes de texte (Figure 2) ; administration de la répartition, entre les participants, de lots de pages à transcrire et de suivi des travaux ; entraînement d’un moteur (intelligence artificielle, IA) de transcription automatique (Handwritten Text Recognition, HTR) adapté à l’écriture du corpus-cible ; application de ce moteur au-dit corpus, correction manuelle (et administration de la correction) du résultat du travail du moteur – qui s’améliore de ce fait en une nouvelle version – ; ajout manuel de balises (Figure 3) sur le texte transcrit (les balises étant pour partie configurables) ; export du résultat via une palette de formatsMülberger, Guenter et al. (2019). « Transforming scholarship in the archives through handwritten text recognition : Transkribus as a case study ». Journal of Documentation, 75/ 5, p. 954-976.↩︎. Le tout est opéré à travers une interface dense dont le projet a prouvé qu’elle reste maîtrisable par tout un chacun.
Le processus de transcription est de facto très contrôlé par l’enchaînement logique des opérations, tel qu’il est imposé par les règles de fonctionnement de l’algorithme HTR, d’une part, et l’interface de la plateforme qui le sert, d’autre part. Néanmoins, l’organisation du travail (collectif ou individuel, selon quel rythme, avec quelles balises, selon quelle(s) norme(s) de correction, etc.) a été totalement négocié avec les participants lors des premiers ateliers du projet ; elle a donc pu être affranchie du déterminisme technologique qui semblait prévaloir au premier abord.
Slack associée à DropBox
La messagerie Slack permet la thématisation des échanges, l’enrichissement des messages avec des pièces jointes, liens internet, emojis, etc., la gestion personnalisée des alertes, la possibilité de messages directs. Elle a structuré le lien direct entre tous les participants fidélisés (douze à quatorze personnes) et avec l’équipe d’animation du projet (deux personnes). DropBox a servi à stocker des documents, principalement méthodologiques, utiles à la transcription et au groupe de pilotage (les transcriptions elles-mêmes restant stockées sur Transkribus et étant sauvegardées par ailleurs, sur des disques externes).
Comme toute messagerie, Slack ne vaut que pour ce que ses utilisateurs en font ; en l’occurrence, le projet a expérimenté deux temps bien distincts : avant la pandémie et pendant. Les événements ont donc produit les conditions d’un test in vivo de la robustesse du dispositif collectif mis en place.
Au 15 mars 2020 (premier jour du premier confinement), la jauge minimale du jeu d’essai nécessaire à Transkribus (24 500 mots soit trois carnets sur onze) était déjà constituée et une première version du moteur d’IA avait pu être produite. Les participants ont alors choisi d’organiser la correction en micro-groupes pratiquant des relectures croisées entre pairs plutôt proches géographiquement les uns des autres, pour permettre éventuellement des échanges directs ; la communauté dans son ensemble s’est tenue en appui de chaque participant via l’usage quotidien des outils sociaux et via des ateliers virtuels numériques. Pour ceux-ci, la solution proposée a été d’organiser, non pas des visioconférences, mais une combinaison de Slack, de DropBox et de ressources accessibles en ligneChassignet, Philippe et Emmanuelle Perrin. 2020. « L’animation virtuelle du projet participatif Bulliot, Bibracte et moi… (BBM) : outils, pratiques, bilans ». Enregistrement du webinaire Particip-Arc du 7 juillet 2020.↩︎.
Cette solution s’est révélée, à l’usage, très efficace et plus productive que la visioconférence (Figure 4) : des échanges collectifs de deux heures sur les difficultés de transcription soumises par les participants – ponctués de jeux de mots ou de digressions documentaires liés au sujet abordé par le passage soumis – étaient suivis d’une « visite guidée virtuelle » d’un trésor du patrimoine français ou mondial accessible sur le web, conclue par un mini jeu-concours (Figure 5).
L’animation virtuelle du projet participatif Bulliot, Bibracte et Moi : outils, pratiques et bilan
Crédits : Particip-Arc
Cette dynamique humaine supportée par la technique a contribué à forger un esprit de groupe et a, sans nul doute, permis au projet de rester en ligne avec le calendrier prévu, en tirant profit de la désormais très forte diffusion des ordinateurs personnels et de la formation spontanée à la « littératie » numérique qu’elle avait provoquée ou accompagnée.
Hypotheses.org
La plateforme héberge le carnet de recherche du projet ; ce dernier est à la fois un centre éditorialisé d’informations pour la communauté (bilans d’usage, tutoriels, comptes-rendus de conférence à destination d’autres communautés de transcripteurs, documents d’organisation du projet) et une chambre d’écho pour ses réalisationsCarnet de recherche du projet « Bulliot, Bibracte et moi ».↩︎.
Pour aller au-delà de la conversation scientifique traditionnelle entre pairs académiques, des extraits de transcription, assortis d’un véritable appareil critique, y ont été régulièrement publiés. Leurs auteurs sont exclusivement des participants « amateurs » du groupe et ont signé leurs articles ; ils sont ainsi de facto élevés au rang de scientifiques à part entière.
Persée
Nouveau format de la bibliothèque numérique Persée, une Perséide propose un accès unique à un corpus de documents aujourd’hui dispersés et offrent des fonctionnalités de navigation et de recherche intégrées (interrogation du plein texte et des métadonnées des documents avec croisement des résultats de recherche) qui autorisent la mise en relation sémantique des sources réunies. Concernant les carnets manuscrits de Bibracte, la « Perséide BulliotMise en ligne à l’été 2024.↩︎ » (Figure 5) permet la mise à disposition du texte transcrit sous une forme structuré et indexée ; elle sera rapidement augmentée de liens directs vers les publications parues à l’époque et certaines publications modernes. C’est la dimension « aval » du projet.
Encore faut-il, pour que ces fonctionnalités donnent leur pleine mesure, que l’indexation, donc le repérage topologique et la pertinence (précision descriptive, cohérence de sens) des métadonnées soient pleinement assurés en amont. Or, la pose des balises revient entièrement aux « préparateurs de copie » qu’ont aussi été, dans le projet, les participants amateurs. Leur travail sera sans doute complété à terme par l’usage d’outils sophistiqués de fouille de texte (par Persée et/ou Archéorient et Bibracte) mais, lors de la mise en ligne, ce sont bien les balises directement issues du travail collaboratif – sans correction par les scientifiques – qui permettront à la plateforme d’établir les liens sémantiques entre les documents.
Liberté des contributeurs versus domination par la technique
Du point de vue d’Archéorient et de Bibracte, l’enjeu du projet était de permettre une expérience collective d’usage des archives archéologiques et non d’organiser une simple récolte de données. La démonstration la plus claire de la difficulté à « gouverner » un tel projet collaboratif, pour une plateforme qui le supporte, est paradoxalement fournie par celle qui, au premier abord, paraît la plus contraignante pour ses utilisateurs : Transkribus.
Faciliter ou diriger ? Quel optimum pour une plateforme ?
Cette application est d’abord pensée (et très majoritairement utilisée) pour un usage individuel ou dans le cadre d’une petite équipe de recherche. Or, la « team Bulliot » a pu la détourner vers une tout autre organisation. La raison en est la nature communautaire de toute plateforme, qu’elle soit gratuite ou payante.
Transkribus s’inscrit ainsi dans une sorte de marché « biface » : les utilisateurs (les transcripteurs) ne sont pas les payeurs (leurs institutions de rattachement), ce qui, sous une autre forme, est aussi une caractéristique de Slack (la gratuité pour la plupart est « payée » par les abonnements « premium » de quelques-uns). Leur vocation commune est d’agréger le plus grand nombre possible d’utilisateurs autour d’un service spécialisé, dans des conditions optimales pour chacun. Ceci suppose de limiter les contraintes d’usage au niveau minimum nécessaire pour garantir la qualité du service, c’est-à-dire privilégier l’expérience utilisateur : « faciliter » et non diriger.
À ce stade, il faut noter que Transkribus est une plateforme en transition : intégralement gratuit jusqu’en 2021 (son coût était supporté par un projet de recherche européen), le service est désormais commercialisé via une coopérative et une tarification différenciée (abonnement modeste pour les projets de transcription scientifique). Certains de ses clients se positionnent eux-mêmes en relais de commercialisation, en intégrant les fonctionnalités de transcription dans un package de prestations proposées à des institutions (archives municipales ou nationales, etc.). Dans ce nouveau cadre, les fonctionnalités sont élargies à des modules de gestion de projet plus sophistiqués qui permettent d’intégrer des milliers de contributeurs (voir par exemple cette application) ; à cette échelle, la liberté d’action de ces derniers (cf. ci-après) n’est plus guère soutenable et il s’agira bien de « diriger » : si la fluidité de l’expérience utilisateur peut rester un objectif pertinent pour le design de l’application, elle s’entend ici sous réserve de ce qu’impose le modèle économique choisi et la nécessaire efficacité du processus global pour l’acheteur final.
Science participative et liberté d’action des contributeurs
Les participants (et non le musée ni les institutions) ont donc été considérés comme le véritable cœur du projet « Bulliot », d’où l’adoption de quelques principes nourris des enseignements tirés de l’expérience accumulée en science participativeBernard, Loup et al.. 2019. Recherche culturelle et sciences participatives PARTICIP-ARC, Muséum national d’histoire naturelle.↩︎ :
- nouer une relation de pair à pair à l’intérieur du projet ;
- négocier étape par étape les objectifs à atteindre ;
- s’appuyer sur les motivations et sur les expertises profanes de chacun ;
- co-construire avec les participants les modalités opérationnelles de leur participation.
Cependant, du point de vue des participants, il est apparu que le projet était l’occasion d’établir « une relation avec un objet scientifique plus que la production » d’un corpus nouveau à étudierGrousset, Jean-Robert et al.. 2021. Bulliot, Bibracte et moi. Étude-action (rapport scientifique) remis au ministère de la Culture à l’issue du projet. Télécharger le PDF.↩︎. Cette relation s’épanouira d’autant plus qu’elle résonnera avec les aspirations personnelles (Figure 7), ce que traduira la négociation et la co-construction des objectifs, modalités d’action, etc., avec des volontaires toujours libres de participer ou non. Dans cette négociation s’inscrivent donc nécessairement les modalités concrètes d’usage des plateformes de travail choisies (ou imposée dans le cas de Transkribus) pour supporter le projet.
Co-construction
Il appartiendra donc à la communauté ou à son animateur d’imaginer et de proposer des arbitrages (et/ou des solutions techniques ou organisationnelles) pour qu’à chaque stade du projet, la valeur que le groupe considère comme essentielle (confort, efficacité, rapidité, qualité scientifique, ré-assurance individuelle, etc.) soit servie par un modus operandi adapté aux fonctionnalités proposées par la plateforme. Celle-ci et l’animateur ont partie liée : agréger (les participants) exige de faciliter (leur action), donc d’articuler tout ou seulement partie du fonctionnement technique collectif à la libre motivation de chacun. C’est le prix d’une véritable co-construction et de la pérennité.
Conclusion
Le plaisir de participer et les affects mobilisés ou réactivés par la participation sont les moteurs individuels de l’implication dans un projet de science participativeGrousset, Jean-Robert et al.. 2022. « Transcrire, traduire ou vivre l’Histoire en train de s’écrire ? Regards sur la transcription collaborative d’une archive archéologique », Valorisations et appropriations numériques des patrimoines et des mémoires. Communautés et pratiques d’écritures. Presses Universitaires de Paris Nanterre.↩︎. La qualité de l’expérience utilisateur des plateformes supports en est un ingrédient essentiel : c’est elle qui encadre la pratique concrète des volontaires et maintient, renforce ou dilue leur motivation.
Entre l’efficience des fonctionnalités des plateformes et la « liberté d’aller et venir » des participants, la pérennité du projet collaboratif exige que la balance penche du côté de la liberté d’appréciation du contributeur. Choisir de s’appuyer sur telle ou telle plateforme ne suffit donc pas ; les conditions pratiques de leur usage par les volontaires (le scénario pas-à-pas de l’action) font partie intégrante de la co-construction du dispositif avec eux.
De la pérennité du modèle biface de l’internet des plateformes et de la souplesse d’usage qu’elle induit dépend donc, pour partie, cette « mise en capacité » des projets financièrement les plus modestes et, à travers eux, de leurs contributeurs.
Contenus additionnels
Observatoire : Bulliot, Bibracte et moi
Bulliot, Bibracte et moi est une plateforme de transcription dédiée aux carnets sur la recherche archéologique sur le site celtique de Bibracte-Mont Beuvray. La transcription se focalise notamment sur les carnets de fouille (1867-1882) de Jacques-Gabriel Bulliot qui sont des documents scientifiques incontournables pour comprendre les débuts de cette nouvelle science, l’archéologie, et pour tous ceux qui travaillent et s’intéressent à Bibracte. La transcription des carnets sera ensuite mise en ligne sur la plateforme Persée en liaison avec les publications imprimées de Jacques-Gabriel Bulliot. Ces archives seront également intégrées à la médiation mise en œuvre au musée de Bibracte pour expliciter la chaîne opératoire de l’archéologie, dans une perspective historiographique concernant la découverte de la protohistoire européenne.
Carnet de recherche du projet Bulliot, Bibracte et moi
Accéder au carnet de recherche du projet Bulliot, Bibracte et moi.
Crédits : Arkéotopia
Notes prises lors du forum
Notes 9. Bulliot, Bibracte et moi
Jean-Pierre Girard
L’intervenant commence par exposer le projet. Ce dernier est financé par le ministère de la Culture, autour des carnets archéologiques de Jacques-Gabriel Bulliot. Au cours du XIXe siècle, cet archéologue organise chaque été des fouilles sur le mont Beuvray (Saône-et-Loire), persuadé qu’il s’agit du site de l’ancienne cité Bibracte. Il laisse un grand nombre de carnets de fouilles. Ils sont partiellement transcrits par divers chercheurs au cours du temps, mais jamais mis à disposition, notamment pour des questions de droits.
Le projet réunit plusieurs institutions (dont les propriétaires desdits carnets) pour transcrire les carnets numérisés. Des ateliers organisés sur le site de Bibracte et au musée d’Archéologie de Roanne ont abouti à la construction d’une équipe de transcription amateur. Pour outiller le projet, un logiciel de reconnaissance d’écriture manuscrite (Transkribus) est employé. Les participants travaillent dans un premier temps à transcrire intégralement une centaine de pages, qui serviront à entraîner le moteur de transcription. La transcription est ensuite réalisée automatiquement, mais les participants relisent. La transcription doit être aussi fidèle que possible, en incluant les fautes, les ratures, les orthographes anciennes. Ce sont les bénévoles qui ont défini, ensemble, l’organisation de leur travail.
Les motivations des contributeurs sont variées : intérêt pour l’archéologie, recherche d’une dynamique de groupe, etc. En période de confinement, des ateliers sont encore organisés avec des outils de coordination à distance (mais pas de visio). Un article scientifique a été écrit par les contributeurs dans le cadre de l’appel à articles du FabPart Lab.
Notes 19. Pratiques de la documentation dans les fab labs
David Forgeron (chargé de projet TIC, Carrefour numérique)
David Forgeron expose l’exemple du fab lab de la Cité des Sciences et de l’Industrie. Il commence par rappeler que les outils sont moins importants que l’appropriation des utilisateurs pour leur problématique personnelle. Il rappelle également qu’il faut assurer la reproductibilité des approches dans d’autres fab labs. Pour ce faire, on capitalise sur des plateformes existantes, on aide à la documentation autour d’un projet ou d’une pratique spécifique. l’intervenant évoque ensuite la question de la propriété intellectuelle et de l’importance des licences libres dans ce processus pour s’assurer d’une possibilité de réutilisation.
Ensuite, David Forgeron décrit le fab lab du Carrefour numérique. C’est un espace de fabrication partagé avec des outils mis à disposition qui permet un prototypage rapide. L’enjeu, c’est la manière dont les utilisateurs vont s’approprier les outils mis à disposition. Il existe une charte qui régit tout ça, notamment la notion de reproductibilité de ce qui est conçu. Dans une logique de réseau : ce qui est produit doit pouvoir être reproduit dans un autre fab lab. Il y a non seulement un partage des pratiques, mais également d’un type d’outil particulier.
La documentation ici est centrale, elle permet d’expliquer ce qu’on a fait et comment on l’a fait. Le wiki favorise ce processus. Il permet de documenter à la volée, mais aussi de faire en sorte que ces documentations puissent être enrichies par d’autres contributeurs et d’avoir une traçabilité.
L’intervenant explique plus en détail le cas du Carrefour numérique qui utilise DocuWiki, une plateforme libre et simple à déployer, qui a la particularité de ne pas utiliser de base de données, bien que l’interface nécessite une formation particulière. L’introduction de gabarits de documentation facilite le travail des contributeurs. Par ailleurs, l’utilisation des métadonnées permet d’instruire les utilisations futures.
D’un point de vue juridique, ce dispositif s’appuie sur une exception à la propriété intellectuelle grâce aux licences libres. C’est un point essentiel pour assurer la réutilisation. Au Carrefour numérique, la licence par défaut est la CC-BY-SA. Cette licence est très granulaire, ce qui permet aux auteurs de choisir ce qui est réutilisable par les autres.
L’utilisation effective de cette licence au sein du fab lab n’est pas obligatoire, mais c’est le cadre de base, tout dépend ensuite du type de contribution et de la nature de la donnée (code, image, texte, image, vidéo, etc.). Le fab lab propose des outils de prototypage, de documentation, de diffusion, qui évoluent au fur et à mesure du temps, ils ne sont pas figés.
La question de la capitalisation sur les données doit respecter un cadre éthique et légal pour produire des contenus pour que la valorisation soit redirigée vers le bien commun et respecter un maximum la propriété intellectuelle.
Ici, Alessia Smaniotto demande à l’intervenant : qui porte la responsabilité sur la propriété intellectuelle et comment celle-ci est transmise ? David Forgeron répond que le fab lab est impulsé par la Cité des Sciences, donc Universcience. Le carrefour avait déjà des pratiques autour des logiciels libres et open source. Il y a un historique avec ces communautés. Le service juridique a donc travaillé sur les meilleures modalités. Les licences libres sont considérées par ce service comme un risque, car elles sont révisables. Mais pour l’intervenant, la question de la documentation et du repartage des données est un préalable à l’utilisation du fab lab. Il s’agit de contribuer à une communauté. Ce qui, de notre côté, suppose un travail de pédagogie à faire dès que les usagers investissent le lieu. Donc on propose une licence Creative Commons par défaut, mais on propose également l’utilisation d’autres licences avec, a minima, la possibilité de réutilisation dans un cadre personnel.
L’intervenant conclut que les fab labs ont récupéré les aspects de la culture open et la culture du hacking, et continuent à capitaliser sur ces mouvements qui ont la vocation à rendre les productions pour le bien commun.
Notes 23. WikiTopia Archives / ArkéoTopia
Jean-Olivier Gransard-Desmond (Icono-archéologue, ArkéoTopia)
L’intervenant présente le concept de science 4.0 incarné par le projet WikiTopia Archives. Cette plateforme s’intéresse aux propriétaires privés de manuscrits pour leur mise à disposition et leur étude, comme les archives épistolaires de savants du XIXe siècle. Il traite également de nouvelles données sur les origines de la recherche archéologique et sur les données collectées sur l’archéologie celte au XIXe siècle. On y trouve enfin 213 lettres administratives et d’échanges scientifiques.
En tout, sept personnes font partie des contributeurs : archéologues professionnels, bénévoles (formées, mais non payées) et amateurs (sans formation). La plateforme permet de numériser, téléverser et transcrire ces documents. Plus spécifiquement, voici la chaîne du processus : numérisation → transformation des images → téléversement sur Wikimédia Commons → création du lien → transcription. Pour la transcription, la plateforme Wikisource est utilisée car elle permet un accès direct, tout en assurant la traçabilité et l’anonymat.
Quels sont les enjeux ?
Accessibilité
A des données sans restriction géographique
Propriétaires privés, mais anonymat
Utilisation libre (open data) assure la pluralité des acteurs
Toutes les disciplines
Multilinguisme
Principes FAIR : il faut que les données soient faciles à trouver, accessibles et décrites en licence libre CC-BY-SA.
Traçabilité des données et modifications
Accès à de nouvelles problématiques
Réplication (reprise d’études archéologiques)
Facilité de mise en œuvre par rapport à d’autres outils
Valorisation : engagement du public