Cadrage théorique et méthodologique pour l’éthologie réflexive visuelle
English
version >
Christine Develotte, Morgane Domanchin, Samira Ibnelkaïd, « Cadrage
théorique et méthodologique pour l’éthologie réflexive
visuelle », Fabrique de l’interaction parmi les écrans :
formes de présences en recherche et en
formation (édition augmentée), Les Ateliers de [sens
public], Montréal, 2021, isbn:978-2-924925-13-3, http://ateliers.sens-public.org/fabrique-de-l-interaction-parmi-les-ecrans/chapitre1.html.
version:0, 15/06/2021
Creative
Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Le travail de recherche présenté dans cet ouvrage se fonde sur une approche interdisciplinaire des données d’interactions multimodales et plurisémiotiques. Le séminaire polyartefacté ici analysé fait l’objet d’une étude multidimensionnelle nécessitant, selon notre approche, un accès audiovisuel aux séquences d’actions verbales et non verbales de mise en présence de l’ensemble des participant·e·s. Il s’agit d’adopter une démarche d’éthologie compréhensive (Cosnier 1978), à savoir une « observation directe de comportements vécus dans l’ici et le maintenant » (Cosnier 2013, 258) prenant en compte les événements interactionnels autant que les affects et processus empathiques (Cosnier 2013).
Nous présentons dans ce chapitre les fondements théoriques et méthodologiques qui sous-tendent le recueil, la sélection et l’analyse de ce corpus de données audiovisuelles et justifient l’intérêt porté à ce terrain de recherche menant à l’émergence de ce que nous nommons une « éthologie réflexive visuelle ».
Choix théorico-méthodologiques
L’éthologie comme approche globale du terrain
Au sein de son laboratoire lyonnaisLaboratoire d’éthologie des communications, au fondement de l’actuel laboratoire ICAR.↩︎, Jacques CosnierJacques Cosnier a une formation initiale de biologiste.↩︎ a choisi l’éthologie pour décrire les situations de communication interpersonnelle (1978 ; 1986 ; 1987). Se fondant sur une analyse descriptive des comportements humains, cette approche y associe également le point de vue des individus observés à partir d’entretiens.
Cosnier a désigné cette approche naturaliste d’« éthologie compréhensive ».
Éthologie réflexive
L’auteur explique que :
la méthode éthologique est particulièrement heuristique dans les approches où l’observation est essentielle par exemple dans la clinique, la psychologie du développement, la psychologie sociale, c’est-à-dire partout où les communications interindividuelles constituent un objet d’étude privilégié (dans Hotier 2001).
Éthologie compréhensive
Cosnier note aussi que « cette éthologie humaine rejoint évidemment l’ethnographie de la communication de Hymes et Gumperz, la microsociologie de Goffman et l’ethnométhodologie de Garfinkel. Goffman lui-même parlait d’éthologie de l’interaction. » (Cosnier dans Hotier 2001). Il précise en outre que « dans ce type d’approche on ne part pas d’hypothèses, on y aboutit. […] Cette démarche d’observation naturaliste n’empêche pas de pratiquer en complément des entretiens avec les agents et les usagers et de tenir compte de leur vécu. » C’est pourquoi il la nomme « éthologie compréhensive ». C’est cette approche, permettant de croiser différents types de données (comportementales et issues d’entretiens par exemple), qui a été utilisée par Jacques Cosnier et Christine Develotte (2011) dans les premières recherches effectuées autour de la « conversation en ligne » (Develotte, Kern, et Lamy 2011).
Reprenant cette perspective éthologique, nous avons cherché ici à développer une approche nouvelle, l’« éthologie réflexive visuelle », en ce sens qu’elle porte sur des données d’interactions vidéos et qu’elle est appliquée à nous-mêmes, intégrant par là les avantages et les limitations dues au fait que l’éthologue et son objet se confondent et que, par exemple, les entretiens ont été conduits entre nous.
Le fait de recueillir les données pour chacune des séances a bien entendu modifié l’environnement classique du séminaire en y ajoutant micros et caméras susceptibles, par leur présence, d’influer sur les comportements des participant·e·s. La recherche effectuée intègre ce facteur qui n’invalide pas l’approche naturaliste retenue qui s’effectue précisément via l’enregistrement des comportements.
Le paradoxe de l’observateur
La problématique de l’observation scientifique des comportements sociaux par le·la chercheur·e en sciences humaines n’est pas nouvelle. Le « paradoxe de l’observateur » a été pointé par William Labov dès 1978 au cours de ses recherches sociolinguistiques : il s’agit de « chercher à observer le langage que parlent les gens quand on ne les observe pas » (Traverso 1999, 22). Ce paradoxe repose sur la volonté de chaque chercheur·e de « restituer des éléments au plus près de la réalité vécue alors que cette réalité doit être soumise à l’artificiel de l’observation systématique » (Mouchon 1985, 2). Les réflexions méthodologiques entreprises depuis lors aboutissent à deux possibilités principales de contournement de cette difficulté :
soit le·la chercheur·e devient un membre de la communauté par une immersion et un temps d’observation long sur le terrain (Mouchon 1985, 2).
soit l’observateur·rice et l’observé·e sont une seule et même personne – « le linguiste est aussi membre de la communauté observée, comme l’entreprit Labov dans son étude du ghetto de Harlem » (Boutet 2002).
C’est cette dernière solution qui a été retenue par notre groupe de recherche. Certains artefacts utilisés par les membres du groupe servent simultanément à la mise en présence des sujets entre eux et à la capture des données (par exemple les ordinateurs utilisés à la fois via les plateformes de visioconférence pour communiquer et via les logiciels de capture dynamique d’écran pour récolter les données interactionnelles). L’écran, servant tant à échanger en ligne pendant le séminaire qu’à capturer ces échanges pour les analyses futures, constitue alors autant un médium de communication que d’observation de cette même communication, réduisant ainsi le nombre d’artefacts utilisés simultanément.
Une telle démarche impose de faire des choix techniques éclairés, tels que le nombre de caméras et leur emplacement, qui sont issus des expertises acquises au sein du laboratoire ICAR. Cette approche éthologique réflexive visuelle prend place dans un paysage balisé en sciences humaines et sociales par l’ethnographie visuelle et l’analyse interactionnelle.
L’ethnographie visuelle
La complexité de l’étude de la présence des sujets par écran requiert, selon nous, une approche multimodale et plurisémiotique. C’est pourquoi nous faisons appel au domaine de l’ethnographie visuelle (Ruby 1996 ; Banks et Morphy 1997 ; Pink 2007 ; Dion 2007) pour appréhender l’écologie globale de l’interaction physico-numérique et suivre la progression du flux de présence transmédiatique, en faisant usage des outils digitaux à disposition de chaque chercheur·e en humanités numériques (caméra numérique, capture d’écran dynamique, logiciels de montage vidéo, etc.). Cette approche nous permet d’étudier les comportements communicatifs autant verbaux que non verbaux, sur et hors écran, et nous amène à appréhender la présence par écran comme un phénomène langagier, sensoriel et technique.
L’ethnographie visuelle
L’ethnographie visuelle trouve son origine dans l’idée selon laquelle les pratiques sociales se manifestent au travers de symboles visibles incarnés dans les gestes, cérémonies, rituels et artefacts situés dans des environnements autant naturels que construits (Ruby 1996, 1345).
Il est alors considéré, dès lors que les pratiques sociales se rendent visibles, que chaque chercheur·e doit être en mesure d’employer des technologies (audio)visuelles (photos, vidéos, etc.) afin de les recueillir et d’en constituer des données pouvant être exploitées, analysées, diffusées (Ruby 1996, 1345). L’image constitue un « élément intrinsèque et non extrinsèque du processus de recherche » en ethnographie visuelle (Dion 2007, 62). Il s’agit d’une méthodologie heuristique cherchant à « conceptgraphier » (étudier et représenter) « l’ethnos » (culturalités, pratiques et relations sociales) par des données et supports (audio)visuels. Le support visuel, image fixe ou animée, se révèle être à la fois un outil et un objet de recherche (Dion 2007).
L’approche visuelle ne peut être une copie ou un substitut à l’ethnographie verbale mais doit développer une méthodologie et des objectifs alternatifs bénéficiant à l’anthropologie dans sa globalité (MacDougall 1997, 292). En portant l’attention sur des données (audio)visuelles, l’ethnographie visuelle propose de nouvelles modalités d’appréhension des individus, des relations sociales, des cultures matérielles et de la connaissance ethnographique elle-même (Pink 2007, 22). La méthodologie de recherche repose alors sur trois activités principales (Banks et Morphy 1997) :
constituer des données (audio)visuelles (analyser les pratiques sociales en produisant des images) ;
examiner les données (audio)visuelles préexistantes (analyser les images fournissant des connaissances sur la société) ;
collaborer avec les acteur·rice·s sociaux·ales dans la production des données (audio)visuelles.
Au sein des méthodes visuelles, l’enregistrement vidéo représente, plus qu’un outil de recueil de données, une technologie participant à la négociation des relations socialesL’usage de la technologie sur le terrain ne peut se réaliser qu’à travers une coopération éclairée et des négociations explicites avec les participant·e·s afin de nouer une relation de confiance indispensable à une constitution éthique du corpus de données interactionnelles.↩︎ et un média par lequel la connaissance ethnographique est produite (Pink 2007, 173). De surcroît, les nouvelles technologies numériques, les interfaces et les réseaux socionumériques introduisent progressivement des études ethnographiques portant sur les pratiques communicationnelles digitales quotidiennes des individus et des communautés (Pink 2007, 197). Émerge alors, au-delà de l’ethnographie visuelle, une ethnographie numérique se voulant délinéarisée, multimodale et plurisémiotique (Pink 2007, 197).
L’analyse interactionnelle
La notion d’interaction recouvre des définitions plus ou moins restreintes en fonction de l’attitude portée à son égard. Goffman, linguiste et sociologue figurant parmi les fondateur·rice·s de l’analyse des interactions, explique que :
Par interaction (c’est-à-dire l’interaction face à face), on entend à peu près l’influence réciproque que les partenaires exercent sur leurs actions respectives lorsqu’ils sont en présence physique immédiate les uns des autres (Goffman 1973, 23).
Recipient design principle
Catherine Kerbrat-Orecchioni précise, quant à elle, que pour qualifier une situation d’interaction « il faut et il suffit que l’on ait un groupe de participants modifiable mais sans rupture, qui dans un cadre spatio-temporel modifiable mais sans rupture, parlent d’un objet modifiable mais sans rupture » (1990, 216).
Aussi, de sorte à garantir la continuité et la bonne conduite de l’interaction, l’activité de parole implique-t-elle nécessairement une adaptation à son auditoire correspondant au recipient design principle. Ce concept sous-entend que « tout au long de son travail de production l’émetteur tient compte projectivement de l’interprétation qu’il suppose que l’auditeur va faire de ses propos » (Kerbrat-Orecchioni 2005, 16). En développant cette notion de recipient design, Harvey Sacks, Emanuel A. Schegloff et Gail Jefferson font référence aux multiples ressources, visibles dans le tour de parole d’un·e locuteur·rice, qui témoignent d’une orientation manifeste vers les coparticipant·e·s. Ce procédé s’inscrit dans la sélection des unités lexicales et thématiques, dans la manière d’ordonner les séquences, et également dans les obligations et alternatives retenues pour ouvrir et clore une interaction (Sacks, Schegloff, et Jefferson 1974, 727). Le principe de recipient design permet aux interactant·e·s de structurer leurs ressources langagières de manière à créer un foyer d’attention conversationnel commun, construire et contrôler conjointement le cours de l’interaction, garantir l’intelligibilité des éléments qui leur semblent pertinents et préserver la stabilité du lien interactionnel (Sacks, Schegloff, et Jefferson 1974, 727).
L’ensemble des ressources conversationnelles nous renseigne alors sur l’activité que les participant·e·s façonnent depuis le tour de parole à la structure globale de l’interaction afin d’en définir le contenu, la forme et les modalités de présences mises en jeu. C’est donc notamment dans une orientation interactionniste à partir des travaux initiés par Goffman, et par Sacks, Schegloff et Jefferson, puis poursuivis notamment par Cosnier, Kerbrat-Orecchioni, Véronique Traverso et Lorenza Mondada que certains des chapitres ici proposés analyseront les productions langagières des participant·e·s.
Il s’agit en outre, par les travaux ici regroupés, d’étendre cette approche interactionniste par l’étude de l’impact de l’écran sur les rituels interactionnels observés jusqu’alors hors écran. Il apparaît nécessaire de décrire « la frontière entre nouvelles pratiques et structures normatives, et l’appropriation par les acteurs humains à la fois des outils et des pratiques discursives ou sémiotiques qu’ils induisent » (Develotte, Kern, et Lamy 2011, 19).
Décrire la conversation en ligne
Les contributeur·rice·s à l’ouvrage Décrire la conversation en ligne (Develotte, Kern, et Lamy 2011) s’inscrivaient déjà dans un renouvellement des analyses traditionnelles centrées sur le texte, en proposant d’identifier et d’adapter les méthodes d’analyse des interactions en intégrant leur multimodalité – voco-posturo-mimo-gestualité – et leur plurisémioticité – notamment le graphisme, l’audio, la vidéo. La présente recherche émerge de ces fondements et cherche à appréhender de manière interdisciplinaire les expériences écraniques à partir de comportements multimodaux et plurisémiotiques que nous avons rendus observables (captures d’écran dynamiques, enregistrements vidéos, etc.).
Une approche transdisciplinaire : l’éthologie réflexive visuelle
Nous avons choisi de faire usage de la vidéo pour capturer, analyser et illustrer les phénomènes interactionnelsComplétés par des entretiens semi-guidés et d’explicitation.↩︎. Il s’agit donc non pas de retranscrire les productions verbales en les accompagnant de mises en mots des gestes interactionnels – tel que le propose la tradition de l’analyse conversationnelle fondée au départ sur des enregistrements audio – mais plutôt de conserver le matériau audiovisuel primaire et de guider le ou la lecteur·rice-observateur·rice par un enrichissement sémiotique et narratif réalisé en postproduction. La vidéo constitue ainsi un mode de représentation analytique en soi qui suit un scénario établi en amont par chaque chercheur·e. Les capsules vidéos comme illustrations dynamiques forment selon nous une modalité novatrice de restitution du travail d’analyse des données et participent du renouvellement de l’étude des interactions sociales en mettant à profit les outils technologiques à la disposition des chercheur·e·s en humanités numériques.
Au-delà de ce cadre théorico-méthodologique général, les auteur·rice·s des différents chapitres de cet ouvrage ont choisi des cadres théorico-méthodologiques spécifiquement adaptés à leur thématique et exposés au sein de chaque chapitre. Le fait de convoquer différents domaines dans nos analyses implique que les mêmes concepts sont parfois utilisés différemment selon les approches choisies.
Situation matérielle
Nous commencerons par décrire l’« écosystème numérique » (Bourassa 2018) du séminaire, en termes matériels et humains. Ce concept permet de penser les contextes où entrent en jeu de multiples acteur·rice·s, qu’ils soient humains ou non humains, liés par des relations organiques, techniques et dynamiques.
Le numérique de Renée Bourassa
Le numérique ne s’isole pas sur lui-même, il s’imbrique dans le monde physique de façon irréductible, et de façon tout aussi matérielle (Bourassa 2018).
Dans le cas de notre séminaire, l’intrication des dimensions présentielle et distancielle s’effectue en effet par le biais des outils et artefacts de communication.
Sur le plan spatial
La salle du Laboratoire d’Innovation Pédagogique et Numérique (LiPeN)
Le séminaire « Interactions Multimodales Par ÉCrans » (IMPEC) se tient à l’École normale supérieure (ENS) de Lyon dans une salle adaptée au travail d’atelier pédagogique (espace ouvert, mobilier mobile et modulable)Cet espace porte le nom de « Laboratoire d’Innovation Pédagogique et Numérique » (LIPeN).↩︎.
Schémas du dispositif
Le premier schéma illustre le dispositif de communication utilisé dans ce séminaire hybride : des participant·e·s en présentiel à Lyon et d’autres à distance, via différents artefacts.
Le deuxième schéma précise le dispositif de captation retenu pour la collecte des données.
Le troisième illustre l’expérience phénoménologique du séminaire en fonction des différents points de vue des participant·e·s.
Le processus à l’œuvre dans la mise en présence des sujets est nommé ici « chronotope » à la suite des travaux littéraires de Mikhaïl Bakhtine (1978) faisant référence à la construction d’une forme d’unité de temps et de lieu. Ici le chronotope se construit au sein d’un cadre spatio-temporel hybride (physico-numérique), réticulaire (réseau de participant·e·s, de lieu et d’artefacts communicationnels) et progressif : le passage du lieu objectif (une salle quelconque) au lieu subjectif (ma connexion sur mon ordinateur et un ou des logiciels dédiés) au lieu intersubjectif (la perception des autres participant·e·s via mes artefacts).
Exemples de chronotopes
Lors des séances enregistrées, les participant·e·s à distance se trouvaient, selon les sessionsCf. Introduction.↩︎, à Londres (Royaume-Uni), Hangzhou (Chine), Besançon, Caen et Aix-en-Provence (France) et ont utilisé des artefacts variés pour communiquer.
Les artefacts de communication à distance et leur disposition dans la pièce
Dans cet ouvrage, nous différencions les notions de « dispositif », d’« artefact » et de « plateforme ». Nous entendons par dispositif l’agencement de multiples artefacts et l’usage de différentes plateformes visant à produire des formes de présence.
Dispositif, artefact et plateforme
Par exemple, le dispositif de communication à distance s’appuie sur des plateformes de communication et de transfert de documents (Adobe Connect, Skype, logiciel embarqué de Beam, Google Drive, etc.) ainsi que des artefacts hébergeant ces plateformes (ordinateurs, tablettes, robot Kubi, robot Beam, vidéoprojecteur, webcam mobile, etc.).
La notion d’« artefact » permet de distinguer l’humain du non humain et de désigner un objet non animé quel qu’il soit sans préciser sa fonctionEn revanche le terme « outil » se fonde sur la fonction de l’objet, il permet de faire quelque chose qu’il n’est pas possible de faire sans, ou du moins il facilite l’action.↩︎. Les artefacts (c’est-à-dire les objets physiques) sont donc distincts des plateformes (c’est-à-dire les logiciels intégrés dans ces artefacts) : Skype est une plateforme qui peut être utilisée sur différents artefacts – un ordinateur, une tablette, un téléphone, etc.
Le dispositif de recueil de données est quant à lui constitué des micros et des caméras permettant la capture des données d’interactions.
Sur le plan temporel
Le programme général de la recherche a été établi ainsi :
- 2016-2017 – design de la recherche et recueil des données ;
- 2017-2018 – traitement des données, archivage, choix des axes de recherche, début de discussion concernant l’éditorialisation ;
- 2018-2019 – analyse des données et écriture du livre, réflexions préparatoires à l’édition en ligne ;
- 2019-2020 – éditorialisation en ligne et ouverture de la base Ortolang contenant le corpus des données de cette recherche au public scientifique.
Déroulement du séminaire
Le séminaire IMPEC, dans lequel a lieu l’atelier « Présences numériques », se déroule sur une journée entière, de façon mensuelle. Depuis 2016, les séances sont structurées en deux parties : une première partie consacrée au travail des doctorant·e·s ou à l’accueil de conférencier·e·s, la deuxième à l’avancement du projet. Si, dans la première partie, le séminaire est ouvert à tout le laboratoire ICAR, la seconde est réservée aux participant·e·s à l’étude. C’est donc sur une base quasi mensuelle que les échanges collectifs autour de cette recherche ont eu lieu, et continuent à avoir lieu au moment où s’écrivent ces lignes. Sur la douzaine de participant·e·s que comporte le groupe, environ un tiers (pas toujours les mêmes personnes) a suivi le séminaire à distance (de façon ponctuelle ou régulière).
Deux types de données
Les données qui ont été recueillies sont de deux types : des données comportementales et des données issues des entretiens avec les participant·e·s.
Données comportementales
Lors de l’année 2016-2017, le choix de cinq séances de séminaire (cf. ci-dessous) s’est effectué en fonction de la variation maximale des situations de communication : nous avons cherché à ce que les conférencier·e·s se trouvent tour à tour en situation présentielle et distancielle (à distance via robot Beam ou Kubi ou, en présentiel, à Lyon), de façon à multiplier les scénarios de communication à étudierCf. « Les spécificités d’une recherche réflexive ».↩︎. Nous avons également cherché à varier différents critères tels que le statut de chaque conférencier·e (doctorant·e ou chercheur·e confirmé·e).
Choix des conférences et des conférencier·e·s
Chaque intervention (conférence ou data session) a été suivie de 45 minutes d’interactions avec les participant·e·s en présentiel et à distance (faisant également partie du corpus). Les conférencier·e·s ont été choisis en fonction de la proximité de leur recherche avec la nôtre, en tant qu’ils étaient susceptibles de venir nourrir notre réflexion autour de la notion de « présences numériques ».
Données relatives au ressenti des participant·e·s
Il s’agit principalement d’entretiens filmés ou enregistrés qui ont été méthodologiquement différents selon l’optique de recherche : entretien d’explicitation (Vermersch 1994) ou bien semi-dirigé pour clarifier des aspects précis.
Entretien d’explicitation
L’entretien d’explicitation consiste en une forme particulière d’entretien qui « s’intéresse au vécu de l’action, et plus précisément aux informations de type procédural, dans le but de reconstituer la structure de l’action » (Martinez 1997, 2). En d’autres termes, l’explicitation vise à faire décrire à la personne une action de la façon la plus fine possible et à intégrer les émotions, les pensées et les actions associées à la description. Le tout constituant (pour partie) la structure de l’action. Certains des entretiens ont été filmés afin d’appréhender la dimension multimodale de la parole (indices comportementaux, intonations de voix, gestes, etc.) de l’expérience subjective.
D’autres recueils des perceptions individuelles ont eu lieu par écrit ; tant à la fin de chaque séance, en vue d’une évaluation du ressenti de la présence des un·e·s et des autres, que de manière asynchrone, donc plus réfléchis, en aval des séminaires (quatre questions relatives au ressenti des participant·e·s). Par ailleurs, 18 entretiens sous forme audio ou vidéo ont fait l’objet d’une transcription qui a été relue par la personne concernéePour les participant·e·s, la multiplicité des expériences n’a souvent pas été possible. Seules quelques-unes ont pu expérimenter l’utilisation de tous les artefacts de communication à distance.↩︎.
Dispositif de recueil des données
Séances retenues
Voici les cinq séances retenues présentées synthétiquement ci-dessous et que nous commentons ci-après :
Recueil 1 du 21.10.2016 | Recueil 2 du 18.11.2016 | Recueil 3 du 20.01.2017 | Recueil 4 du 24.03.2017 | Recueil 5 du 28.04.2017 |
---|---|---|---|---|
Séance
1 Data session de Morgane |
Séance
2 Conférence des Anthropologues |
Séance
3 Travail collectif (Partie 1 et Partie 2) |
Séance
4 Conférence de Susan Herring |
Séance
5 Data session de Christelle (Partie 1 et Partie 2) |
Recueil 1 : Morgane
Domanchin, doctorante présente à Lyon, a exposé l’avancée de son
travail de thèse (20 minutes de présentation + 28 minutes de discussion)
au cours de sa présentation intitulée « Complexités dans les
interactions pédagogiques par écran : le cas du multitasking
chez les apprenants ».
Recueil 2 : Évelyne Lasserre (Université Lyon 1) et Axel Guïoux (Université Lyon 2), présent·e·s à Lyon, ont donné une conférence intitulée « Mobilis Immobile - La présence au-delà de l’empêchement » (45 minutes de présentation + 52 minutes de temps de discussion).
Recueil 3 : séance de travail (32 minutes de présentation + 68 minutes de temps de discussion) entre les participant·e·s à l’atelier « Présences numériques » à Lyon et à distance. Il s’agissait de déterminer quels axes de recherche seraient choisis par les différents sous-groupes. Chaque sous-groupe, à tour de rôle, a présenté ses idées qui ont été discutées collectivement de façon à articuler les différents axes entre eux.
Recueil 4 : conférence distancielle de Susan Herring à San Diego (États-Unis) via le robot Beam et Adobe Connect (50 minutes de présentation + 50 minutes de temps de discussion), « Discourse Pragmatics of Robot Mediated Communication ».
Recueil 5 : présentation distancielle de Christelle Combe (Aix-en-Provence) via le Kubi et Adobe Connect (46 minutes de présentation + 52 minutes de temps de discussion), « De l’ethos imaginé à l’ethos produit par des apprentis-tuteurs en ligne ». Cette présentation était suivie d’un temps de travail collectif.
Ce sont cinq séances sur les dix de l’année 2016-2017 qui ont été sélectionnées pour constituer le corpus de recherche d’une durée totale de 9 heures 16 minutes. Chaque séance a été filmée, à Lyon, sous trois à quatre angles différents, et deux à quatre prises de son différentes. Par ailleurs, au moins deux vidéos ont été recueillies à chaque séance pour documenter les comportements des participant·e·s distanciel·le·s par le biais de captures dynamiques d’écran ou de vidéos externes. Ces données peuvent être disposées en multiécran et, selon les analyses, proposer des agrandissements de certains aspects par l’utilisation du zoomVoir les photos dans l’annexe « Enjeux techniques et défis méthodologiques de l’ingénierie de terrain au service de la recherche ».↩︎.
Cellule de Corpus Complexes
On notera que les deux premières séances (septembre et octobre) ont été entièrement consacrées aux discussions en groupe sur le projet à mener et que la séance de février a également été dévolue à des échanges destinés à ajuster la suite du recueil de données.
Afin de réaliser ce recueil dans des conditions optimales, en particulier pour soigner la qualité des vidéos qui constituent la base de nos analyses, nous avons bénéficié de l’appui technique et méthodologique de la Cellule de Corpus Complexes liée au laboratoire ICAR. Cette structure d’appui à la recherche composée d’ingénieur·e·s d’études du CNRS – notamment pour ce projet Julien Gachet, Justine Lascar et Daniel Valero – nous a offert une assistance aux différentes étapes de la collecte de nos donnéesElle a aussi été d’une aide précieuse pour la partie postproduction, et plus précisément pour la valorisation de la production de la recherche.↩︎.
Recueil de données
Le premier aspect a concerné le repérage des lieux et le choix des matériels de recueil de données (micros, webcam et caméras) de façon à ce que les prises de vues soient le plus riches possible par rapport à nos objectifs de recherche.
Ainsi :
- entre deux et trois caméras fixes sur trépieds ont été disposées autour de la pièce pour permettre à la fois une vue globale et une vue centrée sur le diaporama projeté,
Vues des caméras sur trépied
- une caméra action GoPro a été utilisée pour rendre compte d’une vue « en surplomb » sur la salle. Cette même caméra a parfois été placée devant le Kubi lorsque celui-ci était utilisé,
Vue « en surplomb » de la caméra GoPro
- une caméra 360° a été disposée au centre,
Vue de la caméra 360°
- quatre micros ont été répartis autour de la table en fer à cheval.
Mise en place du matériel
La mise en place de ce matériel commençait la veille de la séance de façon à mettre en ordre le dispositif et les fils électriques. Les captations elles-mêmes s’effectuaient une fois toutes les participantes à distance connectées, au début du séminaire scientifique proprement dit.
De façon à standardiser le référencement des données, nous avons adopté un système de dénomination des sessions et des vues qui fonctionne de la façon suivante :
Séance 1 - Data session de Morgane
Séance 2 - Conférence des Anthropologues
Séance 3 - Travail collectif (Partie 1 et Partie 2)
Séance 4 - Conférence de Susan Herring
Séance 5 - Data session de Christelle (Partie 1 et Partie 2)
Les extraits qui seront étudiés seront donc référencés par rapport à leur numéro de séance.
Travail de postproduction
À l’issue de chaque récolte de données, chaque source (audio, vidéo, capture d’écran, vue à distance) était traitée et synchronisée sur la base d’une même échelle temporelle (également appelée time code).
Cette synchronisation contribue à faciliter et enrichir l’analyse de phénomènes en permettant l’intégration de différents points de vue (in situ et ex situ). Par la suite, des montages audios et vidéos ont été réalisés par le biais des logiciels Final Cut Pro X et QuickTime Pro. Il s’agit de montages multiscopes (plusieurs angles de vue sur un même écran) dans lesquels des vues étaient sélectionnées permettant de combiner simultanément six à huit vues. Pendant la réalisation de ces montages, les sources audios ont été intégrées aux fichiers vidéosC’est ainsi que, contrairement au fichier .mp4, les fichiers .mov permettent aux chercheur·e·s, à partir du logiciel QuickTime Pro, de cocher ou décocher une piste audio. En cas de chevauchement entre participant·e·s par exemple, cette fonctionnalité permet de mettre en silence l’une des pistes son décochée, et peut s’avérer utile à la transcription des tours de parole.↩︎, pour permettre une meilleure répartition du son. Ces premiers montages ont constitué une base sur laquelle les sous-groupes de recherche ont pu s’appuyer pour illustrer leurs analyses.
Montage vidéo
Par la suite, des montages vidéos bénéficiant d’un enrichissement sémiotique (incrustation de transcription verbale, de graphismes porteurs de sens analytique – flèches, cercles, etc. –, et zooms) ont été réalisés. Ce type de vidéo multimodale a la particularité de rendre accountable l’écologie globale de l’interaction et de mettre en saillance des microévénements interactionnels signifiants. La vidéo ne constitue donc pas une simple illustration du propos scientifique mais fait partie intégrante de l’argumentation scientifique ; les analyses proposées dans cet ouvrage sont construites autour de la vidéo qui se fait à la fois source d’étude, processus analytique et démonstration de nouveaux concepts théoriques issus de ces analyses.
Synthèse du corpus
Le tableau ci-dessous synthétise les données du corpus. Il comptabilise la durée des enregistrements, les pistes vidéos et audios, ainsi que les artefacts mobilisés pour chacune des séances.
Séance 1 Data session de Morgane |
Séance 2 Conférence des Anthropologues |
Séance 3 Travail collectif (partie 1 partie 2) |
Séance 4 Conférence de Susan Herring |
Séance 5 Data session de Christelle (partie 1 partie 2) |
---|---|---|---|---|
00:48:44 | 01:37:00 | (1) 00:32:43 (2) 01:08:00 | 01:40:00 | (1) 00:46:49 (2) 00:52:57 |
8 pistes vidéo | 7 pistes vidéo | 7 pistes vidéo | 7 pistes vidéo | 7 pistes vidéo |
4 pistes audio | 4 pistes audio | 4 pistes audio | 4 pistes audio | 4 pistes audio |
Adobe Connect et robot Beam | Adobe Connect et robot Beam | Adobe Connect, robots Kubi et Beam | Adobe Connect, robots Kubi et Beam | Adobe Connect, robots Kubi et Beam |
Au total, le corpus « Présences numériques » compte :
7 heures d’enregistrement vidéo (durée des cinq séances),
35 heures d’enregistrement vidéo toutes vues comprises,
10 heures de captures d’écran,
28 heures d’audio.
Stockage
Le stockage s’est effectué sur la base de données Ortolang qui sera présentée plus loin. Afin de simplifier le partage entre nous, les données son et vidéos numérisées ont été classées et répertoriées selon une nomenclature permettant de les repérer facilement puis rangées dans des dossiers associés à chacune des cinq séances « IMPEC_LiPeN-année-mois-jour ». Une fiche technique récapitulative comprenant une rapide description de l’ensemble des vues disponibles accompagne chacun des recueils de données.
Élaboration de synopsis et mise en place d’un espace de travail collectif
Au cours de nos rencontres, nous avons cherché à mettre en place une méthodologie efficace permettant l’annotation collective. Ainsi nous avons procédé à la création de fichiers « synopsis » au sein d’espaces de travailGoogle Sheets sur Google Drive.↩︎ accessibles à l’ensemble du groupe et dans lesquels il a été demandé à chacun·e de renseigner des événements particulièrement pertinents en fonction de son axe de recherche.
Synopsis et pépites
Plus précisément, il était demandé d’annoter le time code d’entrée et de fin des événements repérés comme étant intéressants dans son axe de recherche et d’inscrire un commentaire descriptif. Ces synopsis ont permis d’avoir une vue globale sur le recueil étudié et de croiser les annotations. Les trois sous-groupes de recherche (attention, politesse et corporéité) ont ainsi repéré, dans l’ensemble des données, les cinq mêmes moments-clés qui synthétisaient différents aspects significatifs que nous avons appelés des « pépites ». Le repérage de ces pépites et moments-clés a permis de cibler les objets de recherche de chaque groupe et a également ouvert les discussions sur la méthodologie à adopter pour les transcriptions.
Transcriptions
Dix-huit entretiens (audios et vidéos) ont été menés avec chaque participant·e du groupe de recherche et ont été transcrits très simplement, c’est-à-dire en prenant uniquement en compte la partie verbale. Ces 14 heures 36 minutes audios ont été utilisées par le groupe et c’est la version transcrite de ces entretiens qui est rendue publique. Un livret de transcription de 231 pages, dans lequel les transcriptions ont été classées par ordre chronologique, a été réalisé et distribué, en mai 2019, aux différent·e·s participant·e·s.
Dispositif décisionnel et organisation des échanges
Choix d’animation du séminaire
En dehors du rôle d’animatrice du séminaire évoqué par Christine dans l’introduction, d’autres rôles ont été attribués et d’autres encore se sont imposés spontanément au cours des séances. L’organisation du séminaire, d’un point de vue logistique comme technique, a ainsi été largement assurée par ses membres.
Par exemple, Morgane, doctorante à Lyon et très impliquée dans la vie du laboratoire ICAR, a été chargée d’assister la mise en place matérielle de la salle en relation avec les membres de la Cellule Corpus Complexes. Elle a également assuré le suivi de la numérisation des vidéos et transcrit les entretiens. En dehors de cet appui technique et méthodologique « officiel », d’autres assistances ont aidé à la bonne marche des opérationsDorothée s’est occupée du robot Beam, Christelle a mis en place les séances de visioconférence sur Adobe Connect et a permis le lien avec l’équipe d’Ortolang pour le stockage des données, Caroline a pris en charge les réservations des salles et du matériel, les prises de note Google Docs et la gestion du Google Drive.↩︎.
Avancement collaboratif du travail d’analyse
Le choix a été fait d’associer l’ensemble des participant·e·s à toutes les étapes de la recherche. Cette implication de tou·te·s dans une co-construction de la recherche a impliqué une politique de concertation concernant les multiples tâches et sous-tâches composant cette recherche. Les discussions concernant chacune des décisions à prendre ont pris la forme d’ateliers de réflexion ou bien elles ont surgi au détour d’une data session. Les avis de chacun·e ont également pu être sollicités par email entre les séances. La mise en discussion a concerné, par exemple, le choix de la place des caméras dans la salle à Lyon, l’anonymisation ou non des données pour les publications…
Dispositif décisionnel
Une fois la décision prise par l’ensemble du groupe présent lors de la séance de discussion, le corollaire a été de considérer que les participant·e·s absent·e·s à la discussion entérinaient les décisions prises par les autres, de façon à ne pas ralentir l’avancement du projet et à respecter le calendrier.
Lors des data sessions, des propositions de visualisation ont émergé, elles ont été améliorées collectivement et intégrées (schéma du dispositif de Morgane, chronotopes de Samira, etc.) comme ressources communes au groupe (avec mention des auteur·rice·s concerné·e·s).
Outils de partage des documents
Une plateforme de dépôt scientifique
La plateforme Ortolang est un équipement d’excellence spécialisé pour la langue, complémentaire de l’offre générale proposée par Huma-Num. Son but est de proposer une infrastructure en réseau offrant un réservoir de données (corpus, lexiques, dictionnaires, etc.) et d’outils sur la langue et son traitement clairement disponibles et documentés.
Ortolang
La plateforme :
permet, au travers d’une véritable mutualisation, à la recherche sur l’analyse, la modélisation et le traitement automatique de notre langue de se hisser au meilleur niveau international ;
facilite l’usage et le transfert des ressources et des outils mis en place au sein des laboratoires publics vers les partenaires industriels et les PME ;
valorise le français et les langues de France à travers un partage des connaissances sur notre langue accumulées par les laboratoires publics.
Cette plateforme héberge nos données depuis le début de nos recherches. Elle a été choisie pour sa simplicité d’utilisation, son interface étant très conviviale, pour ses grandes capacités de stockage et pour la possibilité qu’elle offre d’ouvrir in fine le corpus à différents publics, de celui des seul·e·s chercheur·e·s au grand publicVoir le corpus « Présences numériques » sur la plateforme Ortolang.↩︎. Cet aspect open data renvoie au choix de politique scientifique effectué pour ce projet.
Un espace partagé pour données non sensibles
Nous avons utilisé Google Drive pour le stockage ponctuel de données associées à la recherche (préparation de publications, prévision de colloques, extraits vidéos…). Des Google Docs ont été utilisés pour les prises de notes collectives durant les séminaires, ces notes étant de même archivées sur Google Drive. Nous avons également procédé à l’élaboration collective de synopsis associés à chacune des séances.
Google Drive
Conscient·e·s des problématiques éthiques que pose l’usage de plateformes privées (concernant notamment la protection des données), nous avons fait le choix de cet espace partagé de façon responsable et réfléchie. En effet, cette plateforme n’a été utilisée que pour des échanges de notes et d’informations non sensibles, le corpus de données étant quant à lui stocké sur Ortolang. C’est l’aspect pratique de Google Drive qui nous a incité·e·s à l’utiliser et le fait que nous étions issu·e·s de différentes universités dont aucune ne proposait, à l’époqueD’autres solutions ont depuis été mises en place, comme par exemple AMUbox à Aix-en-Provence.↩︎, l’équivalent au niveau institutionnel.
Dispositif de rédaction
L’idée était de rendre compte de l’expérience vécue par le groupe de façon diffractée, à partir de la mise en lumière de différents aspects qui nous paraissaient les plus intéressants à étudier dans un premier temps.
Choix des différents chapitres
En 2017, la mise en commun des idées concernant les différents angles d’étude à privilégier a permis, dans un premier temps, de dégager trois thématiques de départ : l’attention, la corporéité et la politesse. La proposition a été faite aux participant·e·s de se regrouper autour de l’un de ces trois angles. En septembre 2018, la thématique de quatre nouveaux chapitres a été décidée : la comparaison des effets de présence par artefact, la co-construction d’une intelligence collective, la formation à la recherche et l’effet dynamique de groupe. De nouveaux groupes se sont constitués pour le travail en commun.
Le choix des auteur·rice·s s’est effectué librement et le travail d’analyse s’est donc réalisé en sous-groupes. L’idée étant que chaque sous-groupe puisse convoquer un angle d’étude original et que chaque chapitre soit susceptible de mettre en lumière un aspect vu sous un certain angle, qui ne serait pas celui de l’ouvrage dans son ensemble.
Travail de co-construction de l’ensemble
Le fonctionnement adopté fut le suivant : durant le séminaire, chacun des sous-groupes devait présenter la façon dont il pensait aborder les analyses, l’angle théorico-méthodologique choisi et quelques exemples de données exploitables. Chaque présentation a donné lieu à de nombreux échanges avec l’ensemble du groupe permettant d’éclaircir certains points et d’en enrichir d’autres.
Ces retours du groupe tout au long de l’écriture ont pris la forme d’un atelier de recherche de deux jours en juin 2019, centré sur les premières versions des différents chapitres.
Spécificités d’une recherche réflexive
Le fait de se prendre soi-même comme objet d’étude sur un sujet, l’étude des présences numériques, c’est-à-dire la communication multimodale en situation hybride qui constitue le domaine d’expertise des (apprenti·e·s-)chercheur·e·s, n’a rien d’anodin et engendre des effets qu’il importe d’intégrer dans l’analyse.
Réflexivité par rapport à l’objet de recherche
Les effets induits par la familiarité avec le sujet amènent par exemple à penser que les résultats des recherches se rapportent à un public « non naïf » susceptible donc d’adopter des comportements plus adaptés (dans le positionnement par rapport à la webcam ou l’utilisation du chat sur Adobe Connect par exemple) qu’un public non averti.
Par ailleurs, la neutralité des intervieweur·se·s devient toute relative quand il s’agit de collègues proches engagé·e·s dans la même aventure que soi-même, et l’on peut faire l’hypothèse que la préservation des faces des un·e·s et des autres peut être plus grande, surtout lorsque l’on sait que tout ce qui est dit sera rendu public. La bonne relation socioaffective entre les membres du groupe est une dimension assumée par rapport aux opinions recueillies.
Aspects éthiques : les mises en danger
S’étudier en tant que groupe permet certes d’éviter les problèmes de droits à l’image et de refus d’autorisation d’utilisation des vidéos à des fins de recherche. Cela rend donc une telle étude faisable. Cependant l’exposition de soi qu’implique cette décision demande à être consentie par tous et toutes dans les différentes dimensions de la recherche car cet engagement engage l’image de chacun·e des participant·e·s dans la durée. Nous reviendrons de façon plus précise sur cet aspect en conclusion de cet ouvrage.
Exposition de soi
L’exposition de soi est classique aujourd’hui dans les vidéos en ligne souvent associées aux conférences publiques. Elle modifie certaines stratégies discursives en fonction de l’image que l’on souhaite voir conservée de soi (correction du langage, humour, etc.). Mais ici la situation d’énonciation est bien plus compliquée qu’une situation de monologue contrôlé. La spontanéité qu’impose aux participant·e·s la situation polyartefactée, par exemple dans leurs réactions aux différents désordres susceptibles de venir troubler le cours des interactions, les amène à ne pas pouvoir contrôler leur ethos comme l’on pourrait souhaiter le faire. Si ce sont précisément ces difficultés de communication qui sont au cœur de notre étude, c’est une autre affaire que de se sentir dépassé·e·s pas les événements, empêtré·e·s dans une situation inattendue, tout en sachant que nos phases de désarroi seront conservées.
Mise au jour publique des données
Les échanges maladroits et laborieux des participant·e·s constituent le cœur même de la recherche et sont donc assumés. Cependant la perspective de savoir que le corps des participant·e·s va servir non seulement de données à l’étude que l’on va réaliser nous-mêmes, mais aussi de données à d’autres chercheur·e·s n’est pas anodine. À la pression de l’enregistrement des données qui est, pour les participant·e·s présent·e·s à Lyon, anticipé lors des séances de séminaires, s’ajoute la pression de savoir que ces données seront in fine accessibles à la communauté scientifique. En conséquence, un certain nombre d’ajustements se sont avérés nécessaires pour négocier à la fois la face des participant·e·s et l’accès des données à la communauté scientifique.
Ajustements décidés
La décision de conserver le prénom réel des participant·e·s vient rompre une tradition méthodologique dans l’analyse des interactions en sciences humaines et sociales. Habituellement, seules des initiales, voire des substitutions de prénoms, sont de mises. Ici, la revendication d’une étude réflexive passait, nous semblait-il, par cette exposition tant auctoriale qu’en tant qu’objet de recherche.
De plus, la décision collectivement prise de ne pas recourir à ce procédé découlait du caractère artificiel que cette opération aurait détenu : nous aurions été de fait reconnu·e·s par nos collègues chercheur·e·s. L’association à des prénoms différents aurait donc compliqué inutilement les analyses. Nous avons donc retenu l’idée de mentionner les vrais prénoms.
Les entretiens ayant été effectués à l’intérieur de notre groupe et non par des personnes extérieures, les formes de langage, d’humour ou de niveau de langue des réponses sont adaptées à la proximité sociale des participant·e·s entre eux·elles. C’est pourquoi il a été convenu que les fichiers audios seraient utilisés par les seul·e·s participant·e·s au groupe de recherche et qu’ils seraient transcrits pour être rendus publics sous cette forme.
En outre, une fois transcrits, les entretiens ont été discutés en groupe et il a paru nécessaire, pour ceux et celles qui le souhaitaient, de revoir la transcription brute pour la « nettoyer », en complétant les phrases, en explicitant les implicites et les déictiques, bref, en les clarifiant avant de diffuser les propos publiquement.
Vers une « éthologie visuelle »
Par les spécificités théoriques et méthodologiques qui viennent d’être présentées, nous visons à poser les bases de ce que nous proposons de nommer une approche éthologique visuelle. Elle s’appuie sur la vidéo et aussi largement sur la subjectivité de l’expérience vécue par les participant·e·s.
Définition de l’éthologie réflexive visuelle
Christine Develotte et Samira Ibnelkaïd
L’éthologie réflexive visuelle se fonde sur l’éthologie des communications humaines telle que l’a définie Jacques Cosnier (1978 ; 1986 ; 1987) : une science de l’observation des comportements humains doublée d’une prise en compte des ressentis et affects des sujets observés. Cette éthologie dite « compréhensive » (Cosnier dans Hotier 2001) a été, ici, appliquée à nous-mêmes (à la fois participant·e·s produisant des données d’interaction spontanée et chercheur·e·s analysant ces données). C’est pourquoi nous qualifions cette approche de « réflexive ». La notion de réflexivité, en sciences humaines, peut être définie comme « l’aptitude du sujet à envisager sa propre activité pour en analyser la genèse, les procédés ou les conséquences » (Bertucci 2009). La posture réflexive induit la nécessité de développer tant une capacité d’introspection subjective (pouvoir observer ses propres pratiques) qu’un décentrement de sa propre perspective (porter un regard critique sur sa pratique et sa démarche). L’éthologie réflexive implique des bénéfices techniques pour les chercheur·e·s (accès au terrain, compréhension aisée des éléments déictiques, du contexte spatio-temporel, de l’histoire interactionnelle, etc.). Néanmoins cette approche engendre également des difficultés intersubjectives (exposition de soi, gestion du groupe, des relations interpersonnelles, des niveaux et modalités d’engagement, rigueur scientifique et « neutralité axiologique » (Weber 1917), etc.). L’éthologie réflexive nécessite donc un engagement fort de la part du·de la chercheur·e impliqué·e.
Des outils peuvent faciliter la pratique réflexive en jouant un rôle de médiation entre les événements interactionnels et le vécu subjectif des « chercheur·e·s-participant·e·s » : c’est le cas notamment de la vidéo. Dans cette recherche, l’observation et l’analyse des pratiques s’appuie en effet sur des enregistrements vidéo des données interactionnelles (caméra numérique, capture d’écran dynamique, logiciels de montage vidéo, etc.). L’usage de la vidéo au sein de cette démarche éthologique réflexive, « visuelle » donc, est à mettre en lien avec les travaux de l’ethnographie visuelle (Pink 2007 ; Dion 2007). L’image, statique ou dynamique, se révèle être à la fois un outil et un objet de recherche (Dion 2007). Dans cette logique, les supports vidéo ne sont pas seulement des illustrations mais constituent le matériau de recueil et d’analyse des données d’interaction, et sont également exploités sémiotiquement pour rendre compte des résultats de ces analyses. En effet, des procédés graphiques divers (montage multiplan, encerclage et fléchage, zoom, gif…) permettent de visualiser voire d’expliciter les analyses ou les concepts théoriques crées, et ce au sein même des interactions étudiées.
L’éthologie réflexive visuelle se veut être une approche transdisciplinaire plaçant la multimodalité, le vécu subjectif et la sensorialité au cœur de l’analyse des interactions, de l’observation à la diffusion scientifiques.