Fabrique de l'interaction parmi les écrans

Autonomie et présence artefactuelle

Autonomie et présence artefactuelle dans un séminaire hybride polyartefacté

Amélie Bouquain

Christelle Combe

Joséphine Rémon

English version > Amélie Bouquain, Christelle Combe, Joséphine Rémon, « Autonomie et présence artefactuelle dans un séminaire hybride polyartefacté », Fabrique de l’interaction parmi les écrans : formes de présences en recherche et en formation (édition augmentée), Les Ateliers de [sens public], Montréal, 2021, isbn:978-2-924925-13-3, http://ateliers.sens-public.org/fabrique-de-l-interaction-parmi-les-ecrans/chapitre5.html.
version:0, 15/06/2021
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

Comme présenté en introduction de cet ouvrage, trois dispositifs de téléprésence sont utilisés dans le séminaire : les robots de téléprésence Beam et Kubi ainsi que le logiciel de visioconférence Adobe. Dans ce chapitre, à la lumière des travaux en communication multimodale interactive et plus spécifiquement en communication médiée par robot (Herring 2013 ; Takayama et Go 2012 ; Takayama et Harris 2013 ; Neustaedter et al. 2016 ; Sirkin et al. 2011 ; Gaver 1992), nous interrogeons la notion de présence artefactuelle à travers une étude comparative des affordances de ces dispositifs. Nous nous demandons comment les effets de présence liés à chaque dispositif définissent une présence artefactuelle ou une présence interactionnelle, en fonction de la co-construction interactionnelle mise en œuvre par les participant·e·s. Dans quelle mesure les effets de présence varient-ils en fonction de l’artefact ou d’un dispositif en particulier et dans la co-construction de son utilisation par les différents membres ? Notre étude prend appui sur les entretiens menés auprès des participant·e·s (Amélie, Jean-François, Samira, Christelle) que nous croisons avec l’analyse de certains moments critiques du corpus vidéo des séances.

Cadre théorique

Plusieurs études en communication multimodale interactive et en communication Homme-machine ont mis en évidence les caractéristiques des différents dispositifs de téléprésence employés et leurs effets sur la communication.

Les chercheur·e·s mettent en avant des paramètres tels que la rotation ou le champ de vision, mais aussi des caractéristiques de l’espace médié (au sein duquel l’interaction a lieu), telles que l’absence de symétrie dans l’émission et la réception du son et de l’image entre les différent·e·s participant·e·s.

Une approche centrée sur l’interaction et non sur la localisation géographique

Dans les études de situation de réunion avec des participant·e·s co-localisé·e·s et des participant·e·s en localisation distante, c’est souvent la localisation géographique qui est mise en exergue. La réunion avec les participant·e·s co-localisé·e·s est définie comme un « hub » tandis que le lieu distant, présent sous forme de « proxy » ou artefact permettant au·à la participant·e distant·e de participer (écran, caméra, haut-parleur, microphone), apparaît comme un « satellite » (Sirkin et al. 2011, 163). Cette vision « hub/satellite » est donc centrée sur le dispositif technique et non sur le vécu de l’interaction.

Dans notre étude, en revanche, nous ne considérons pas un lieu comme le « hub » et un autre comme un « satellite » parce que, d’une part, il y a parfois moins de participant·e·s dans la salle de séminaire qu’à distance et parce que, d’autre part, il existe différents « lieux satellitaires » (contre un seul individu satellite dans le cas de Sirkin et al.). Ainsi, pour correspondre à l’expérience vécue, le dualisme présent/distant doit être dépassé au profit d’une approche centrée sur l’interaction et non sur la localisation géographique.

Engagement et mobilité

D’autres chercheur·e·s ont étudié les dispositifs de téléprésence du point de vue de l’engagement dans l’interaction et des effets de mouvement. Herring (2013, 1), par exemple, pointe les difficultés des dispositifs de type Adobe, notamment les problèmes de son et de visualisation, la fatigabilité des participant·e·s, la difficulté à se sentir engagé dans l’interaction et les frustrations liées aux difficultés à prendre la parole :

However, currently popular teleconferencing tools (e.g., Skype, Adobe) are limited in various respects. Even when video is added to audio communication, remote participants often cannot see or hear everyone at the remote location, may feel disengaged and fatigued (because more effort is required to pay attention), and may experience interactional frustration due to difficulty getting the floor and identifying who is speaking (e.g., Egido 1990 ; Sirkin et al. 2011)« Cependant, des outils populaires actuels de téléconférence (par exemple Skype, Adobe) sont limités à plusieurs égards. Même quand la vidéo est ajoutée à la communication audio, les participants distants ne peuvent souvent pas voir ou entendre toutes les personnes du site distant, peuvent se sentir désengagés et fatigués (parce qu’un effort supplémentaire est requis pour prêter attention), et peuvent ressentir une frustration interactionnelle due à la difficulté de prendre la main et d’identifier qui parle » (notre traduction).↩︎.

Cette difficulté à se sentir engagé tient en partie à l’absence de possibilité de mouvement. Selon William W. Gaver (1992, 21), en effet, la possibilité d’explorer l’environnement par le mouvement n’est pas une caractéristique constitutive des espaces médiés puisque les caméras sont fixes, de même que les micros, et contrôlés par les personnes. Selon l’auteur, ce dispositif procure davantage la sensation de regarder la télévision, lorsqu’on est à distance, que d’avoir le contrôle sur une exploration perceptuelle.

À l’inverse, les « proxys kinétiques » (pouvant être mis en mouvement, comme le Beam ou le Kubi) permettent une approche hybride (Sirkin et al. 2011, 166) en combinant le mouvement et l’image vidéo, par opposition à un robot qui serait un simple avatar de la personne distante. L’artefact représente donc le·la participant·e distant·e et rappelle sa présence par un mouvement ou une rotation. Selon l’étude de Sirkin et al., la qualité de l’engagement conversationnel est plus élevée quand le mouvement est possible :

The motorized action brought the remote person to life. Hub participants were able to perceive the satellite’s attention in motion through the swiveling of the display« L’action motorisée ramenait à la vie la personne distante. Les participant·e·s dans le hub étaient capables de percevoir l’attention du satellite en mouvement à travers le pivotage de l’écran » (notre traduction).↩︎ (2011, 176).

Par rapport à un dispositif de visioconférence, le Kubi, par sa mobilité en rotation, crée un effet de présence supplémentaire (Herring 2013, 3). Au-delà de son faible encombrement, il permet en effet de faire pivoter l’écran pour suivre les prises de parole. Le Kubi n’offre cependant pas la possibilité de déplacement par l’utilisateur·rice qu’a le Beam (Herring 2013, 3) puisqu’il doit être transporté d’un endroit à un autre par un agent humain.

Sirkin et al. (2011) ont aussi mis en évidence des effets indésirables de mouvement. La rotation peut être interprétée comme une perturbation, et comme une interruption pour le·la participant·e distant qui doit diriger cette rotation. Lorsqu’on fait pivoter l’artefact pour faire face à un·e interlocuteur·rice, cela peut être perçu comme « tourner le dos » à d’autres participant·e·s :

Screen motion toward one person is more akin to turning one’s back (rather than one’s head) toward someone else« Le mouvement de l’écran vers une personne est plus proche du fait de tourner le dos (plutôt que tourner la tête) vers une autre personne » (notre traduction).↩︎ (Sirkin et al. 2011, 164).

Une autre difficulté tient au fait que les mouvements de tête et les mouvements de rotation des artefacts ne sont pas interprétés de la même manière, les participant·e·s cherchant à attribuer à ces derniers une intelligibilité, alors même que certains mouvements pouvaient être de simples incidents, sans aucune vocation communicationnelle.

Ces effets de mouvement se retrouvent dans notre contexte combinés à des caractéristiques d’autonomie comme nous le verrons plus bas.

Réciprocité des perceptions perturbée dans l’espace médié

Dans le domaine des interactions Homme-machine, Gaver (1992, 17) compare les affordances d’une situation non médiée avec une situation d’espace médié (media space) définie comme un espace créé par des réseaux d’équipements numériques audio et vidéo utilisés pour la collaboration synchrone (« computer-controllable networks of audio and video equipment used to support synchronous collaboration »). Il y associe les caractéristiques suivantes : collaboration distante, champ de vision restreint, inspection détaillée impossible, conscience périphérique limitée, transmission sonore biaisée, exploration perceptuelle limitée, discontinuité des espaces qui rendent plus difficiles les tours de parole et les gestes communicationnels. Ces caractéristiques valent pour le dispositif que nous analysons dans le présent ouvrage.

Au-delà de celles-ci, une autre caractéristique est l’anisotropie, c’est-à-dire la non-réciprocité des perceptions dans l’espace médiéCf. chapitre « Affordances attentionnelles dans un séminaire instrumenté ».↩︎, contrairement à l’air (c’est-à-dire à la communication face à face présentielle). Ce terme vient de la physique et s’applique lorsque les propriétés d’un objet varient suivant la direction. Comme l’explique Gaver, l’air est isotropique et permet la réciprocité des perceptionsCf. chapitre « Affordances attentionnelles dans un séminaire instrumenté ».↩︎ :

Air is isotropic with respect to light and – unless it is moving – with respect to sound as well. This means that air affords reciprocal communication, that people can predict what their partners will see and hear by what they themselves see and hear« L’air est isotropique en regard de la lumière et – sauf s’il se déplace – en regard du son également. Ceci implique que l’air permet la communication réciproque, et que les personnes peuvent prédire ce que leurs partenaires vont voir et entendre en fonction de ce qu’eux-mêmes voient et entendent » (notre traduction).↩︎ (1992, 23).

La médiation écranique vient donc perturber cette réciprocité en rendant anisotropiques les échanges. Ceci se traduit par exemple par la difficulté, pour les participant·e·s dans la salle de séminaire, de savoir précisément sur quoi se porte le regard du·de la participant·e distant·e. Sirkin et al. (2011) pointent l’importance, pour ce·tte participant·e distant·e, d’avoir une vue d’ensemble, de manière à pouvoir suivre quels foyers d’attentionCf. chapitre « Affordances attentionnelles dans un séminaire instrumenté ».↩︎ sont activés. En effet, de nombreux paramètres peuvent être inconnus pour les participant·e·s dans la salle de séminaire (Sirkin et al. 2011, 164) : c’est le cas par exemple de l’angle de vue de la caméra du·de la participant·e distant·e ou la taille de son écran d’ordinateur. De plus, toujours selon ces auteur·rice·s, l’effet « présentateur télé » fait que les participant·e·s en présentiel se sentent tou·te·s regardé·e·s en même temps si le satellite regarde la caméra, ou tou·te·s négligé·e·s s’il détourne le regard. Ils notent aussi le « skip-over effect », par lequel le·la participant·e distant·e tend à être négligé·e malgré la présence de l’artefact en présentiel qui le·la représente.

Au terme de cette brève revue de littérature, nous retenons que la complexité de la situation est due notamment à l’anisotropie de l’espace médié, ainsi qu’aux affordances des dispositifs de téléprésence employés, en fonction des possibilités de déplacement ou de rotation, mais aussi en fonction de la manière dont ces mouvements se manifestent et sont interprétés par les participant·e·s. À partir de ces éléments, nous pouvons à présent analyser les caractéristiques interactionnelles de notre corpus et les effets de présence qu’elles génèrent.

Analyses et résultats

Les dispositifs de communication à distance présentent différentes potentialités de mouvement, de vision et d’audition, qui ont des impacts en termes d’effets de présence, autour d’enjeux d’émission/réception, et de visibilité/invisibilité ou de présence/absence : on peut être présent·e et invisible aux autres ou visible et absent·e. Ces effets de présence définissent une présence artefactuelle ou une présence interactionnelle, en fonction de la co-construction interactionnelle mise en œuvre par les participant·e·s. Nous définissons la présence artefactuelle comme la présence de l’objet avec une possibilité réduite d’interaction, par opposition à la présence interactionnelle qui permet de prendre sa place dans l’interaction sans empêchement. Et nous verrons que c’est principalement les enjeux d’autonomie de mouvement et d’ajustement visuel et sonore qui déterminent le statut objectal ou interactionnel du·de la pilote et de son artefact. Il apparaît ainsi que ces effets de présence mettent en jeu la convivialité, la furtivité, le positionnement par rapport à la sollicitation ou à l’injonction ainsi que la temporalité (début/fin).

Autonomie de mouvement et de déplacement

Les mouvements et déplacements sont caractérisés par des paramètres d’autonomie : les déplacements sont-ils possibles ou impossibles, pilotés de manière autonome ou tributaires d’autrui ? Le déplacement doit être considéré également en termes de position de départ : celle-ci a-t-elle été choisie par l’utilisateur·rice ? D’autre part, le déplacement est-il une translation et/ou une rotation (rotation de la tête ou de l’artefact ; rotation lente ou rapide ; rotation furtive ou bruyante) ? On distinguera donc mouvement en production et effet de mouvement en réception.

Possibilité de mouvement du Beam

Notre expérimentation nous a montré que le Beam n’offrait à son utilisateur·rice qu’une autonomie de mouvement toute relative.

Autonomie de mouvement relative du Beam

Lors de la séance 5, par exemple, Morgane, qui a une visibilité totale de l’espace de la salle, choisit de déplacer elle-même le dispositif de téléprésence Beam qui se trouve dans le champ de la caméra de capture des données de recherche. Amélie est momentanément réduite à sa présence artefactuelle, mais elle prend aussitôt le relais en pilotant finalement elle-même le déplacement.

Autonomie relative du Beam

Dans la séance 2, on trouve une autre illustration des limitations des possibilités du Beam, lorsque la présence de l’artefact semble être articulée dans l’espace par rapport à la présence groupale.

En effet, lorsque les conférencier·e·s déplacent la table sur laquelle il et elle sont installé·e·s pour se rapprocher du micro qui envoie le son aux participant·e·s à distance, Amélie, utilisatrice du Beam, se trouve entre cette table et les tables derrière elle, où sont installé·e·s les participant·e·s à Lyon.

Figure 1 : Proximité des conférencier·e·s face au Beam

Même si elle vit ce changement de configuration comme inconfortable, elle ne peut se déplacer car elle est gênée par les tables qui limitent ses mouvements et rendent difficile son déplacement vers un autre endroit de la salle :

C’est vrai que, wow ! quand ils se sont rapprochés, j’ai senti que la distance normale, la distance interpersonnelle entre les personnes, là elle était explosée, ils étaient pratiquement à ras de moi [...] c’est peu confortable.

On voit donc que, dans ce cas, le confort de la personne à distance cède la place à celui des participant·e·s dans la salle de séminaire.

D’un autre côté, la pilote du Beam peut exercer une autonomie dans le pilotage de l’artefact.

Effet de présence du pilotage autonome du Beam

Lors de la séance 3, on voit un exemple d’effet de présence du déplacement du Beam, qui est également commenté par la pilote en entretien.

Au cours de la discussion en groupe, la pilote du Beam commence à le faire pivoter légèrement sur ses roues, puis s’avance brusquement vers le centre de la salle. Christine s’exclame alors : « Ah, elle m’a fait peur ! » et Morgane, en mettant la main sur son cœur, « Oh purée ! ». L’interruption ne dure cependant pas plus de 5 secondes.

« Elle m’a fait peur »

Notons qu’il s’agit de la dernière séance enregistrée pour la constitution du corpus de recherche et une certaine accoutumance aux dispositifs apparaîtCf. chapitre « Bugs numériques et ratés interactionnels au service d’une intelligence collective ».↩︎ ou, en tout cas, un protocole tacite de prise en charge des interruptions de manière à ce que l’ensemble des interactions demeure fluide.

Effet de présence du mouvement du Beam

Effet de mouvement du Beam

Amélie commente en entretien l’effet de mouvement, dans la perception qu’en ont les autres participant·e·s et dans l’image qu’elle s’en fait :

Me déplacer pour me déplacer, si les autres ils ne perçoivent pas du sens, ça peut perturber, et aussi c’est la perception de moi que j’ai du signalement de ma présence via les mouvements du robot.

Au vu de nos analyses, la présence artefactuelle ou interactionnelle semble dépendre de la perception par autrui autant que de la perception de soi. Dans l’espace médié anisotropique, les participant·e·s se fient autant à la perception d’autrui qu’à leur propre perception pour tenter de reconstituer une perception globale et permettre à l’interaction de fonctionner.

Présence artefactuelle du Kubi

Le renvoi de la pilote de l’artefact à sa présence artefactuelle s’effectue de diverses manières, comme nous avons pu le constater dans nos analyses.

Autonomie de rotation relative du Kubi

Lors de la séance 3, les participant·e·s tentent de dessiner une représentation du dispositif d’expérimentation sur le tableau blanc qui est au mur. Notons que la pilote du Kubi a la possibilité de préparer son interface et de configurer le positionnement des interlocuteur·rice·s, d’où l’obligation de tout reconfigurer si on le change de place. Lors de cette séance, Christelle, alors qu’elle a positionné dès le début de la séance les interlocuteur·rice·s sur l’interface du Kubi afin de pouvoir s’orienter plus facilement, se trouve désorientée lorsque les participant·e·s en présentiel décident d’interagir à partir du tableau. En effet, Christelle est présente à travers le Kubi posé sur une table, mais elle ne parvient pas à se positionner seule de manière à voir correctement le tableau blanc. Caroline lui demande la permission de déplacer le Kubi : « Tu veux que je te tourne ou pas ? Je ne veux pas être impolie ». Christelle ne répond pas immédiatement, car elle est en train d’essayer de régler son interface « j’ai fait une bêtise, là, attends ».

Présence artefactuelle du Kubi

Christelle ne semble toujours pas arriver à voir ce qui s’écrit au tableau. Elle a une expression agacée, sourcils froncés, puis le Kubi commence à pivoter d’avant en arrière et de gauche à droite pendant presque une minute.

Ce renvoi peut se faire par exemple à travers une demande de permission de déplacement de l’artefact par une personne extérieure. Cette demande pointe en creux la présence interactionnelle potentielle, même si parfois l’artefact est tourné alors que la réponse à la demande de permission n’a pas été donnée par la pilote.

Ainsi, si autonomie de rotation il y a, encore doit-elle être prise en main et correspondre à la configuration à un moment et dans un espace donnés. Dans certains cas la présence artefactuelle semble s’imposer au premier plan.

Autonomie audiovisuelle

En plus des effets de mouvement, l’angle de vision s’avère être également un paramètre déterminant. Rappelons tout d’abord la complexité de la communication artefactuelle que nous allons présenter. En premier lieu, l’utilisatrice du Kubi doit effectuer un réglage qui lui permet d’ajuster la vue sur l’écran de son ordinateur. En deuxième lieu, la caméra au sein de la salle du séminaire qui diffuse l’image vers Adobe doit également être réglée de manière à produire un contenu visuel adapté. C’est la combinaison de ces deux actions qui permet à l’utilisatrice de se sentir partie prenante de la situation. En effet, si les participant·e·s en présentiel peuvent effectuer un balayage visuel, les participant·e·s artefacté·e·s distant·e·s ne voient pas toujours les remédiations techniques déployées dans la salle, par exemple, ou encore certaines actions tel que dessiner au tableau. Même si pour les besoins de l’exposé nous distinguons autonomie audiovisuelle et autonomie de mouvement, perception audiovisuelle et déplacements autonomes ou provoqués sont bien sûr interdépendants car si l’angle de vision est un frein à la félicité interactionnelle, alors la remédiation passe par un ajustement de position, en autonomie ou assisté.

Limitation du champ de vision et de la rotation du Kubi

Le champ de vision du Kubi est limité et doit être paramétré par la pilote, ce qui a des implications en termes de présence artefactuelle.

Limitation du champ de vision du Kubi

La séance 3, comme on l’a vu ci-dessus, est destinée à échanger les points de vue des participant·e·s sur la manière dont ils·elles se représentent mentalement le dispositif hybride artefacté.

Christelle, à distance dans le Kubi, explique son point de vue. Ensuite, Christine dessine au tableau blanc un schéma. Christelle ne voit pas cette action de Christine car elle est tournée vers les participant·e·s assis et non vers le tableau blanc sur lequel Christine est en train de dessiner. Christine propose à Christelle de regarder le schéma qu’elle vient de tracer : « Regarde là, est-ce que c’est ce genre de truc là que j’ai dessiné ? ». Christelle commence à se tourner. Christine la guide (« encore, encore »). Christine prend l’initiative de tourner le Kubi dans son ensemble (« voilà ») car Christelle est limitée dans son champ de vision, et arrivée au bout de ses possibilités d’orientation, comme on le voit sur la vidéo qui capture Christelle chez elle devant son interface de pilotage du Kubi.

Limitation de la rotation du Kubi

Ainsi, de manière temporaire, la présence interactionnelle de Christelle se limite à une présence artefactuelle, lorsque sa capacité de mouvement est médiée par un autre participant, en vue de lui rendre l’autonomie visuelle. Cependant, on notera que le déplacement opéré par un tiers est doté d’une intentionnalité interactionnelle, à l’inverse d’un cas de figure où on déplacerait le Kubi pour mettre un autre objet à sa place (livre ou tasse par exemple).

La présence interactionnelle implique par moments une présence artefactuelle ; c’est pour être ou devenir présent que l’on passe de manière transitoire par des moments de présence artefactuelle, lorsqu’on se fait aider par un·e autre participant·e, et qu’on est renvoyé·e momentanément, en tant que pilote, au statut d’objet.

Ajustement du champ de vision du Kubi

La limitation du champ de vision du Kubi prive la pilote de certaines interactions qui ont lieu à Lyon.

Exemple lors de la séance 3

Lors de la séance 3 pendant que Christelle fait ses ajustements de positionnement, Morgane va vers le Beam. Christelle manque cette action car elle est justement en train de réajuster son champ de vision à ce moment-là et ne voit pas les participant·e·s dans la salle du séminaire.

Figure 2 : Le dos du Kubi

Ajustement du champ de la caméra dans la salle du séminaire

La pilote du Kubi dépend de l’aide des participant·e·s à Lyon pour ajuster son angle de vision, ce qui vient tempérer son pouvoir interactionnel. À l’inverse, la pilote du Beam peut ajuster son champ de vision de manière autonome. Son agentivité semble plus grande de ce point de vue là.

La pilote du Kubi a besoin d’aide pour ajuster son angle de vision

Lors de cette même séance, Christelle (pilote du Kubi) demande à ce que les participant·e·s repositionnent la caméra qui, dans la salle du séminaire, envoie la vidéo vers Adobe Connect, car elle ne parvient pas à voir ce qui se passe dans la salle. Alors que Caroline se lève pour aller dessiner au tableau blanc, Christelle dit : « ça serait pas mal que la caméra soit sur l’écran là, [la caméra] d’Adobe, ce que je vois dans Adobe là, parce que sinon je vous vois vous ». En effet, à ce moment-là, la caméra qui diffuse les images sur Adobe Connect est dirigée vers les participant·e·s assis·e·s et non vers le tableau blanc. Au moment où Caroline se lève pour aller dessiner au tableau, Christelle affiche l’interface d’Adobe. Adobe affiche la même chose que l’interface du Kubi, les participant·e·s dans la salle à Lyon.

Autonomie comparée du Kubi et du Beam

La pilote du Beam est autonome dans l’ajustement de son champ de vision

Dans le même temps, Amélie, qui pilote le Beam, zoome et tourne de manière autonome vers le tableau blanc sans verbalisation. Les flèches bleues s’affichent lorsque l’utilisatrice tourne le robot.

Le « dos » du Beam

Même si la pilote du Beam peut le déplacer de manière autonome, il n’en reste pas moins que son champ de vision est limité en ce qui concerne ce qui se passe derrière l’artefact. Nos analyses de la vidéo mettent ceci en évidence et la pilote du Beam le confirme en entretien.

Extrait vidéo de la séance 2

On voit en effet que lors de la séance 2, lorsque les conférencier·e·s décident de rapprocher la table à laquelle il et elle sont installés du centre de la salle, les ajustements techniques menés par les participant·e·s à Lyon sont invisibles pour l’utilisatrice du Beam qui fait face aux conférencier·e·s et qui a les participant·e·s lyonnais dans son dos. Morgane, en charge du dispositif technique, échange un regard avec Samira en même temps qu’elle fait un geste de la main. Dorothée se lève, Morgane également. Elle réajuste la caméra de capture des données de recherche. Dorothée bouge la webcam. Morgane se rassied. Samira pointe la webcam. Simultanément à toutes ces actions, Amélie, aux commandes du Beam sourit aux conférencier·e·s. Puis Dorothée indique à Samira de déplacer la webcam qui diffuse le son et l’image à la distance. Samira se lève. Elle apparaît alors pendant une seconde dans le champ de vision d’Amélie (pilote du Beam). Celle-ci zoome sur les conférencier·e·s qui sont en train de reprendre la parole après cette interruption technique.

Le « dos » du Beam

Extrait d’entretien d’Amélie

Amélie se rend compte en visionnant les vidéos après coup qu’il y a pu avoir une activité « dans son dos » :

Si quelqu’un est derrière moi je ne vais pas le voir […], je pense à la dernière vidéo, au dernier séminaire de novembre, au moment où toi tu passes sous la table pour récupérer la caméra ou faire quelque chose, moi je me déplace [...] et moi je ne t’ai pas vue puisque tu étais derrière moi, enfin derrière le robot [...] je ne me suis pas dit ah y a quelqu’un qui est proche de moi où je peux potentiellement le percuter.

L’utilisatrice du Beam perçoit ainsi sa présence artefactuelle après coup et ne l’avait pas vécue de cette manière sur le moment.

Autour des enjeux d’émission et de réception, les choix effectués, comme par exemple le détournement du logiciel Adobe pour une utilisation hybride (un groupe dans une salle/des individus dans des lieux distincts), ont des conséquences sur la réception audio (par exemple les participant·e·s sur Adobe n’entendent pas les participant·e·s dans la salle) ou visuelle (par exemple les participant·e·s dans la salle distinguent mal les silhouettes à contre-jour des participant·e·s sur Adobe Connect). Ces différentes autonomies perceptives (de mouvement et audio-visuelles) influent sur les régimes d’interpellation et de participation nécessaires aux interactions que nous présentons ci-dessous.

Autonomie participative

Les choix techniques effectués et les potentialités de chaque dispositif ont en effet des incidences en termes de participation. Nous entendons par autonomie participative la régulation initiée par l’individu de son implication dans l’interaction.

Des enjeux de disponibilité à l’interpellation apparaissent notamment selon que l’artefact permet, en réception ou en émission, de participer à l’interaction.

Difficulté d’interpellation du Beam

Il semble plus facile pour les participant·e·s d’interpeller les utilisatrices d’Adobe que la pilote du Beam. Morgane explique en entretien qu’elle a tenté à plusieurs reprises et à travers plusieurs canaux (signes, chat, email, SMS) d’interpeller Amélie, en tant que pilote du Beam, sans succès.

Extrait d’entretien de Jean-François

Jean-François pointe également en entretien cette difficulté en comparant les dispositifs :

Je trouve que c’est plus facile à gérer avec Adobe Connect parce qu’on a plus de moyens discrets de se prévenir alors qu’avec toi [Amélie dans le Beam] ça peut être assez violent [...] on est obligé de t’interpeller [...] c’est moins discret et c’est parce que tu nous vois pas qu’on est obligé de t’interpeller par la voix et de parler fort. Si tu nous voyais ça pourrait être un petit signe un petit chat.

Difficulté d’émettre un signal visuel fort dans le Kubi ou dans Adobe

Il peut aussi être difficile de prendre la parole pour l’utilisateur·rice du Kubi ou d’Adobe. Dans le Kubi, à moins de prendre la parole directement en imposant sa voix, on ne peut pas interpeller le reste du groupe.

Difficulté de prendre la parole dans le Kubi

Lors de la séance 3, Christelle ébauche le geste de lever le doigt en disant « non », en réponse à l’intervention que Jean-François vient de faire. Puis elle relève le doigt et attend cette fois qu’on lui donne la parole. Comme cette permission ne vient pas, elle prend la parole. Son impatience transparaît dans le fait qu’elle baisse et lève plusieurs fois le doigt et qu’elle tord sa bouche. Ce signal reste faible par rapport à l’interaction en cours dans le dispositif tel qu’il est agencé à ce moment-là. Il n’est perceptible ni de la pilote du Beam, ni des participant·e·s dans Adobe Connect et n’est perçu par les participant·e·s dans la salle qu’après un certain délai.

Échec d’un signal faible dans le Kubi

Dans le chat d’Adobe, il est tout aussi complexe d’émettre un signal fort.

Difficulté d’émettre un signal fort dans le chat d’Adobe Connect

Il en est de même pour le signal envoyé par Tatiana dans Adobe Connect. Lors de la séance 3, Tatiana souhaite intervenir et écrit dans le chat. Christelle relaie cette intervention.

Christelle : « Tatiana parle. »
Christine : « Qu’est-ce qu’elle dit Tatiana ? »
Christelle : « Elle écrit, regardez. »
Morgane lit ce que Tatiana a écrit dans le chat d’Adobe.

Christelle exhorte ainsi les participant·e·s dans la salle à prendre en compte toutes les modalités inhérentes aux dispositifs.

Échec d’un signal faible dans Adobe

Plus largement, on peut ainsi se demander si la participation à l’interaction est soumise à des régimes que l’on pourrait qualifier d’artefactuels, au sens où ils sont tributaires de l’artefact ou du dispositif de téléprésence utilisé.

Le chat comme espace de communication autonome ou relayée

Toujours du point de vue de l’autonomie participative, nous voyons dans cette section que l’espace de communication du chat est ambivalent, en ce qu’il permet parfois la participation à l’interaction globale, non pas de manière autonome, mais par le truchement des participant·e·s en présentiel, et parfois engendre un espace à part de communication autonome.

Les participant·e·s sur Adobe Connect ont tous accès au chat. Certain·e·s participant·e·s dans la salle sont également connecté·e·s sur Adobe et ont accès au chat, qui est projeté, mais malgré cela le contenu du chat doit parfois être relayéCf. chapitre « Affordances attentionnelles dans un séminaire instrumenté ».↩︎.

Le contenu du chat doit être relayé

Dans la séance 3, Christelle, longtemps utilisatrice d’Adobe Connect, mais dans le Kubi ce jour-là, signale que Tatiana a écrit dans le chat, suite à quoi Morgane lit à voix haute aux participant·e·s à Lyon ce que Tatiana vient d’écrire. Ainsi, dans ce cas, le chat participe de l’interaction groupale globale grâce au relais des participant·e·s.

L’aspect social du chat est ainsi pointé en entretien par de nombreux membres de l’équipe.

Aspect social du chat

Christelle indique que pour elle, utilisatrice tour à tour du Beam, du Kubi et d’Adobe Connect, la solitude est moins grande dans Adobe Connect grâce au chat :

Il n’y avait pas tant de personnes qui venaient me parler quand j’étais en Kubi ou en robot, alors que par Adobe je tchatais un peu avec Tatiana ou Samira, [...] l’aspect social je n’en ai pas tellement bénéficié, parce que les gens ne venaient pas forcément plus te parler [...], on est seul quoi, ça c’est clair.

Amélie, pilote du Beam, indique en entretien que l’espace de communication créé par le chat lui est au contraire difficilement accessible (à moins de manipuler simultanément et l’interface du Beam et celle d’Adobe). Jean-François et Samira relèvent quant à eux des aspects de cloisonnement autour du chat.

Effets de cloisonnement du chat

Amélie, pilote du Beam, souligne que l’espace de communication créé par le chat lui est difficilement accessible :

Il peut y avoir des interactions entre moi et vous les présents, entre ceux d’Adobe et vous, mais entre ceux d’Adobe et moi en fait, y a pas d’interaction.

Jean-François évoque également (dans les premières séances du séminaire) un déficit de connivence avec les personnes présentes par Adobe Connect.

Samira va plus loin lorsqu’elle relate des phénomènes similaires avec l’utilisation de Google Hangouts, dans une phase précédente du séminaire, en parlant de communauté à part.

Morgane me mettait parfois face au mur [...] pour que l’on voie le PowerPoint et du coup toutes les autres personnes de la salle qui sont assises à une table ovale se trouvaient derrière moi, derrière mon écran, donc je n’avais aucune perception des gens qui étaient là [parfois] c’était fini on était passé à autre chose mais nous on était quand même toujours face au mur, en plus la connexion disparaît au bout d’un moment donc on est face à un écran bleu, à un mur bleu et on entend les gens parler derrière, [...] ce qui est bien dans ces moments-là, c’est que étant donné que j’ai souvent été avec Christelle, on peut interagir ensemble et du coup on se sent moins seules, parce que sinon on se sentirait très seules [...] et du coup ça crée une connivence, une espèce de communauté à part dans ces moments-là, on en rit généralement [...].

Ce sentiment de « communauté à part » se trouve peut-être renforcé à ce moment-là par le fait que le chat est renvoyé vers la clandestinité par un SMS de Christine.

Je me souviens justement d’une séance où en fait je crois que ça dérangeait un petit peu que Christelle et moi nous échangions un peu trop sur le chat parce qu’on n’avait pas désactivé la petite sonnerie quand il y a un message [...] Christine a envoyé un SMS à Christelle pour lui demander justement d’essayer d’arrêter d’interagir comme ça par chat [...] on n’a pas arrêté mais [...] j’ai désactivé le son.

Le chat est parfois un espace d’échanges autonomes, dont les participant·e·s ne cherchent plus le relais vers l’interaction groupale globale.

Autonomie du chat

L’aspect de sous-communauté autour du chat apparaît dans l’exemple suivant, lors de la séance 2. En effet, les participant·e·s sur Adobe Connect entendent très mal les échanges dans la salle comme le signale Prisca sur le chat. Un échange a alors lieu sur le chat d’Adobe Connect autour de la grammaire, qui apparaît comme sans rapport avec les échanges ayant lieu en présentiel.

Christelle : « Sans connaissances linguistiques solides il est inutile de ... »
Christelle : « Je pense qu’il veut dire qu’il faut d’abord maîtriser la grammaire. »
Christelle : « avant de parler. »
Liping : « pour nous, normalement, on commence une leçon par la grammaire, et je expliques le vocabulaire, puis ; les textes et les exercices. »

En termes de participation à l’interaction, du point de vue de l’autonomie et de l’intention, nous exposons également ci-dessous des contraintes ou des injonctions en lien avec la présence à l’écran, l’obligation de penser au cadrage pour autrui, ou encore l’hyper-exposition lors des prises de parole.

Sur-ratification et hyper-exposition

En nous fondant sur le concept de ratification (Goffman 1981), nous analysons des exemples de ce que nous appelons sur-ratification : une ratification exposée et indésirable du point de vue des participant·e·s distant·e·sCf. chapitre « Ménager les faces par écran : vers de nouvelles règles de politesse ».↩︎ ; et de ce que nous appelons hyper-exposition, c’est-à-dire, l’occupation d’un tour de parole en dépit de la volonté de l’individu concerné.

Sur-ratification

Lors de la séance 1, Christine donne la parole aux participantes à distance : « on va peut-être donner la parole à la distance aussi. Vous avez des choses à dire ?». Cette question est suivie d’un silence de 5 secondes. Puis, elle renchérit : « non ?… AmélieTatiana… ».

Si l’on reprend le concept de Goffman (1981) définit ci-dessus, on peut considérer qu’on est ici dans une sur-ratification.

Sur-ratification des participant·e·s à distance

Amélie est exposée par une sollicitation non voulue

En entretien, Amélie fait allusion au fait d’être exposée par une sollicitation à prendre la parole :

En fait quand on me dit « à distance est-ce que vous avez un truc à dire », quand j’ai rien à dire ça m’embarrasse un peu [...] y a des gens qui sont en présentiel et qui ne participent pas on leur dit pas “eh toi tu n’as pas un truc à dire” et moi dans le robot je suis vraiment toute seule et ça m’expose beaucoup plus [...] si on dit « dans Adobe vous n’avez pas quelque chose à dire » ils sont trois ou quatre mais moi je suis obligée de dire “non j’ai rien à dire”, ça me gêne un peu, ça expose plus ma face en tout cas.

L’exposition indésirable est parfois une hyper-exposition sonore incidente, qui occupe un tour de parole en dépit de la volonté de l’individu concerné. Ainsi lorsque l’utilisatrice du Beam éternue chez elleCf. chapitres « Ménager les faces par écran : vers de nouvelles règles de politesse » et « Intercorporéité artefactée, entre réification et personnification ».↩︎, en raison de l’anisotropie de l’espace médié, elle ne se rend pas compte que l’effet sonore est décuplé dans la salle.

Amélie éternue dans le Beam

La participante commente l’épisode ainsi :

J’ai pas eu la sensation d’éternuer aussi fort et que ça ait un impact dans la salle aussi fort je ne m’en suis même pas rendu compte de ça, [...] par contre j’ai compris quand j’ai visionné la vidéo du séminaire, je me suis rendu compte de l’impact que ça a eu.

Hypo-exposition volontaire

L’anisotropie de l’espace médié (Gaver 1992, 234), c’est-à-dire le fait qu’il présente différentes caractéristiques selon l’orientation, permet d’épier autrui, ou d’être présent·e artefactuellement tout en étant absent·e, ou au contraire « d’arriver » de façon inaperçue par les participant·e·s dans la salle.

Amélie arrive sans qu’on s’en rende compte

Amélie, pilote du Beam, mentionne ces aspects en entretien :

C’est un peu bizarre ce premier instant parce que en fait c’est comme une intrusion mais une intrusion secrète discrète, c’est pas pour moi que c’est une intrusion, c’est pour les autres, le robot est censé être connecté donc ça veut dire potentiellement à n’importe quel moment moi je peux arriver sans que personne ne s’en rende compte, s’ils ne regardent pas vers le robot ils ne me voient pas à l’écran, donc si je me connecte et je ne me déplace pas ou je ne parle pas, potentiellement les gens ne se rendent pas forcément compte que je suis arrivée et dès que je me déplace, là voilà ça signale ma présence.

La fonction « zoom » du Beam en particulier permet une présence furtiveNous entendons furtif au sens militaire d’un appareil conçu pour éviter sa détection en utilisant une variété de technologies qui réduisent sa signature.↩︎, à l’insu des autres participant·e·s.

Christelle utilise le zoom du Beam de façon furtive

Christelle explique en entretien comment elle utilise cette fonction « zoom » :

Je me suis sentie l’homme qui valait trois milliards, j’avais une vue bionique c’est-à-dire que l’air de rien, sans rien dire, sans rien toucher, tout à coup je me rapprochais, je voyais très très bien des choses que je pouvais ne pas voir dans la vie réelle, donc c’était très excitant, [...] je me suis dit ben tiens c’est ça d’être un robot finalement, j’ai une vue démultipliée et je peux avoir accès un peu comme Big Brother, à quelque chose que je ne pourrais pas voir dans la vie réelle [...] et c’est de manière très insidieuse parce que celui qui n’a pas été là-dedans il ne sait pas, il n’imagine même pas [...] Christine m’embête tout le temps sur le fait que je regarde mon téléphone et en fait Christine n’arrêtait pas de tchater sur son téléphone, je n’ai pas pu m’empêcher, j’ai zoomé [...] en fait en zoomant, moi j’étais quasiment dans leur conversation, c’est comme si je les voyais de très près, alors que moi du coup j’étais très loin pour eux, et il y a vraiment un côté intrusif, enfin pour le coup ça fait vraiment le robot Big Brother, parce que si tu restes derrière ton écran, comme ça, t’es loin, les personnes ne vont pas imaginer que tu peux entendre.

Elle fait ainsi la distinction entre « le fait de s’approcher comme ça et d’avoir l’impression que l’on va les écraser et le fait de zoomer et d’être là sans qu’ils aient l’impression que l’on soit là ».

Or si le déplacement du robot est impressionnant, son immobilité n’est pas non plus synonyme d’inactivité, même si les participant·e·s dans la salle ne s’en rendent pas compte.

Amélie est sceptique sur la fonctionnalité de zoom

Amélie est plus sceptique que Christelle sur la fonctionnalité de zoom du Beam:

Je dois pas trop l’utiliser je pense [...] comme les interactions mine de rien c’est quand même assez rapide [...] est-ce que ça vaut le coup que je focalise sur une personne qui est en train de parler, faudrait que j’essaye en fait, pour voir, et ensuite il faut que je dézoome, je préfère avoir une vue globale, je pense, de trois quatre personnes.

D’une manière générale, les affordances semblent se négocier en prenant en compte un ensemble de paramètres, tels que, dans ce cas, la lenteur des ajustements du Beam.

Nous avons pu voir à travers cette étude que les effets de présence liés à chaque dispositif définissent une présence artefactuelle ou une présence interactionnelle, en fonction de la co-construction interactionnelle mise en œuvre par les participant·e·s. Ce sont les enjeux d’autonomie de mouvement et d’ajustement visuel et sonore qui déterminent le statut objectal ou interactionnel de l’utilisateur·rice et du dispositif utilisé.

La dualité entre objectal et interactionnel ne présume pas de la félicité interactionnelle puisque la présence artefactuelle, en ce qu’elle permet la discrétion, correspond parfois à l’intention de l’utilisateur·rice, tout comme la présence interactionnelle, en ce qu’elle donne parfois lieu à une sur-ratification, va parfois à l’encontre de l’intention de l’utilisateur·rice. La présence artefactuelle peut être subie (par exemple le Beam est déplacé pendant la pause et quand la pilote se reconnecte il n’a plus de repères) ou mise à profit (par exemple la pilote du Beam utilise la fonction zoom discrètement alors que les participant·e·s dans la salle ne savent pas que la pilote est connectée, ou le déplacement par autrui facilite l’interaction). De même, la présence interactionnelle peut être subie (par exemple la parole est donnée explicitement aux participantes à distance alors qu’elles n’ont rien de particulier à dire à ce moment-là) ou mise à profit (par exemple lorsqu’une demande sur le chat est relayée dans la salle à l’oral).

Au terme de cette analyse, nous proposons le tableau synthétique suivant :

Présence artefactuelle Présence interactionnelle
Subie Déplacement inapproprié par autrui Sur-ratification
Mise à profit Déplacement par autrui à intention interactionnelle Contribution sur le chat relayée à l’oral in situ

Au-delà d’une analyse centrée autour des caractéristiques des dispositifs de téléprésence utilisés, il apparaît que c’est dans les intentions de chacun·e et leur interprétation que se jouent les régulations autour des régimes d’autonomie qui permettent de co-construire l’interaction en contexte hybride polyartefacté, dans une communauté artefacto-interactionnelle.

Références
Egido, Carmen. 1990. « Teleconferencing as a technology to support cooperative work : Its possibilities and limitations ». In Intellectual teamwork: social and technological foundations of cooperative work, édité par Jolene Rae Galegher, Robert E. Kraut, et Carmen Egido, 351‑71. Hillsdale, N.J: L. Erlbaum Associates.
Gabillon, Bernard. 2019. « Tentations design ». In Design en regards, édité par David Bihanic, 222‑43. Art Book Magazine Distribution.
Gaver, William W. 1992. « The affordances of media spaces for collaboration ». Proc. CSCW 1992, ACM Press, 17‑24. https://doi.org/10.1145/143457.371596.
Goffman, Erving. 1981. Forms of talk. University of Pennsylvania publications in conduct et communication. Philadelphia: University of Pennsylvania Press. https://www.upenn.edu/pennpress/book/715.html.
Herring, Susan C. 2013. « Telepresence robots for academics ». Proceedings of the American Society for Information Science and Technology 50 (1): 1‑4. https://doi.org/10.1002/meet.14505001156.
Neustaedter, Carman, Gina Venolia, Jason Procyk, et Dan Hawkins. 2016. « To Beam or Not to Beam: A Study of Remote Telepresence Attendance at an Academic Conference ». In Proceedings of the 19th ACM Conference on Computer-Supported Cooperative Work & Social Computing, 417‑30. ACM. https://doi.org/10.1145/2818048.2819922.
Sirkin, David, Gina Venolia, John Tang, George Robertson, Taemie Kim, Kori Inkpen, Mara Sedlins, Bongshin Lee, et Mike Sinclair. 2011. « Motion and Attention in a Kinetic Videoconferencing Proxy ». In Human-Computer InteractionINTERACT 2011, édité par Pedro Campos, Nicholas Graham, Joaquim Jorge, Nuno Nunes, Philippe Palanque, et Marco Winckler, 162‑80. Lecture Notes in Computer Science. Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-642-23774-4_16.
Takayama, Leila, et Janet Go. 2012. « Mixing metaphors in mobile remote presence ». In, 495‑504. ACM. https://doi.org/10.1145/2145204.2145281.
Takayama, Leila, et Helen Harris. 2013. « Presentation of (telepresent) self: On the double-edged effects of mirrors ». In, 381‑88. IEEE Press. https://doi.org/10.1109/HRI.2013.6483613.