Fabrique de l'interaction parmi les écrans

Affordances attentionnelles

Affordances attentionnelles dans un séminaire instrumenté

Mabrouka El Hachani

Jean-François Grassin

Joséphine Rémon

Caroline Vincent

Mabrouka El Hachani, Jean-François Grassin, Joséphine Rémon, Caroline Vincent, « Affordances attentionnelles dans un séminaire instrumenté », Fabrique de l’interaction parmi les écrans : formes de présences en recherche et en formation (édition augmentée), Les Ateliers de [sens public], Montréal, isbn:978-2-924925-13-3, http://ateliers.sens-public.org/.
version , 15/06/2021
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

Nous envisageons le séminaire à travers une étude de corpus, comme un double dispositif attentionnel, dans sa construction matérielle de l’espace et dans sa construction relationnelle. Nous cherchons à qualifier, dans ce cadre, l’attention en co-construction.

Construction matérielle et relationnelle

Dans la construction matérielle de l’espace, les objets se (re)disposent pour l’attention, dans un corps-à-corps appareillé, c’est-à-dire dans une médiation des corps à travers des artefacts et des dispositifs de téléprésence dans un espace médié (media space) (Gaver 1992). La construction de ce dispositif attentionnel se fait au sein d’un espace exploratoire dans le contexte de l’utilisation de technologies émergentes (robot de téléprésence) avec des utilisations non stabilisées. Ainsi, il est possible d’observer une instrumentation en cours à travers des structures technologiques émergentes et pas encore incorporées. Nous analysons ainsi, à titre d’illustration, comment la pilote du robot Beam trouve sa place, à travers ses déplacements mais aussi à travers les discours sur la place du sujet et de l’objet vu comme outil de capacitation.

Dans sa construction relationnelle, le séminaire est le lieu de rôles (assistance technique, orchestration des échanges, régulationCf. chapitre « Intercorporéité artefactée, entre réification et personnification ».↩︎) attribués tour à tour par le dispositif technologique ou par les sujets, avec pour contexte un certain horizon d’attente : le séminaire comme réalité sociale préformée par des normes, des représentations, des microrituels sociaux. Nous analysons comment l’appareillage technologique modifie ces attentes et ces habitus, au cours d’une construction dont nous mettons en lumière les moments, autour d’un agir qui impose de coopérer et d’une coopération qui impose d’agir. En effet, l’action des participant·e·s est procurée réciproquement par chacun·e, les actions coopératives des un·e·s permettant aux autres d’agir et vice versa.

Notre question de recherche porte sur la qualification de l’attention dans un séminaire doctoral hybride polyartefacté. Comment cette attention est-elle co-construite et comment reconnaît-on les phénomènes attentionnels dans un contexte où ses manifestations sont tributaires de l’artefaction ?

Nous abordons ci-dessous les notions qui ont éclairé notre approche de l’attention dans une perspective écologique : le cadrage attentionnel, les différents modes de l’attention conjointe, les gestes et signes attentionnels, la technogénèse de l’attention et les affordances attentionnelles.

Cadre théorique

Le but de ce chapitre est d’observer et de comprendre « l’imprégnation digitale » de notre attention, c’est-à-dire la manière dont le contexte polyartefacté requalifie l’attention dans une situation spécifique d’attention conjointe et de collaborationPour une exploration des processus de collaboration à l’œuvre, voir le chapitre « Former à la recherche dans un séminaire doctoral polyartefacté ».↩︎. La situation implique la présence de personnes à distance qui complexifie les régimes attentionnels. Notre perspective écologique de l’attention sera une microéconomieC’est-à-dire envisagée à l’échelle de l’activité située.↩︎ de l’attention conjointe (Citton 2014) : des régimes attentionnels collectifs, artefactés et transindividuels.

Le cadre théorique de notre analyse est à la croisée de l’analyse phénoménologique (Depraz 2014 ; Livet 2016) et des théories des interactions artefactées (Arminen, Licoppe, et Spagnolli 2016). La situation qui nous intéresse, celle d’un séminaire de recherche, touche l’analyse des situations professionnelles (workplace studies) et celles des situations de formation. Nous inscrivons notre réflexion dans une perspective qui relève cependant plus d’une analyse phénoménologique, notamment de l’attention et des affordances émergeant dans la situation, que d’une analyse de l’activité dans toutes ses dimensions.

La situation que nous étudions est une réunion de travail dans laquelle les artefacts prennent une place organisationnelle importante. Notre analyse est située mais nous paraît pouvoir servir à la compréhension globale d’un monde où nous sommes pris, de plus en plus, dans « des réseaux étroitement imbriqués d’attentions entrecroisées » (Citton 2014, 127) et où la place des artefacts dans les interactions augmente, impliquant une accélération de la variabilité des capacités attentionnelles, l’attention étant par ailleurs « une dimension intime de notre humanité » (Depraz 2014).

Définition de l’attention

L’attention est une relation à des objets d’attention (Citton 2016) qui sont ici ceux d’un séminaire doctoral, auxquels s’ajoutent, de manière spécifique, les aspects matériels et artefactuels de l’hybridité (présentiel/distanciel) et les aspects réflexifs de la démarche scientifique (le séminaire est l’objet de la recherche même).

L’attention est la résultante d’opérations de filtrations matérielles, sociales et symboliques, un processus de constitution de certains objets comme objets d’attention. Dans notre perspective, ces objets, tels que le dispositif de téléprésence Beam, nous intéressent dans la situation attentionnelle elle-même en tant qu’objets affordant l’« étant ensemble de la co-présence » (Giddens 2005, 171) permettant l’activité commune. Il ne s’agit pas d’étudier les usages d’artefacts visuels indépendamment du processus d’interaction et des pratiques de travail qui les rendent pertinents et dotés de signification (Bonu 2007, 32).

La perspective que nous adoptons est en ce sens résolument écologique, supplémentant une conception de l’attention focalisée sur des objets par une attention sensible à des environnements. Pour le dire autrement, c’est dans un environnement précis que l’objet prend un sens pour les acteur·rice·s et c’est ce sens qu’ils·elles lui donnent qui permet d’y porter attention. Le point de vue phénoménologique fait de l’attention « une expérience d’ouverture au monde plus qu’un état mental interne » (Depraz 2014).

La situation artefactée qui nous occupe ne change pas ontologiquement l’attention, mais la multiplicité des supports possibles de cette attention complexifie les « accordages affectifs et attentionnels » (Citton 2014) qu’exige l’activité conjointe attendue lors d’un séminaire de recherche : écouter des conférencier·e·s (séances 2 et 4), présenter soi-même un travail au groupe (séances 1 et 5), s’engager ensemble dans des discussions scientifiques (toutes les séances) font partie des activités dont les scripts sont relativement connus et attendus des participant·e·s.

Cadrage attentionnel

Notre cadrage attentionnel est donc une situation de collaboration qui suppose une attention conjointe. Natalie Depraz définit l’attention conjointe comme « un cas structurel de relation à autrui via un objet qui est l’aliment tangible de la relation entre deux sujets, qui construit l’intersubjectivité » (Depraz 2014, 410).

Attention conjointe

C’est une situation de co-attention présentielle entendue comme « caractérisée par le fait que plusieurs personnes, conscientes de la présence d’autrui, interagissent en temps réel en fonction de ce qu’elles perçoivent de l’attention des autres participants » (Citton 2014, 127), où la présence est avant tout temporelle et sensible (plus que strictement spatiale et physique). Ainsi, au titre de l’attention conjointe on s’intéresse à « la façon dont un individu donné est affecté par sa perception des comportements attentionnés d’autres individus dont il partage la présence sensorielle » (Citton 2016, 162).

L’attention conjointe ou co-attention telle que définie par Yves Citton est sous-tendue par trois principes que nous reprenons dans la suite de ce chapitre afin de déterminer dans quelle mesure les artefacts de téléprésence les modifient :

  1. Tout d’abord, la co-attention répond au principe de réciprocité, c’est-à-dire une circulation bidirectionnelle de l’attention. La réciprocité des perspectives (Goffman 2013 ; Kendon 1990) met en jeu un rapport d’observabilité mutuelle, nécessaire à ce type d’interactions focalisées. Il faut ainsi que les sujets aient une conscience mutuelle de l’attention des autres au même objet.

  2. Le principe de l’« accordage affectif » est une des conditions de félicité de toute interaction et est fait de microgestes empathiques.

  3. Enfin, le troisième principe noté par Citton, qui découle du second, est le principe d’improvisation, étant donné que l’accordage affectif ne peut se routiniser et dépend des affects de chacun·e des acteur·rice·s.

La co-attention ou attention conjointe nécessite de constants retours attentionnels : pour recevoir de l’attention, il faut prêter attention.

Les différents modes de l’attention conjointe

Depraz détermine trois modes d’articulation vécue entre attention et intersubjectivité, trois formes de co-attentionnalité que nous reprenons ici et illustrons d’exemples : l’attention intersubjective, l’intersubjectivité attentionnelle et l’interattention.

Attention intersubjective

Le premier mode de co-attention est l’attention intersubjective qui est le sens le plus répandu de l’attention conjointe. L’accent est porté sur l’objet comme base structurant la relation entre sujets ; cet objet peut être la situation elle-même, un discours et son support matériel. Dans cette forme, la conscience de co-présence entre les sujets est assez minimale. C’est une forme minimale d’attention conjointe dans laquelle la relation des sujets passe par l’objet, et les relations interpersonnelles passent à l’arrière-plan.

Dans le cas du séminaire, il s’agira par exemple d’être collectivement attentif aux conférencier·e·s et le regard porté sur la présentation projetée.

Intersubjectivité attentionnelle

Le deuxième mode de co-attention est ce que Depraz (2014) nomme « intersubjectivité attentionnelle ». L’intersubjectivité attentionnelle implique que c’est la qualité du vécu qui est la cible ; la relation entre sujets prime.

C’est la qualité du vécu attentionnel qui fait l’objet d’un partage, d’une direction commune de l’intérêt (Depraz 2014, 410).

Il y a disparition de l’objet au profit d’une communauté de présence alimentée par la relation à soi.

C’est le régime attentionnel lui-même qui est devenu l’objet-tiers, mais il n’a pas le statut d’objet externe (Depraz 2014, 410).

Dans le cas du séminaire, ce sera par exemple lorsque nous cherchons à nous assurer de la qualité de présence (notamment du confort de l’écoute) des personnes à distance.

Interattention

Le concept d’interattention articule le concept de joint attention et celui de mutual awareness, un « mode d’attention singulier à l’autre au moment où celui-ci porte son attention sur l’objet sur lequel je porte moi aussi, au même moment, mon attention » (Depraz 2014, 402).

Selon Depraz, « l’attention conjointe n’est pas d’abord une attention commune à un objet visé, mais une attention partagée dont la structure conjonctive tient à la dynamique relationnelle » (Depraz 2014, 399).

Le concept d’interattention intègre une dimension de qualité de co-présence, soulignant la corrélation des mouvements attentionnels des deux sujets, leur réciprocité. Dans le séminaire qui nous préoccupe, nous pouvons porter attention à l’orientation du dispositif de téléprésence Kubi, au moment où la pilote du Kubi elle-même est en train d’essayer de l’orienter, tout en communiquant sur cette tentative. Nous illustrerons ce phénomène dans la suite des analyses.

L’attention conjointe comme expérience n’est pas homogène : elle peut être émotionnelle, rationnelle, complexe. Elle relève d’un « mode de présence à » autrui, une situation, un événement. Les pratiques attentionnelles vont dépendre de différentes confrontations, multipliant leurs fragilités : à l’environnement, à la situation, à l’activité, aux personnes, aux artefacts et aux supports convoqués.

Schéma des modes de co-attention

Le schéma suivant tente une représentation des modes de co-attention qui nous semblent pertinents au sein du séminaire.

Figure 1 : modes de co-attention au sein du séminaire

L’objet de l’attention conjointe est représenté au centre du dispositif attentionnel, mais ne se superpose pas avec un centre hypothétique du dispositif technique en lui-même ; l’interattention est représentée par les flèches entre les individus ; l’attention aux conditions de possibilité de l’attention sont représentées par les flèches dirigées vers le cercle extérieur, c’est-à-dire le dispositif hybride dans son ensemble. Si le schéma montre l’objet du séminaire (par exemple une conférence) comme objet de l’attention conjointe, ce sera au contraire parfois les conditions de possibilité de l’interaction (par exemple l’ajustement du son) qui deviendront l’objet de l’attention conjointe.

Au sein du séminaire, les modes de co-attention se déclinent au sein d’un espace d’organisation spécifique que nous analysons ci-dessous.

Le séminaire comme espace d’organisation attentionnelle : gestes et signes attentionnels

Nous entendons le séminaire comme une forme de cadrage organisationnel de l’attention dans lequel :

individuellement et collectivement, les individus s’engagent dans un processus dynamique d’orientation de l’attention, de construction de sens et d’élaboration de réponses adéquates (Rouby et Thomas 2014, 43).

Il s’agit d’un système de traitement attentionnel distribué (system of distributed attentional processing) (Ocasio 2011, 1290) et différents types de comportements (sélection de signaux, interprétation, action) sont possibles.

Pour analyser les cadres attentionnels qui nous intéressent, nous avons besoin d’outils heuristiques. L’attention n’est en effet pas un concept unitaire mais une variété de processus interreliés que nous détaillons ici. William Ocasio (2011) différencie trois formes de processus : une perspective attentionnelle, un engagement attentionnel, une sélection attentionnelle.

Perspective attentionnelle, individuelle ou collective

Cette perspective attentionnelle (attentional perspective) est façonnée par l’expérience et par les rôles attentionnels attribués dans la situation.

Perspective attentionnelle

C’est une orientation de l’attention qui implique une conscientisation élevée et qui est structurellement liée à l’organisation et aux buts de l’activité.

Dans un entretien, une des participantes explique la perspective attentionnelle qu’elle se choisit (« Je vais avoir tendance à me battre jusqu’au bout, quitte à ne rien écouter à la conférence, pour les participantes à distance »), tout en ayant conscience que d’autres perspectives existent (« Dans notre séminaire chacun a des rôles on a des casquettes qu’on le veuille ou non donc Christine, son but, c’est de faire avancer le séminaire »).

Mais ces perspectives ne sont pas exclusives et leur pluralité n’est pas ignorée des autres. Ainsi, elle explique qu’une négociation se fait de manière située mais aussi dans le temps : initialement, lorsque Adobe ne fonctionnait plus, Christine disait « bon là Morgane, on avance ! », et Morgane se demandait si elle devait « privilégier les problèmes techniques » quitte à « impacter sur l’avancement du séminaire », ou alors se dire « tant pis, on fait sans eux », sans les personnes à distance. Au fur et à mesure du déroulement des semaines, « la qualité de présence des participants est devenue une priorité », jusqu’à « ne pas débuter le séminaire exprès pour régler le problème avec Adobe ».

Extrait d’entretien de Morgane

Lors du dernier séminaire, Adobe ne fonctionnait plus et nous avions des participantes sur Adobe et donc nous ne pouvions pas débuter la conférence de Jacques Rodet et donc Christine me disait : bon là Morgane on avance. Dans cette situation-là on se demande si on doit privilégier les problèmes techniques, sauf qu’il y a un moment où les problèmes techniques impactent sur l’avancement du séminaire donc parfois ils avaient lieu au début du séminaire donc on se disait bon tant pis, on fait sans eux tandis que là on a vraiment pris au fur et à mesure des séminaires la qualité de présence des participantes à distance et c’est vraiment devenu une priorité et là lors de ce dernier séminaire on n’a pas débuté ce séminaire exprès pour régler le problème avec Adobe. Sur le coup j’ai vraiment apprécié que Christine dise bon okay on attend un petit peu pour régler le problème et pour lancer la conférence après.

Source

Elle détermine notamment la prise ou non prise en compte des marqueurs attentionnels posés par les participant·e·s. Ainsi, si la perspective attentionnelle choisie est orientée vers la gestion technique, alors les alertes dans ce domaine seront relevées et traitées en priorité.

Engagement attentionnel

L’engagement attentionnel est un processus d’allocation de l’attention, intentionnel et soutenu, pour régler un problème et donner du sens à la situation.

Vigilance, négligence, cécité et flexibilité attentionnelles

Il implique une vigilance attentionnelle, c’est-à-dire, pour Ocasio, le processus par lequel les individus maintiennent leur concentration sur un ensemble de stimuli particuliers. La notion de vigilance, forme de base de l’attention, est un mode d’attention non focalisée, « la vigilance est ainsi un mode de conscience, non pas à l’objet, mais au monde lui-même » (Depraz 2016, 73).

Pierre Livet (2016) propose un couplage entre vigilances et négligences qu’il met au pluriel, parce que ce sont pour lui des modes attentionnels. La négligence est attentionnelle car elle ne tient pas à l’inattention mais à l’attention :

On est vigilant sur ce qui est pertinent pour la tâche en cours, et négligent pour ce qui n’est pas pertinent pour la tâche en cours. […] L’attention est aussi sensible à un « ensemble attentionnel », l’ensemble des traits pertinents auxquels le participant est disposé à réagir (Livet 2016, 85).

Dans cette perspective, l’attentional blindness (cécité attentionnelle) tient à ce que des stimuli sont trop faibles pour attirer l’attention (Kanai, Walsh, et Tseng 2010). Ainsi, dans certains cas, certains signes de présence sont peu repérés, par exemple le chat dans l’interface de visioconférence est parfois invisible aux yeux des participant·e·s dans la salle de séminaire. Au contraire, l’inattentional blindness (négligence attentionnelle) implique que les stimuli soient très perceptibles et susceptibles d’attirer l’attention. Dans certains autres cas, les participant·e·s négligent volontairement un signe faible de présence, par exemple une image figée dans Adobe, afin que l’action principale puisse se poursuivre.

Par ailleurs, les individus s’engagent différemment dans l’action, cherchant une stabilité à travers des routines d’action, ou au contraire dans une flexibilité attentionnelle qui « renvoie à la prise d’initiatives décentralisées et à des pratiques inventées localement dans le suivi et le traitement des indicateurs » (Rouby et Thomas 2014, 6), une executive attention qui

guide la cognition et l’action lorsqu’il n’y a pas de schéma prédéterminé pour atteindre les objectifs ou les exigences des tâches ou lorsqu’il y a conflit entre les objectifs, comme dans le cas de situations nouvelles ou d’activités non courantes (Ocasio 2011, 1287).

Dans le cas du séminaire, l’engagement attentionnel se manifeste par la procuration de présence constamment renouvelée des un·e·s par les autres à travers les dispositifs numériques disponibles (guider le Beam, faire pivoter le Kubi, activer un micro, projeter au mur, etc.). Cet engagement attentionnel prend des formes multiples, dans une flexibilité attentionnelle, telle que définie par Évelyne Rouby et Catherine Thomas (2014).

Sélection attentionnelle

Le terme de sélection attentionnelle (selective attention) désigne le processus par lequel les individus orientent le traitement de l’information sur un ensemble spécifique de stimuli sensoriels à un moment donné.

Perspective et engagement attentionnels

Cette attention sélective est déterminée par la perspective attentionnelle et le résultat de l’engagement attentionnel. Elle est soit négociée collectivement, soit le lieu d’instanciation de rôles : certain·e·s participant·e·s vont dévoluer leur attention à certains éléments de la situation pour l’ensemble du groupe.

Les trois processus décrits par Ocasio (2011) sont parmi les outils heuristiques qui nous permettent d’appréhender l’orchestration attentionnelle au sein du séminaire et la technogénèse de l’attention. Nous voyons ci-dessous comment la notion d’affordances y contribue également.

Technogénèse de l’attention et affordances attentionnelles

Dans la situation étudiée, les artefacts sont au premier plan et leur rôle est primordial quant aux cadres attentionnels.

Technogénèse de l’attention

Les objets que l’homme fabrique ne sont jamais purement fonctionnels ou utilitaires, mais toujours des « supports de fixation de l’attention » (Depraz 2014, 8). Ils articulent l’interaction à d’autres situations et d’autres lieux, ils localisent l’interaction en permettant une focalisation de l’attention. Les objets, dans l’interaction, sont à la fois des « articulateurs » et des « localisateurs ».

Nos appareils techniques jouent un rôle pour structurer les opérations attentionnelles de nos cerveaux, mais nous sélectionnons aussi, par l’interface de l’attention, les signes des artefacts qui nous occupent, selon leur fonctionnalité. L’attention est engagée dans une boucle récursive avec l’environnement technique. Ainsi, « la technogénèse de l’attention repose aussi bien sur le conditionnement de mon attention par les appareillages techniques qui me traversent, que sur ma capacité à recadrer ces informations » (Citton 2014, 273). Lorsque nous sommes en action dans un cadre (setting), les affordances sont créées par notre activité et le monde environnant. Le monde commence en indiquant des pertinences, en offrant des affordances en raison de qui nous sommes, et de ce que nous faisons et percevons de ces affordances (Van Lier 2002, 150).

Co-affordances

Théorie de l’affordance

La théorie de l’affordance permet de ne pas dissocier perception et action : la perception est à la fois une invitation à l’action et un composant essentiel de l’action. Il s’agit d’une triade entre l’environnement, l’usager·e et l’activité (Van Lier 2002). Pour la théorie de l’affordance, l’interprétation active des usager·e·s est centrale dans son émergence, tout en réaffirmant le fait que le lieu de la cognition, envisagée comme distribuée, n’est pas celui de la représentation, ni celui de la planification de l’action.

Alors que Donald A. Norman (2008) distingue la notion d’affordance pour ce qui concerne les objets et appelle « signifiant social » « un signifiant créé ou interprété par les individus ou la société, signifiant une activité sociale ou un comportement social approprié », c’est-à-dire un signal dans le monde social qui peut être interprété symboliquement et adapté pour des usages sociaux, il ne nous semble pas pertinent de séparer ces deux éléments.

Dans notre cas de figure, on ne peut interpréter seul·e les affordances des objets connectés permettant la communication, car on est engagé·e dans un travail de collaboration. La situation vécue façonne des scripts où l’action est collective et la cognition distribuée. Ces scripts sont en grande partie émergents.

Par ailleurs, nous pensons avec Bruno Latour et Nicolas Guilhot (2007) que « les objets ont l’étrange capacité d’être à la fois compatibles avec les compétences sociales à certains moments décisifs, et, le moment suivant, totalement étrangers au répertoire de l’action humaine » (Latour et Guilhot 2007, 284), et que la situation comporte donc beaucoup d’incertitudes.

Cela a deux conséquences essentielles :

Ce sont ces deux caractéristiques des affordances des artefacts et des logiciels de téléprésence que nous étudions dans ce chapitre : leur co-construction et leur rapport avec l’attention.

Analyse de corpus : co-construction du dispositif attentionnel

Nous nous attachons ici à décrire la complexité du dispositif du séminaire en nous appuyant sur les analyses des séances et des entretiens réalisés avec les participant·e·s.

Un dispositif complexe

La complexité du dispositif repose sur plusieurs aspects que nous analysons et expliquons ci-après : la multiplicité des foyers d’attention, la complexité du cadre participatif, un déficit de perceptibilité et le fait que les perspectives de chacun sont difficilement interchangeables. Nous allons voir que la circulation bidirectionnelle de l’attention (attention réciproque à autrui), l’intersubjectivité attentionnelle, est la caractéristique de l’attention conjointe la plus remise en question par le dispositif polyartefactuel. Cette non-réciprocité des perspectives complexifie les interactions.

Multiplicité des foyers d’attention

La complexité de l’orchestration attentionnelle au sein du séminaire est due, tout d’abord, à la multiplicité des foyers d’attention. En effet, l’attention doit être portée aux conditions de possibilité de l’interaction, donc au dispositif technique, mais aussi à l’objet principal du séminaire, par exemple une présentation orale, et encore à la félicité interactionnelle (Cosnier 2008) de chaque participant·e dans cet ensemble.

« T’es figée Tatiana »

Lors de la séance 3, Christelle pilote le Kubi. Lorsque Dorothée, à Lyon, prend pour exemple de sa démonstration le fait que l’image de Tatiana dans Adobe est figée, Christelle relaie cette parole sur le chat. Ainsi, Christelle suit le séminaire (attention primaire) mais suit aussi le foyer d’attention secondaire qui porte sur les conditions de possibilité de l’attention artefactée conjointe, en signalant à Tatiana que sa mise en visibilité est empêchée.

Relais d’information via le chat

Dorothée : « Moi tout à l’heure j’ai fait un sourire à Tatiana parce que j’étais persuadée qu’elle me souriait, mais non, elle est complètement figée depuis au moins un quart d’heure. »
Christelle sourit et écrit dans le chat : « T’es figée Tatiana reconnecte ta caméra. »

« Oui vas-y enregistre »

Lors de la séance 5, on perçoit la coexistence et l’orchestration des foyers d’attention de différents niveaux : Caroline est en train de parler à Lyon. Christelle, à son domicile, se lève pour allumer sa caméra. Julien passe derrière le Kubi. Amélie demande s’il faut qu’elle enregistre, Christine répond « Oui vas-y enregistre » (sans que cela passe en foyer primaire). Caroline continue sans rupture sur le contenu conceptuel. Christelle ouvre l’interface du Kubi.

Foyers d’attention

Dans cet exemple, l’attention conjointe primaire est consacrée au séminaire et l’attention secondaire aux conditions de possibilité de l’attention conjointe artefactée. Un autre foyer d’attention « méta » est également dirigé sur le recueil du corpus de données.

La multiplicité des foyers d’attention se combine avec une complexité audio-visuelle qui fait que les participant·e·s n’ont pas une appréhension globale du fonctionnement du dispositif à un moment donné.

Complexité audio-visuelle

Dans la séance 2, on peut voir un exemple de cette complexité du dispositif. En effet, la provenance du son est difficilement lisible, même pour les participant·e·s eux·elles-mêmes, qui ne savent pas quel artefact envoie le son aux participantes distantes, rendant plus difficile l’allocation de l’attention et la ratification interactionnelle.

« D’où vient le son ? »

Les personnes à distance signalent un problème de son : elles n’entendent pas distinctement les conférencier·e·s. Ces dernier·e·s décident alors de se rapprocher du microphone. Pour ce faire, les conférencier·e·s déplacent la table sur laquelle il et elle sont installé·e·s pour se rapprocher du microphone qu’il et elle imaginent envoyer le son aux participantes à distance. L’échange suivant a lieu entre les participant·e·s en présentiel :

Christine : « Pourtant y a un micro là, non, devant, non ? »
Dorothée (elle pointe vers le micro qui est posé devant les conférencier·e·s) : « Et oui, pourtant. »
Christine : « I’ marche pas le micro, là. »
Joséphine : « Il enregistre, mais il envoie pas à la distance. »
Conférencier : « C’est le micro enregistreur. »
Samira (pointe du doigt) : « C’est celui-ci. »
Christine : « Ah bon d’accord. »

Confusions sur les micros

« C’est quoi la caméra d’Adobe ? »

De même, lors de la séance 5, un cas similaire apparaît à propos de la vision de la salle dans Adobe. Christelle demande aux participant·e·s à Lyon d’ajuster l’image visible dans Adobe car elle ne parvient pas à voir la salle.

Confusions sur les caméras

Jean-François se lève : « C’est quoi la caméra d’Adobe ? »
Christine : « C’est ça là. »
Jean-François : « C’est ça ? »
Christine : « Oui. »
Jean-François déplace la caméra.
Jean-François : « Ça va là ? Tu vois ce que dessine euh… ? »
Christelle : « C’est parfait là. »

Ainsi, Jean-François demande confirmation avant de changer le positionnement de la caméra qui diffuse les images pour Adobe. Ce n’est pas immédiatement clair pour lui.

Les participant·e·s, à un moment donné, n’ont pas forcément une idée claire du fonctionnement du dispositif. Ceci complique les chorégraphies attentionnelles (Jones 2004, 28) et nécessite la reconstruction d’une appréhension collective et distribuée des affordances, c’est-à-dire des possibilités d’action de chacun·e mutuellement reconnues, que nous appelons co-affordances attentionnelles.

« Amélie tu peux te déplacer s’il te plaît ?« 

Dans le même temps, Morgane demande à Amélie (pilote du Beam) de se reculer car elle est dans le champ de la caméra de prise de données de recherche.

Champ de vision limité depuis le Beam

Morgane s’adresse à Amélie : « Tu peux te déplacer s’il te plaît ? Tu es sur… le champ de la caméra. »
Amélie n’entend pas et ne se rend pas compte qu’elle est dans le champ de la caméra.
Christine fait un geste du bras vers Amélie : « Amélie, tu peux…, vers où elle peut aller ? »
Morgane : « Soit à droite… »
Christine : « Ben non, parce qu’il y a la caméra là. »
Amélie commence à reculer le Beam.
Christine : « Voilà, très bien. »
Amélie avance le Beam.
Christine : « Non. »
Amélie repart en arrière.
Christine : « Continue à te reculer. Voilà. Tourne-toi maintenant. Voilà ! »

Les exemples extraits du corpus montrent la complexité d’une situation où l’orchestration collaborative est rendue nécessaire par l’absence d’appréhension globale du dispositif par chacun·e.

« Je le reconnectais à chaque fois »

Jean-François relate en entretien un épisode qui contribue à montrer la complexité du dispositif et le brouillage intentionnel qui en découle :

C’est Christelle, qui a la main sur tous les participantsChristelle a lancé la session Adobe Connect et peut faire passer les participant·e·s en hôte.↩︎, qui, à un moment, m’a envoyé un petit message de chat en disant « j’ai coupé ton micro parce que ça fait de l’écho » et en fait moi j’avais l’impression qu’il s’était déconnecté tout seul et donc je le reconnectais à chaque fois.

Cet exemple illustre également la nécessité d’expliciter verbalement ses intentions pour ne pas risquer d’être contre-productif·ve dans ce contexte d’absence d’appréhension globale, si l’on veut parvenir à une co-construction du dispositif attentionnel.

Source

Complexité du cadre participatif

La complexité est aussi celle du cadre participatif, « la manière dont les acteurs sociaux accomplissent, de façon dynamique et visible, des statuts tels que locuteur ou destinataire » (Colón de Carvajal 2014, 324; Goffman 1981). En effet, en plus des cadres participatifs multiples, tels que celui sur le chat d’Adobe, celui dans la salle, celui par SMS ou email entre deux personnes, en face à face entre deux voisins de table, etc., s’ajoute un niveau technique et un niveau affordanciel. Ainsi, si le but est que le maximum de participant·e·s soient ratifié·e·sCf. chapitre « Cadrage théorique et méthodologique pour l’éthologie réflexive visuelle ».↩︎, il en est de même du point de vue technique et affordanciel. Chaque participant·e peut être ratifié·e du point de vue conversationnel mais empêché·e momentanément du point de vue affordanciel, la possibilité d’action n’étant pas saisie alors qu’elle est présente techniquement. Par exemple, Christine donne la parole à Tatiana, mais Tatiana à ce moment-là a oublié de réactiver son micro donc la possibilité d’action qui consiste à diffuser le son de sa voix à distance n’est pas disponible, même si techniquement et socialement les conditions sont réunies.

Fausses affordances

Les affordances cachées (Gaver 1991) dessinent en creux un cadre non-participatif ou un cadre de non-ratification, dû à des problèmes techniques ou des possibilités d’action non perçues. Cet empêchement, qui relève de la dissymétrie constitutive de la situation, nécessite une co-construction pour être contourné.

Définition de Luyat et Regia-Corte

Marion Luyat et Tony Regia-Corte (2009, 28) notent à propos des « fausses affordances » :

Une baie vitrée sans reflet peut « afforder » à tort le passage. Au contraire les pans de portes vitrées sans vitre peuvent nous freiner dans notre locomotion en nous faisant croire à tort qu’il y a une vitre. Les sables mouvants sont un autre exemple de fausses affordances.

Dans notre cas, les fausses affordances sont celles imaginées au sujet de la perspective d’autrui. Ainsi, je peux penser que le robot Beam peut facilement être déplacé pour suivre la prise de parole en présentiel, alors que ce n’est pas le cas. Ou encore, je peux penser que lorsque je m’adresse aux participant·e·s qui utilisent Adobe Connect, je dois regarder vers le mur où leur image est projetée. Mais cette présence projetée constitue une fausse affordance puisqu’il faudrait en fait diriger son regard vers la caméra qui filme la salle à Lyon.

Figure 2 : Susan Herring orientant le robot vers l’image projetée de Christelle

Reconnaissance mutuelle

Le principe d’une situation d’interaction en face à face implique que :

les locuteurs et les auditeurs sont des acteurs incarnés à titre égal, impliqués dans une activité commune, au cours de laquelle la participation est accomplie de façon mutuellement reconnaissable par l’ensemble des participants, qu’ils soient ratifiés ou non (Colón de Carvajal 2014, 324).

Ce caractère de reconnaissance mutuelle de la participation et de la ratification fait défaut dans notre situation hybride polyartefactée et rend nécessaire des épisodes d’ajustements co-construits.

Absence de reconnaissance mutuelle

Pour ajouter à la complexité de la situation, en présence d’empêchements kiné-audio-visuels, les participant·e·s ne savent pas s’il s’agit d’un choix délibéré de la part de la participante distante (par exemple, celle-ci a momentanément coupé son micro pour parler avec quelqu’un à son domicile), d’une non-ratification (les participantes sur Adobe sont-elles silencieuses parce qu’on ne leur a pas donné la parole, parce que momentanément elles n’entendent pas ce qui se dit en présentiel, ou parce qu’elles ont été « oubliées » par les participant·e·s à Lyon ?) ou d’un problème technique (les participantes distantes sont-elles silencieuses parce qu’il y a momentanément un problème de son en diffusion, ou parce qu’elles n’ont pas de contribution à apporter à ce moment-là ?).

Exemples d’impressions erronées sur l’émission et la réception du son

Tatiana en donne un exemple en entretien :

J’avais l’impression que l’on ne m’entendait pas, que l’on ne m’écoutait pas, mais c’est parce que j’ai mis mon micro en silencieux et j’ai oublié en fait de le réactiver, et je parlais et je parlais, c’était un peu comique.

Dans cet épisode, Tatiana présume de l’attention des participant·e·s à Lyon alors même que, l’absence de son venant d’un oubli de sa part, les participant·e·s lyonnais·e·s pouvaient présumer à tort qu’elle n’avait rien à dire à ce moment-là.

De même, Amélie expose la manière dont sa présence à distance par l’intermédiaire du robot Beam complexifie sa prise de parole :

Ça paraît complexe et pour moi au début je ne pensais pas que ça allait être aussi complexe et je pensais que je pouvais prendre naturellement la parole mais du fait que je ne puisse pas me raccrocher à un visuel c’est dur de dire à ce moment-là je peux prendre la parole ou sinon il faut que j’attende qu’en fait on me la donne.

Dans un entretien d’autoconfrontation, elle revient sur un moment où elle a dû s’imposer pour parler et couper la parole à une autre participante :

En fait dans la salle soit comme on peut se raccrocher assez facilement au visuel y a toujours des actes de réparation en fait là en fait je sais pas si moi j’aurais dû faire un acte de réparation pour la personne que j’ai coupé.

Source

On voit que l’absence de réciprocité dans la perception de la situation amène à des interactions qui interrogent sur la façon dont elles doivent être gérées par les participant·e·sCf. chapitre « Ménager les faces par écran : vers de nouvelles règles de politesse ».↩︎.

Non-réciprocité des perspectives

La caractéristique principale qui semble remise en question dans la définition de la co-attention que nous avons donnée précédemment paraît être en effet la réciprocité des perceptions.

L’attention conjointe passe par la perceptibilité mutuellement explicite des affordances en jeu dans la situation polyartefactée que nous analysons, c’est-à-dire que chacun·e doit être conscient·e des possibilités offertes à autrui par l’environnement et vice versa. Cette prise de conscience n’est pas aisée car la situation est nouvelle pour les participant·e·s qui n’ont pu expérimenter l’ensemble des artefacts. La mise en intelligibilité co-construite des affordances est au cœur du séminaire hybride comme de notre étude car elle rend possible l’attention conjointe. En effet, dans une situation où il est difficile de se mettre à la place d’autrui, en particulier lorsque l’on n’a jamais expérimenté un artefact (comment savoir que, sur le Kubi, l’angle de vision est réduit ou doit être reparamétré si l’artefact est déplacé manuellement ?), les possibilités d’action de chacun·e doivent être mutuellement explicitées.

Une non-réciprocité des perspectives constitutive du dispositif

Le dispositif d’expérimentation « Présences numériques » apparaît de manière constitutive dissymétrique du point de vue des perspectives de chacun·e. C’est précisément pourquoi le dispositif attentionnel a besoin d’être construit ou reconstruit. Cette dissymétrie des perspectives peut être explicitée du point de vue de l’empathie.

Empathie

En effet, l’empathie repose sur l’idéalisation de la réciprocité des perspectives. À cet égard, Alfred Schutz et Thomas Luckmann (1973) rappellent les « deux idéalisations de base qui sont les conditions mêmes du fonctionnement empathique : l’idéalisation de l’interchangeabilité des points de vue et celle de la congruence des systèmes de pertinence ».

Or dans ce dispositif, il y a une dissymétrie constitutive du fait que les artefacts n’ont pas tous été testés par tou·te·s les participant·e·s. La non-interchangeabilité des points de vue est autant physique que mentale car il est difficile de savoir ce qui est pertinent du point de vue attentionnel pour la pilote du Beam si on n’a pas soi-même expérimenté cet artefact.

Dissymétrie des perspectives

David Sirkin et al. (2011, 162) formulent ainsi cette dissymétrie dans un contexte de visioconférence :

L’attention est fondamentale pour la fluidité des conversations en face à face. Chaque participant projette des indices de ce sur quoi il porte son attention et les autres participants interprètent ces indices pour maintenir la conscience de leur focus attentionnel. […] Les systèmes de vidéoconférence perturbent le lien entre projection de l’attention et conscience de l’attention. Ils font cela en partie parce qu’ils ne reproduisent pas fidèlement les caractéristiques spatiales de regard, d’orientation corporelle, et de gestes de pointage« Attention is fundamental to the flow of face-to-face conversations. Each participant projects cues of what he is paying attention to and other participants interpret these cues to maintain awareness of his locus of attention. […]. Videoconferencing systems disrupt the link between attention projection and attention awareness. They do this in part because they do not faithfully reproduce the spatial characteristics of gaze, body orientation, and pointing gestures. »↩︎(notre traduction, Sirkin et al. 2011, 162).

Selon ces auteur·rice·s, la visioconférence introduit trop de « paramètres invisibles », tels que l’angle de vue, la taille de l’ordinateur utilisé à distance, etc. Ce sont ces paramètres invisibles qui contribuent à la non-réciprocité des points de vue. Ceux-ci ne sont pas immédiatement interchangeables car chaque participant·e n’a pas vécu le point de vue de l’autre. Les traces de cette dissymétrie sont nombreuses dans le corpus. Dans l’exemple suivant, il s’agit bien d’une question d’angle de vue qui menace la continuité de l’interaction.

Ainsi, lors de la séance 5, Christelle (pilote du Kubi) demande à ce que les participant·e·s à Lyon repositionnent la caméra qui envoie la vidéo aux participantes à distance car elle ne parvient pas à voir ce qui se passe dans la salle. Les participant·e·s à Lyon font cette manipulation uniquement parce qu’elle a été demandée par Christelle.

La caméra sur l’écran d’Adobe

Points de vue dissymétriques

Caroline se lève pour aller dessiner au tableau blanc.
Christelle : « Ça serait pas mal que la caméra soit sur l’écran là, [la caméra] d’Adobe, ce que je vois dans Adobe là, parce que sinon je vous vois vous. »

Dans l’entretien mené auprès d’Amélie par Dorothée et Samira, cette dissymétrie apparaît également du point de vue sonore. En effet, Amélie revient sur le moment où elle a éternué, où elle ne s’est pas rendu compte que l’effet sonore à Lyon était décuplé du fait de l’ajustement des micros à ce moment-là. Ce détail peut paraître un non-événement, mais il a eu un impact sur la réflexion du groupe et l’appréhension des perspectives attentionnelles de chacun.

Éternuer aussi fort

J’ai pas eu la sensation d’éternuer aussi fort et que ça ait un impact dans la salle aussi fort, je ne m’en suis même pas rendu compte de ça en fait […] Quand j’ai visionné la vidéo du séminaire je me suis rendu compte de l’impact que ça a eu mais pour moi j’ai pas éternué fort, j’ai pas vécu l’impact que ça a eu dans la salle en fait.

Source

Cécité affordancielle

Ainsi, du point de vue de l’orchestration de l’attention, cette cécité affordancielle complique la co-construction du dispositif. Nous entendons par cécité affordancielle l’absence de prise de conscience d’une possibilité d’action : Amélie n’a pas conscience que le volume du son en diffusion est élevé alors que techniquement cette possibilité d’action est disponible. Elle participe à cette construction par la suite en coupant son micro quand nécessaire, comme elle le précise en entretien : « Après ça m’a servi aux autres séminaires je coupe mon micro comme ça quand j’éternue personne ne m’entend ».

Cette fois, le signal fort ne lui a pas été transmis par les participant·e·s au cours de l’interaction, mais par les données méta du dispositif de recueil de données de recherche, en l’occurrence les vidéos qu’elle a commencé à visionner.

En ce qui concerne la vision, Amélie commente en entretien l’épisode lors duquel les conférencier·e·s déplacent la table pour se rapprocher des micros (séance 2). Elle se trouve alors coincée entre leur table et la table des participant·e·s à Lyon derrière elle.

Coincée par les conférencier·e·s

Je me suis dit, peut-être que la vision que j’ai… peut-être qu’ils ne sont pas si près que ça, mais moi franchement, enfin vous pouvez regarder la vidéo, j’ai l’impression de les avoir à cinquante centimètres de moi.

Source

Elle-même ne peut se fier à sa perception de la distance, c’est à la fois la participante la plus éloignée géographiquement et la plus proche du point de vue proxémique, proxémie qui lui est inconfortable. Elle est consciente, au moment de l’entretien, qui a lieu un mois après cette séance, de la non-réciprocité de ces aspects.

Orchestration de l’attention

Face à la complexité décrite ci-dessus, nous pouvons faire l’hypothèse que l’orchestration attentionnelle se construit par la pose de marqueurs attentionnels successifs au cours de l’interaction. Il s’agit alors d’orienter le processus de sélection attentionnelle de certains membres ou du groupe.

Pose de marqueurs attentionnels

Nous définissons cette pose de marqueur par la verbalisation ou la mise en geste d’un signal faible ou fort de demande d’attention. Le marqueur indique l’attention affordancielle « mutuellement explicite » (pour reprendre la terminologie de Depraz) à un moment donné. Ce marqueur peut être par la suite repris de manière spontanée ou pas, en fonction du rôle de chacun·e et des priorités contextuelles et temporelles. Nous voyons dans les deux exemples ci-dessous qu’il peut avoir été posé mais ne pas être repris dans l’immédiat lorsque les impératifs et constituants de l’interaction entrent en conflit avec la co-affordance à construire (par exemple, la prise en compte de la mauvaise diffusion du son vers les participantes distantes).

Chacune a ses priorités

Ainsi que l’indique Christine en entretien :

S’ils font passer un message par le chat et que par exemple quelqu’un peut résoudre le problème c’est très bien, mais moi je me focalise quand même sur les conférenciers parce que je suis là pour les accueillir.

À l’inverse, Morgane, principale responsable des aspects techniques, formule une position contraire :

Là, il y a un problème de son et j’essaye de le faire comprendre dans un premier temps à Dorothée, tout en sachant que Susan Herring est en train de parler et que je ne veux surtout pas l’interrompre. Je pense qu’il y a un problème de son apparemment par rapport au chat que je vois sur Adobe. Dans ce projet, je suis responsable de la technique et donc ma priorité quand il y a une conférence comme ça c’est que tout le monde puisse la suivre, bien voir et entendre la conférencière.

Ainsi, pour Morgane, les signalements sur le chat d’Adobe sont un signal fort alors que pour Christine c’est un signal faible.

Source

Lors de la séance 2, un marqueur est posé sur le fait que Tatiana n’entende pas, suite à une prise de signal par Joséphine sur le chat d’Adobe projeté au mur.

Exemple de marqueur attentionnel

Ce marqueur n’est pas repris ensuite par Christine, une fois les premiers ajustements effectués, car la priorité pour elle est que les conférencier·e·s, invité·e·s du séminaire, puissent donner leur conférence, qui est de surcroît filmée et destinée à être mise sur le site web IMPEC. De plus, l’investissement en ressources humaines et matérielles pour la mise en place du dispositif rend tout dysfonctionnement problématique, car ce n’est pas un dispositif qu’il est facile de reproduire en dehors d’une planification établie longtemps à l’avance.

À l’inverse, lors de la séance 5, une fois que l’attention a été portée sur le problème de visualisation de la salle par Christelle, Jean-François vérifie ensuite spontanément, sans relance de Christelle, qu’elle voit correctement les actions menées à Lyon.

« Tu vois ce que je dessine »

Reprise d’un marqueur attentionnel

Jean-François : « Ça va là ? Tu vois ce que dessine euh… ?  »
Christelle : « C’est parfait là. »

Lors de cette séance, il n’y a pas d’invité·e extérieur·e au séminaire, ce qui donne également plus de latitude pour la reprise des marqueurs attentionnels.

Une certaine fluidité peut même être constatée, c’est-à-dire que l’interaction ne s’interrompt pas pendant un réajustement des possibilités d’action. Ainsi, lors de cette même séance, Jean-François se lève pour ajuster la position de la caméra qui filme le Kubi dans la salle à Lyon. Il s’exécute tout en contribuant à l’interaction qui porte sur le schéma en train d’être dessiné au tableau par Caroline.

Jean-François tourne la caméra pendant qu’il parle

Fluidité des ajustements

Jean-François : « En fait je me demande s’il ne faudrait pas faire déjà une liste des agents humains et non humains qui… »
Il retourne s’asseoir puis reprend une fois assis.
« …parce que je pense qu’il y des agents non humains comme Adobe, Beam… »

Pendant qu’il parle, il tourne la webcam qui filme le Kubi.

Ainsi, les affordances négatives (Gibson 1979) pour les un·e·s sont éventuellement autant de possibilités de pose de marqueurs attentionnels qui contribuent finalement à la co-construction du dispositif attentionnel global.

Un exemple des affordances attentionnelles du dispositif : projection de la présence écranique de l’interface Adobe

La mise à l’écran afforde la présence des autres. Cette mise à l’écran sur le mur de projection de la salle est un actant de la situation. Cela permet aux participantes d’être présentes aux autres et constitue un foyer attentionnel très fort, perceptible par des gestes (gestes de pointage) et des verbalisations interprétant ce qui est projeté (notamment lors du figement de l’image des participantes). C’est aussi un dispositif porteur d’affordances attentionnelles, mais aussi de fausses affordances.

Par sa saillance, la projection de l’écran d’Adobe permet à la fois de diriger l’attention et de projeter la présence des participantes connectées. Mais il introduit également de fausses affordances, en dirigeant le regard et la parole vers des images et non des personnes.

Lors de la conférence de Susan Herring (séance 6), Christelle était connectée sur Adobe et son image était projetée au mur. Alors que Susan Herring, pilotant un robot Beam, répondait à une question posée par Christelle, elle a voulu orienter son « corps » vers elle et, pour se faire, elle a orienté le robot vers l’image projetée de Christelle sur le mur.

Susan tourne le dos à Christelle

Prise en charge collective de l’interattention

En voulant orienter l’interface du robot vers l’interface de Christelle, Susan Herring a en réalité tourné « le dos » aux yeux et aux oreilles artefactées de Christelle : le microphone et la caméra, situés en face du mur. Elle a ainsi été trompée par la présence visuelle des yeux et des oreilles de Christelle sur le mur, fausse affordance de sa présence. Se rendant compte que Christelle entendait mal (Christelle fronce les sourcils et s’approche de l’écran), elle cherche alors à vérifier la réciprocité de leur perception – « I don’t know if Christelle can hear me ? » (« Je ne sais si Christelle peut m’entendre ? »). Le groupe, qui a compris depuis quelques minutes le quiproquo, prend alors en charge le rétablissement de l’interattention pour garantir la fluidité et l’accessibilité des échanges. Les participant·e·s indiquent alors à Susan Herring « She’s there ! » (« Elle est là »), pointant du doigt la caméra-microphone qui fait face au mur. Elle comprend alors son erreur : « Oh, I’m talking to the screen ! » (« Oh, je parle à l’écran ! »).

Cet exemple illustre différents phénomènes que nous avons cherché à démontrer dans ce chapitre : le manque de symétrie des perceptions, la construction collective du réseau affordanciel permettant la fluidité des interactions, les fausses accessibilités aux autres, la nécessité d’expliciter ses intentions et ses perceptions aux autres et enfin la prise en charge par le groupe de l’interattention. Nous voyons dans la section suivante que cette prise en charge de l’interattention passe par la construction de co-affordances attentionnelles.

Émergence de co-affordances attentionnelles

Une trace de la construction de co-affordances attentionnelles apparaît dans la séance 5. Christelle signale que Tatiana a écrit dans le chat, Morgane lit à voix haute ce que Tatiana a écrit dans le chat, et Jean-François répond à voix haute à Tatiana sans que celle-ci ait pris la parole. Il s’adresse pourtant explicitement à elle.

Exemple de co-affordances attentionnelles

Co-affordances attentionnelles

Jean-François : « Ouais, Tatiana, moi je pensais aussi à physique quantique parce que en termes de euh, la physique quantique c’est aussi l’hypothèse du chat de Schrödinger qui peut être à la fois mort et pas mort dans la boîte, et en fait par exemple certaines personnes peuvent être à la fois présentes et pas présentes. »
Christine : « Oui c’est vrai c’est intéressant ça. »
Morgane : « Le chat de ch… »
Tatiana : « Schrödinger, Schrödinger’s cat. »
Jean-François : « Merci Tatiana. »

On voit ici un exemple de redéfinition de l’attention mutuellement explicite, qui ne passe plus par la gaze awareness, la conscience de la direction du regard, mais par l’attention awareness, la conscience de la focalisation de l’attention. L’action co-affordancielle de Jean-François est validée puisque Tatiana confirme qu’elle a bien entendu sa proposition et l’échange qui a suivi. Ainsi la confiance que Jean-François a manifesté envers la co-construction affordancielle apparaît comme légitime.

Lors de cette séance, qui est la dernière filmée pour le corpus de recherche, l’attention mutuellement explicite ne repose plus sur la convergence des regards, mais sur la co-construction affordancielle. C’est un pari sans cesse renouvelé, et petit à petit moins risqué, que l’orchestration de l’attention peut se construire sur une non-réciprocité des perspectives, des affordances et des regards.

Le dispositif « Présences numériques » met en jeu notre propre perceptibilité et celle d’autrui. Notre analyse a permis de mettre au jour la saisie collective et co-construite des potentialités dans une situation polyartefactée ainsi que le fait que cette saisie nécessite une orchestration de l’attention elle-même co-élaborée. Cette accommodation réciproque dans un environnement artefacté amène à distinguer la conscience de la direction du regard d’autrui ou de ses gestes de la conscience du focus attentionnel d’autrui. L’environnement hybride artefacté amène ainsi à explorer d’autres manières de permettre la projection et la conscience de l’attention. Si l’on reprend l’attention mutuellement explicite telle que définie par Depraz, il semble que, dans le séminaire étudié, on apprend à interagir sans cette explicitation mutuelle tout en ayant confiance dans l’interaction. On peut faire l’hypothèse que la confiance dans la construction co-affordancielle tient lieu d’attention mutuellement explicite. C’est une méta-vigilance telle que la conçoit Pierre Livet (2016) : une vigilance à nos manques de vigilances ou à nos négligences attentionnelles. Selon nous, le travail que suppose un tel dispositif attentionnel demande aux individus de construire un collectif capable de gérer la variété de nos négligences attentionnelles, d’y être plus sensible, afin de gérer l’action collective et la participation.

Ce travail est un processus dynamique qui conduit à l’émergence de co-affordances attentionnelles.

Figure 3 : émergence de co-affordances

Les co-affordances attentionnelles permettent la co-présence et l’orchestration de l’attention. La perceptibilité de ces affordances est appréhendée collaborativement à travers la pose de marqueurs attentionnels, jusqu’à arriver à une attention mutuellement explicite malgré la dissymétrie des perspectives au sein de l’espace médié.

Références
Arminen, Ilkka, Christian Licoppe, et Anna Spagnolli. 2016. « Respecifying Mediated Interaction ». Research on Language and Social Interaction 49 (4): 290‑309. https://doi.org/10.1080/08351813.2016.1234614.
Berger Peter, et Luckmann Thomas. 1966. The Social Construction of Reality: A Treatise in the Sociology of Knowledge. New York: Doubleday.
Bonu, Bruno. 2007. « Connexion continue et interaction ouverte en réunion visiophonique ». Réseaux 5 (144): 25‑57. https://www.cairn.info/revue-reseaux1-2007-5-page-25.htm.
Brunel, Marie-Lise, et Jacques Cosnier. 2012. L’empathie. Un sixième sens. Lyon: Presses universitaires de Lyon. https://presses.univ-lyon2.fr/product/show/l-empathie/753.
Citton, Yves. 2014. Pour une écologie de l’attention. Paris: Éditions du Seuil. http://www.seuil.com/ouvrage/pour-une-ecologie-de-l-attention-yves-citton/9782021181425.
———. 2016. « Attention collective et vigilance médiatique ». Intellectica 66 (2): 161‑80. https://doi.org/10.3406/intel.2016.1823.
Colón de Carvajal, Isabel. 2014. « Parler à distance par visiophone : modification du cadre participatif lors de l’intégration d’un nouveau locuteur ». In Corps en interaction : participation, spatialité, mobilité, édité par Lorenza Mondada, 323‑56. Lyon: ENS Éditions. http://catalogue-editions.ens-lyon.fr/fr/livre/?GCOI=29021100403870.
Cosnier, Jacques. 2008. « Les gestes du dialogue ». In La communication, état des savoirs, édité par Philippe Cabin et Jean-François Dortier, 119‑28. Auxerre: Éditions Sciences Humaines. https://halshs.archives-ouvertes.fr/halshs-00392992.
Depraz, Natalie. 2014. Attention et vigilance: à la croisée de la phénoménologie et des sciences cognitives. Épiméthée. Paris: Presses universitaires de France. https://www.puf.com/content/Attention_et_vigilance.
———. 2016. « Vigilance : une micro-dynamique de l’éveil ». Intellectica. Revue de l’Association pour la Recherche Cognitive 66 (2): 67‑79. https://doi.org/10.3406/intel.2016.1817.
Gaver, William W. 1991. « Technology affordances ». In Proceedings of the SIGCHI conference on Human factors in computing systems Reaching through technology - CHI ’91, 79‑84. New Orleans, Louisiana: ACM Press. https://doi.org/10.1145/108844.108856.
———. 1992. « The affordances of media spaces for collaboration ». Proc. CSCW 1992, ACM Press, 17‑24. https://doi.org/10.1145/143457.371596.
Gibson, James J. 1979. The ecological approach to visual perception. Boston: Houghton Mifflin.
Giddens, Anthony. 2005. La Constitution de la société. Paris: Presses universitaires de France.
Goffman, Erving. 1981. Forms of talk. University of Pennsylvania publications in conduct et communication. Philadelphia: University of Pennsylvania Press. https://www.upenn.edu/pennpress/book/715.html.
———. 2013. Comment se conduire dans les lieux publics: notes sur l’organisation sociale des rassemblements. Traduit par Daniel Cefaï. Paris: Économica. https://www.economica.fr/livre-comment-se-conduire-dans-les-lieux-publics-goffman-erving,fr,4,9782717864410.cfm.
Jones, Rodney. 2004. « The problem of context in computer-mediated communication communication ». In Discourse and Technology: Multimodal Discourse Analysis, édité par Philip LeVine et Ron Scollon, 20‑33. Washington, D.C: Georgetown University Press. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.912.1212&rep=rep1&type=pdf.
Kanai, Ryota, Vincent Walsh, et Chia-huei Tseng. 2010. « Subjective discriminability of invisibility: A framework for distinguishing perceptual and attentional failures of awareness ». Consciousness and Cognition 19 (4): 1045‑57. https://doi.org/10.1016/j.concog.2010.06.003.
Kendon, Adam. 1990. Conducting interaction: patterns of behavior in focused encounters. Studies in interactional sociolinguistics 7. Cambridge ; New York: Cambridge University Press. https://www.cambridge.org/fr/academic/subjects/languages-linguistics/sociolinguistics/conducting-interaction-patterns-behavior-focused-encounters?format=PB&isbn=9780521389389.
Latour, Bruno, et Nicolas Guilhot. 2007. Changer de société, refaire de la sociologie. Paris: Éditions La Découverte. https://www.editionsladecouverte.fr/catalogue/index-Changer_de_soci__t____refaire_de_la_sociologie-9782707153272.html.
Livet, Pierre. 2016. « Vigilances et négligences ». Intellectica. Revue de l’Association pour la Recherche Cognitive 66 (2): 81‑99. https://doi.org/10.3406/intel.2016.1818.
Luyat, Marion, et Tony Regia-Corte. 2009. « Les affordances : de James Jerome Gibson aux formalisations récentes du concept ». L’Année psychologique 109 (2): 297‑332. https://doi.org/10.4074/S000350330900205X.
Norman, Donald A. 2008. « The way I see it : Signifiers, not affordances ». interactions 15 (6): 18‑19. https://doi.org/10.1145/1409040.1409044.
Ocasio, William. 2011. « Attention to Attention ». Organization Science 22 (5): 1286‑96. https://doi.org/10.1287/orsc.1100.0602.
Rouby, Évelyne, et Catherine Thomas. 2014. « La construction de compétences collectives en environnement complexe : une analyse en termes d’attention organisationnelle. Le cas exploratoire de la conduite d’un four de cimenterie ». @GRH 12 (3): 39‑74. https://doi.org/10.3917/grh.012.0039.
Schütz, Alfred. 2014. Eléments de sociologie phénoménologique. Paris: L’Harmattan.
Schütz, Alfred, et Thomas Luckmann. 1973. The Structures of the Life-World. Second. Evanston: Northwestern University Press. https://nupress.northwestern.edu/9780810108332/the-structures-of-the-life-world/.
Sirkin, David, Gina Venolia, John Tang, George Robertson, Taemie Kim, Kori Inkpen, Mara Sedlins, Bongshin Lee, et Mike Sinclair. 2011. « Motion and Attention in a Kinetic Videoconferencing Proxy ». In Human-Computer InteractionINTERACT 2011, édité par Pedro Campos, Nicholas Graham, Joaquim Jorge, Nuno Nunes, Philippe Palanque, et Marco Winckler, 162‑80. Lecture Notes in Computer Science. Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-642-23774-4_16.
Van Lier, Leo. 2002. « An ecological-semiotic perspective on language and linguistics ». In Language acquisition and language socialization: ecological perspectives, édité par Claire Kramsch, 140‑64. Advances in applied linguistics. London ; New York: Continuum.