Aarseth, Espen (dir.). 2007. Dossier « Doors and Perception: Fiction vs. Simulation in Games ». Intermédialités, no 9, p. 35-58.
Article ReMix
Réapprendre à voir, réapprendre à agir. L’immersion vidéoludique entre concrétisation et irréalisation
Afin d’établir la légitimité d’un objet et d’un champ d’étude, les chercheurs ont tendance à poser des distinctions franches et à établir l’originalité de cet objet de manière emphatique. Avec l’émergence des études du jeu vidéo, certains ludologues ont théorisé cette différence en ayant recours à des distinctions quasi ontologiques. Pour Jesper Juul, le jeu vidéo est à moitié réel (half real); il ne met pas en jeu seulement des éléments fictionnels comme les films ou les romans, mais aussi de «vraies règles» avec lesquelles le joueur interagit «pour de vrai» (Juul, 2005). Espen Aarseth a proposé une échelle ontologique, avec le réel et le fictif à chacune des extrémités, et le virtuel –l’intégration de modèles dynamiques et interactifs, notamment dans le jeu vidéo- comme nouvelle catégorie, définie par sa proximité avec l’expérience du réel (Aarseth, 2007: 35-58). Effectivement, une observation rapide de l’évolution du jeu vidéo semble confirmer une progression globale vers une expérience plus complète: les nouvelles interfaces permettent de capter les mouvements du joueur dans une certaine mesure, les algorithmes qui gèrent l’interactivité sont parfois très complexes, et la fascination pour les effets visuels qui aspirent à tromper la perception est un moteur évident de cette évolution.
Dans l’article qui suit, nous proposons d’analyser l’expérience immersive vidéoludique à partir de plusieurs définitions et typologies de l’immersion. Après avoir relevé quelques traits communs de l’expérience immersive à travers les travaux de Mihaly Csikszentmihalyi, nous allons nous attaquer progressivement à la feintise vidéoludique. Nous rejoindrons l’un des postulats fondamentaux de Jean-Marie Schaeffer, à savoir que le jeu vidéo s’inscrit en continuité des expériences d’immersion fictionnelle expérimentées dans d’autres pratiques artistiques. Mais au lieu d’insister sur le gain de «réalité» associé à la représentation interactive d’événements et à la posture actantielle qui y prend place, nous allons mettre de l’avant le rôle de l’irréalisation du corps et de l’action dans l’immersion vidéoludique.
Une expérience idéale
La théorie du flux (flow) de Mihaly Csikszentmihalyi représente un point d’ancrage fréquent pour discuter de l’immersion en tant qu’expérience psychologique intense (1975). Dans le modèle proposé par Franz Mäyrä et Laura Ermi, il correspond à l’immersion fondée sur le défi (challenge-based immersion), c’est-à-dire un état d’absorption qui émerge dans le cadre d’une activité aux objectifs clairs. Comme nous le verrons plus loin, ce type cohabite avec l’immersion des sens et l’activité de l’imagination (Mäyrä et Ermi, 2005). De la même manière, Marie-Laure Ryan distingue un type d’immersion «qui résulte d’une intense absorption dans une activité quelconque», et un autre type d’immersion qui provient d’un acte d’«imagination imaginante» (2007: 19).
Afin de mieux comprendre l’attrait des activités autotéliques (qui ne supposent aucune gratification extérieure), Csikzentmihalyi a réalisé une série d’entrevues avec des alpinistes, des compositeurs, des joueurs d’échecs, des chirurgiens et même, plus récemment, des historiens d’art (Csikzentmihalyi, 1990). Tous relatent une expérience similaire: dans l’exercice de leur talent particulier, surgissent des périodes d’absorption complète qui se traduisent éventuellement par l’occultation du moi, une fusion du sujet et de l’objet à travers l’action. Csikszentmihalyi établit les critères essentiels qui mènent à cette transcendance des limites du moi: focalisation de l’attention sur l’activité en cours, limitation du champ de stimulation, clarté des buts et de la rétroaction, équilibre entre compétences et défis présentés (1975: 38-48). Cette notion d’équilibre serait cardinale dans l’expérience du flux: lorsque les défis sont trop importants, l’individu risque de sombrer dans l’anxiété; inversement, une activité trop facile à réaliser sera bien souvent ennuyante.
Selon l’auteur, toute activité qui comporte des buts clairement définis est susceptible de provoquer des épisodes de flux. Pour l’individu qui possède une «personnalité autotélique», ces épisodes pourraient surgir naturellement dans le cadre de l’expérience quotidienne. Mais les prémisses mêmes de la recherche soulignent plutôt à quel point certaines sphères du quotidien ne sont pas particulièrement aptes à procurer une expérience optimale; si Csikszentmihalyi veut cerner le fonctionnement des activités autotéliques, c’est dans l’espoir d’offrir des outils pour rendre l’expérience du travail plus gratifiante. Clairement, certaines activités ont été élaborées dans le but précis de favoriser ces épisodes.
Les univers ludiques: Une clarté inhabituelle
Pour expliquer leur intérêt, les joueurs d’échecs interviewés par Csikszentmihalyi évoquent notamment le «monde» procuré par cette activité. Le chercheur s’inspire de ces témoignages pour définir globalement l’expérience des activités autotéliques: il s’agit de découvrir et d’interagir avec une «réalité artificiellement réduite», un «système autonome de signification» (1975: 46 et 72). Évidemment, cette affirmation prend tout son sens lorsqu’on considère les jeux traditionnels, souvent très abstraits. Comme le soulignent Katie Salen et Eric Zimmerman:
Il y a une sorte de lucidité et d’intelligibilité dans les jeux. La «vie réelle» est pleine d’ambiguïté et d’information incomplète, mais voilà précisément l’une des raisons pourquoi les jeux en tant que systèmes fabriqués sont artificiels et se distinguent de l’existence quotidienne. Dans la vie ordinaire, il est rare de se retrouver dans un contexte qui fait montre d’un si haut degré de clarté artificielle1«[T]here is a kind of lucidity and intelligibility about games. “Real life” is full of ambiguities and partially known information, but that is one of the reasons why games as designed systems are artificial and distinct from daily existence. In ordinary life it is rare to inhabit a context with such a high degree of artificial clarity» (Salen et Zimmerman, 2003: 123)..
Pour rendre compte de l’attitude des joueurs, Salen et Zimmermann ont mis de l’avant, à partir des travaux de Johan Huizinga, le concept de «cercle magique». Les jeux réglés formalisent habituellement la séparation dans le temps et l’espace, ce qui constitue l’un des critères essentiels aux définitions du jeu depuis Huizinga: pensons aux arènes sportives ou au plateau des jeux de société. Même lorsque cette séparation n’est pas aussi évidente, le cercle magique désigne avant tout un lieu mental, émergeant par la bonne volonté des joueurs qui ont assimilé un système précis de règles et s’engagent à fonctionner selon ce système. La formalisation riche des jeux réglés permet l’établissement d’un cadre distinct, caractérisé par une «clarté inhabituelle». C’est ce caractère artificiel que souligne l’immersion systémique mise de l’avant par Dominic Arsenault dans sa typologie qui révise celle de Mäyrä et Ermi (2006: 46-49). Les systèmes artificiels fonctionnent selon leurs propres règles, qui ne trouvent pas d’équivalent dans la réalité.
Même lorsque le corps est impliqué de manière plus complète (dans le cadre des activités sportives), les règles et les accessoires ludiques permettent de redéfinir les dynamiques corporelles; le corps ne vaut plus que pour certaines fonctions bien précises que le joueur pourra cibler et, avec un peu de détermination, améliorer. À partir des réflexions de Maurice Merleau-Ponty, Rune Klejver va même jusqu’à déclarer que la posture sportive peut être vue comme un «corps-sujet» temporaire qui prend forme dans la situation du jeu, et compare cette posture à celle qui prévaut dans un jeu vidéo où le joueur contrôle une «poupée» virtuelle, son avatar (Klejver, 2006: 92).
Au cœur du cercle magique, les règles définissent les buts et les éléments saillants; elles contribuent ainsi à recentrer l’attention du joueur et facilitent une rétroaction claire. Au-delà du cercle magique, la pratique ludique suppose fréquemment une classification des défis, des joueurs et des équipes en compétition, de manière à favoriser l’émergence des périodes de flux au cours de l’activité. Si les activités ludiques opposent au joueur une série d’obstacles «superflus» (c’est l’aspect central de la définition du jeu avancée par Bernard Suits, 2005), elles proposent surtout un cadre tout à fait propice à l’apprentissage et au perfectionnement des compétences requises.
Salen et Zimmerman n’écartent pas les jeux de faire-semblance de leur étude, mais distinguent ces derniers à partir du caractère poreux et inconsistant du «cercle magique», imputable à une règlementation beaucoup plus relâchée. Les enfants qui jouent à la poupée ou à la guerre opèrent plutôt sous le mode de la paidia cailloisienne, une improvisation libre et constamment renégociée. Même les «jeux» fictionnels mieux circonscrits dans le temps et l’espace –les représentations théâtrales, cinématographiques ou littéraires– ne peuvent sans doute pas aspirer à cette même «clarté inhabituelle» qui oppose les jeux réglés à «la vraie vie».
L’immersion fictionnelle: De l’imitation
Contrairement aux «univers artificiels» engendrés par les systèmes de règles, les univers de fiction apparaissent inévitablement plus confus; ils sont peuplés d’entités mimétiques qui renvoient à notre réalité complexe et convoquent ainsi un large éventail de connaissances «extraludiques». Il ne s’agit plus d’assimiler un système de règles autonome, mais de réactiver des représentations mimétiques qui évoquent des événements. Comme nous l’avons souligné plus haut, Marie-Laure Ryan associe l’immersion fictionnelle à l’activité de l’«imagination imaginante» (2007: 19). Pour Jean-Marie Schaeffer, toute fiction suppose des amorces mimétiques, des «clefs d’accès» qui miment certains aspects de notre rapport à la réalité et engendrent ainsi ce que l’auteur appelle l’immersion mimétique. Ce premier niveau de conceptualisation correspond à l’acception la plus courante de l’immersion, qui met l’accent sur la duperie sensorielle2Comme plusieurs chercheurs l’ont souligné, le fait de submerger les sens dans un univers représenté correspond le plus à la définition première du terme immersion, qui désigne l’action de plonger un corps dans un liquide. L’étude d’Oliver Grau (2003) explore cette logique à travers les exemples d’illusions totalisantes créées par l’homme depuis l’Antiquité. Dans cette acception, un dispositif immersif correspond à une configuration qui déploie un leurre sensoriel de manière à occulter sa nature factice.. Mais Schaeffer va plus loin en faisant loger les feintises langagières à la même enseigne: les actes illocutoires couchés sur papier seraient lus comme des assertions factuelles; ils imitent des situations de narration naturelle3«Par exemple, lorsque je lis la vie de Marianne, je n’ai accès à l’univers fictionnel que pour autant que je réactive la feintise ludique de Marivaux, c’est-à-dire pour autant que j’adopte la posture qui serait la mienne si une personne nommée Marianne me racontait sa vie». Pour Schaeffer, les feintises verbales peuvent engendrer une identification avec l’intériorité subjective d’un personnage, et même le narrateur dans le cadre de la fiction homodiégétique: «à moins que je ne m’identifie fictivement à Marianne elle-même racontant son histoire» (Schaeffer, 1999: 228).. Dans le cas des arts déjà mimétiques (selon la division classique), la feintise dépasse l’imitation des équivalents factuels; la nature mimétique du support permettrait d’induire des postures perceptives ou situationnelles qui s’apparentent aux postures «quotidiennes». Ainsi, le spectateur de cinéma ne perçoit pas seulement un film de fiction comme un document factuel; son appareil perceptuel est leurré, dans une certaine mesure, par la représentation. De la même manière, l’acteur de théâtre serait en mesure de se berner lui-même grâce aux gestes et aux paroles qu’il a intériorisés pour son rôle. La finalité de ce processus d’immersion mimétique est d’accéder à la modélisation de l’univers fictionnel; selon cette conception, le degré de saturation mimétique des leurres influe directement sur le sentiment de présence induit.
La théorie de Schaeffer insiste sur le caractère naturel des postures d’immersion expérimentées par les usagers. Mais pour l’auteur, le propre de la fiction réside dans l’établissement d’un cadre pragmatique: les feintises sont «encadrées» par des stratégies éditoriales ou des règles d’usage. Cet encadrement permet, à un niveau plus conscient, de limiter les effets des leurres; l’immersion fictionnelle se distingue «en ce que ses conséquences potentielles au niveau des croyances, au niveau moteur, voire au niveau actantiel, sont neutralisées par le cadre pragmatique de la feintise partagée –et cela même lorsque l’immersion fictionnelle est actantielle (telle celle de l’acteur)» (Schaeffer, 1999: 136). Bien sûr, les jeux d’imitation formelle de cadres pragmatiques factuels peuvent venir parasiter les croyances, et certaines pratiques artistiques ne semblent pas reposer sur un encadrement très net de la feintise4Schaeffer discute longuement du statut souvent plus alambiqué de la peinture ou de la photographie. Les travaux récents de Samuel Archibald montrent bien comment, dans le contexte de création collective qui s’épanouit sur le web, les «fictions férales» ne demandent qu’à s’échapper de l’enclos pour mieux engendrer la croyance.. Mais la fiction reposerait avant tout sur le découplage entre la réactivation d’un leurre, d’une part, et les effets potentiels d’autre part; Schaeffer envisage la feintise ludique partagée sous le signe d’un état mental scindé, qui perçoit l’objet de la représentation, et le cadre par la même occasion. Les germes de cette attitude se retrouvent déjà chez les animaux –les petits peuvent s’engager dans une lutte sans réaliser pleinement les séquences d’action–, mais l’une des conquêtes importantes de l’humanité se trouve, pour l’auteur, dans le développement effréné de feintises fictionnelles.
Le jeu vidéo est le lieu d’une tension intéressante entre les conceptions de l’immersion que nous avons mises de l’avant: d’un côté, on voudrait maximiser l’immersion mimétique avec le développement d’univers visuels et sonores tridimensionnels, d’interfaces naturelles qui captent les mouvements ou qui reconnaissent la voix dans une certaine mesure, afin de produire une expérience de première main plus réaliste, vers la «virtualisation de l’identité du joueur» entrevue par Schaeffer (et associée aux dispositifs de réalité virtuelle) (Schaeffer, 1999: 254). De l’autre, on veut préserver la «clarté inhabituelle» qui caractérise les expériences ludiques plus abstraites. Comment maintenir cette clarté lorsque les règles ne concernent plus seulement la manipulation d’accessoires abstraits, mais sont intégrées à des scénarios imaginaires complexes? Nous allons présenter quelques composantes d’un langage actantiel qui se développe actuellement dans la pratique vidéoludique et qui permet de projeter les usagers dans des situations fictives très complexes. Face à ces leurres toujours plus convaincants, le joueur ne doit pas simplement donner libre cours aux inclinaisons perceptuelles et motrices qui émergent en lui; il doit réapprendre à voir et à agir dans une large mesure.
Une posture naturelle
Comme le précisent Torben Grodal et Andreas Gregersen, l’interactivité dans le jeu vidéo repose sur un «arrimage» (mapping) entre une manipulation actuelle et une action dans l’univers virtuel qui se manifeste à l’écran (2009: 65-83). Plusieurs interfaces cherchent à créer une isomorphie motrice; on veut minimiser la distinction entre ces deux facettes, afin de favoriser l’immersion mimétique. Depuis les premiers temps de l’arcade, les concepteurs ont fabriqué des interfaces dédiées à une situation fictive particulière: éléments de guidage pour les avions et voitures, fusils, etc. Grâce à des interfaces onéreuses, les simulations automobiles (la série Gran Turismo, Polyphony Digital) ou aéronautiques (la série Flight Simulator, Microsoft) peuvent également aspirer à créer une isomorphie entre les manipulations actuelles et les actions concrétisées à l’écran. Avec la Wiimote, Nintendo a proposé en 2005 une interface plus versatile, qui permet de capter les mouvements de la main sur trois axes à l’aide d’un accéléromètre. Ses rivaux Sony et Microsoft ont emboîté le pas avec les systèmes de captation Move et Kinect, respectivement. Dans un jeu comme The Legend of Zelda: Skyward Sword (Nintendo, 2011), les mouvements effectués par le joueur avec la Wiimote sont transposés en mouvements d’épée avec une isomorphie et un synchronisme satisfaisant. Plus récemment, dans Mass Effect 3 (2012), l’usager peut diriger ses coéquipiers virtuels de vive voix, grâce au système de reconnaissance vocale intégré à Kinect. À la suite de Grodal et Gregerson, nous pourrions avancer que les concepteurs de jeu vidéo sont influencés par l’idéal d’un arrimage symbiotique, où le corps actuel de l’usager se confond avec le corps virtuel défini par les possibilités du dispositif technologique. Depuis les premiers outils technologiques associés à la réalité virtuelle, cette symbiose constitue une source de fascination intarissable.
En plus des dispositifs de captation, la création d’une feintise interactive naturelle implique une illusion perceptuelle anthropomorphe et malléable, où les gestes virtuels commandés par le joueur et leurs conséquences seront concrétisés de manière crédible et dynamique. Avec le jeu vidéo, l’immersion sensorielle connaît un développement important: non seulement les sens sont interpellés par des illusions audiovisuelles convaincantes, mais ces éléments sensibles évoluent en fonction des manipulations du joueur. L’engouement engendré par les jeux de tir à la première personne de id Software (Catacomb 3-D, 1992; Doom, 1993) repose sur le caractère anthropomorphe du point de vue, désigné par l’expression «première personne», qu’on retrouve depuis les débuts de l’histoire vidéoludique; ces jeux fascinent parce que leur système de visualisation est riche et s’adapte rapidement aux commandes effectuées par le joueur. Les avancées technologiques des moteurs 3D visent à parfaire la saturation mimétique des leurres dans une large mesure. Malgré des défauts de fabrication toujours évidents et autres traces de médiation, les jeux en 3D créent une forte sensation d’homologie perceptuelle. Selon Schaeffer, l’appareil perceptif est leurré même si le flux imagé ne provient pas d’un processus de captation; l’ostentation du caractère factice ne changerait pas fondamentalement la posture induite par ces feintises (Schaeffer, 1999: 248). D’autres effets viennent parfaire l’homologie, à la manière de l’ocularisation interne primaire mise de l’avant par François Jost (Gaudreault et Jost, 1990): tremblé qui mime la démarche de l’avatar, accoutumance progressive aux changements de luminosité, etc. La concrétisation des interactions de la poupée virtuelle contrôlée par le joueur avec l’environnement nécessite beaucoup de travail, et des budgets considérables sont consacrés à cette «mise en monde» complexe.
Le développement de cette posture audiovisuelle et actantielle de première main maximise l’immersion mimétique telle que conçue par Schaeffer. La malléabilité des leurres audiovisuels permet à ces derniers de réagir aux gestes concrets du joueur. Malgré une versatilité croissante, les interfaces «naturelles» actuellement disponibles ne peuvent mettre en jeu l’ensemble du corps. Au premier chef, l’illusion perceptuelle toujours plus convaincante ne peut être expérimentée de manière isomorphe; les «yeux» du joueur sont contrôlés par le truchement d’un levier analogique ou de la souris. De la même manière, la relation joueur-écran rend difficile l’implication des membres inférieurs, qui sont associés à un autre levier directionnel. Cependant, ces manipulations sont constantes et directes: déplacer les jambes ou le regard implique une pression constante sur les leviers, et le résultat de ces manipulations est concrétisé de manière synchrone. À la suite de Rune Klevjer, nous pourrions dire que l’arrimage est tangible, à défaut d’être isomorphe5Pour Klevjer, la tangibilité constitue l’un des grands attraits des univers fictionnels vidéoludiques. «[Tangibility] does not refer to that which can be physically touched and felt […], but that which can be interacted with in a manner that simulates physical interaction» (2006: 125).. Même lorsque l’arrimage est strictement ponctuel –lorsqu’il suffit d’appuyer succinctement sur un bouton pour ramasser/utiliser un item, par exemple–, le synchronisme initial entre la manipulation actuelle et l’action représentée est susceptible de «faire marcher» le joueur, qui a tendance à dire qu’il a effectué ces actions, même si c’est une poupée virtuelle partiellement autonome qui s’est acquittée de la tâche en grande partie.
La manipulation conjointe de tous ces arrimages exige beaucoup d’efforts au niveau de la coordination sensori-motrice. Il y a une parenté évidente entre les efforts fournis par le joueur et ceux qui se réalisent à l’écran; nous pourrions évoquer, suivant Roger Odin, un type de mise en phase6Pour Roger Odin, la mise en phase se définit par une homologie de relation entre le spectateur et l’écran d’une part, et les relations représentées à l’intérieur de l’univers diégétique d’autre part (2000).. Malgré une isomorphie motrice minimale, le synchronisme de la manipulation et la concrétisation audiovisuelle convaincante de cette dernière permet d’établir, selon Rune Klevjer, une interactivité tangible et réaliste. Le point d’achoppement de cette mise en phase entre joueur et action fictive semble survenir lorsque l’arrimage est localisé, c’est-à-dire fixé à un endroit précis sans pour autant opérer avec la même constance évoquée ci-haut. C’est le phénomène du QTE (quick time event): une directive visuelle apparaît à l’écran et le joueur doit appuyer sur la bonne commande dans un délai voulu afin de voir se déployer une action fictive dont le détail n’est pas toujours connu. Il y a toujours une parenté d’effort minimale entre les manipulations effectuées sur l’interface et l’effort représenté à l’écran, mais l’intervalle de performance est maintenant réduit à sa plus simple expression (avoir des réflexes adéquats, ou non). L’arrimage opère à la surface et ne laisse aucune possibilité d’expression. Les joueurs aguerris préfèrent immanquablement les agencements complexes d’arrimages, dans la mesure où ces derniers laissent place à une plus grande variabilité d’actualisation, et dans les cas les plus heureux, servent de levier pour le déploiement d’une certaine imagination tactique. Considérant cette préférence, l’adoption omniprésente du QTE comme segment de jouabilité disséminé dans les jeux d’action et d’aventure contemporains pourra surprendre. Elle signale l’attrait d’un spectaculaire très cinématographique dans un média qui se targue pourtant de donner le plus de place possible au joueur et à son idiosyncrasie actantielle. Elle annonce aussi l’ambiguïté immersive, qui retiendra sous peu notre attention.
Au-delà des configurations «naturelles» ou «réalistes», l’immersion dans la feintise vidéoludique ne serait plus du même acabit. Les perspectives largement surélevées ou distantes correspondent à une immersion «télescopique» (Ryan), à l’expérience d’un «micro-univers» (Klevjer). L’action qui s’effectue par le truchement d’icônes et de menus est associée à une interactivité externe (Ryan) et symbolique (Klevjer); ces dernières catégories supposent «un arrêt de l’horloge et une émersion temporaire de l’univers virtuel», alors que l’interactivité tangible constitue «un mode d’opération beaucoup plus immersif parce qu’il ne brise pas le rythme de l’action» (Ryan, 2006: 118)7«Computer games offer two ways of performing actions: selecting them from a menu, which requires a stopping of the clock and a temporary de-immersion from the virtual world, and performing them within the gameworld by manipulating control devices, a much-more immersive mode of operation, because it doesn’t break the flow of the action».. Mais de manière intéressante, ces pôles sont rarement expérimentés par le joueur, et les catégories s’entremêlent même dans les jeux qui aspirent visiblement à créer les configurations «réalistes» ou mimétiques que nous venons de mettre de l’avant.
Une posture alambiquée
Pour ouvrir le jeu, il faut souligner que l’interactivité «réaliste» se distingue de l’isomorphie motrice d’une manière fondamentale. Comme le remarquent Grodal et Gregersen, le dispositif vidéoludique se révèle idéal pour mettre en scène des actions exubérantes à partir de gestes «miniatures». Le plaisir du jeu vidéo repose en grande partie sur la «potentialisation de l’action» (augmentation of input) évoquée par Steven Poole (2000). Par rapport à l’isomorphie motrice, l’intérêt de la potentialisation des gestes est évident: les micro-gestes sont à terme beaucoup plus faciles à apprendre, à mettre en œuvre et à maîtriser. Elle permet au joueur de plonger dans des scénarios fictifs complexes et d’y séjourner de manière plus confortable que si son corps devait mimer tous les équivalents fictifs. Au-delà d’un premier lien symbolique entre une manipulation actuelle et une action représentée, cette potentialisation s’appuie sur une orchestration symbolique de l’action souvent très complexe, et ces configurations s’immiscent dans une grande variété de jeu.
Pour illustrer la complexité de la mise en scène vidéoludique, quelques conventions du jeu d’action contemporain suffisent. Alors que les moteurs parviennent à concrétiser pleinement les actions offensives (viser, tirer, attaquer) avec beaucoup de crédibilité, d’autres gestes n’obtiennent pas le même traitement. Pour se saisir de diverses ressources utiles à sa quête, le joueur doit simplement déplacer son avatar à proximité; l’action «ramasser» est couplée avec l’arrimage «marcher». Le geste est souvent concrétisé de manière partielle, ou alors il n’est confirmé que par un effet sonore évocateur, sans que la représentation des événements ne devienne ambigüe pour le joueur. Nous pourrions ici définir, suivant les canons de la narratologie, un arrimage elliptique, bien que cette ellipse fonctionnelle opère au sein d’une continuité spatio-temporelle apparente. La représentation de l’action prend parfois des chemins plus sinueux et opère par le truchement d’un menu de sélection où les diverses possibilités sont énoncées clairement par des icônes ou des verbes d’action. Cette ocularisation fonctionnelle se superpose à la vision anthropomorphe ou accapare l’ensemble de l’écran. Un arrimage symbolique complexe se met en place entre la sélection d’une icône ou d’un élément textuel et une action fictive –boire un élixir, réparer une pièce d’équipement, donner un ordre à des subalternes, etc. Encore ici, la concrétisation audiovisuelle pourra être minimale; un effet sonore suffit à évoquer le geste, et surtout à confirmer l’action. On pourrait être tenté de voir ces conventions comme des lacunes de mise en scène, justifiées par un manque de budget ou des impératifs technologiques, et, effectivement, ces facteurs peuvent jouer un rôle. Certains jeux se sont donnés pour mission de concrétiser pleinement les événements implicites: dans Breakdown (Namco, 2004), la poupée virtuelle se saisit des munitions ou autres objets utiles; dans Call of Cthulhu. Dark Corners of the Earth (Headfirst, 2005), la sélection du matériel médical en réserve donne lieu à une séquence animée où l’avatar se soigne. Mais ces exemples demeurent des exceptions; la mise en scène synthétique de l’action fait partie d’un répertoire de conventions où les concepteurs puisent sans mettre à mal l’immersion du joueur dans la feintise.
Cette orchestration complexe de l’interactivité cadre difficilement avec le principe de l’immersion mimétique. Peut-on affirmer que la sélection au sein de menus et la concrétisation partielle, voire abstraite, de l’action «imite» une posture actantielle naturelle, sinon celle d’un opérateur informatique? Malgré le caractère artificiel de ces éléments, il nous apparaît problématique de parler d’émersion aussitôt que le joueur opère par un menu de sélection. L’aspect systémique est imbriqué avec une fonction clairement définie dans la feintise, et stimule sans aucun doute «l’imagination imaginante»; le joueur comprend très bien que son avatar a saisi un objet ou utilisé ce dernier, même si la mise en scène est lacunaire. Ces «raccourcis» possèdent par ailleurs des avantages évidents: ils permettent de faire beaucoup plus, avec beaucoup moins d’efforts et de temps, et contribuent ainsi à rythmer l’expérience de manière idéale. Dans un système ludique qui suppose des centaines d’objets manipulés (la série The Elder Scrolls, Bethesda), ces «raccourcis» symboliques se révèlent essentiels à la feintise. Par ailleurs, une manifestation abstraite de l’action perd en réalisme pour mieux gagner en lisibilité; la clarté de la rétroaction favorise l’implication cognitive dans la feintise.
En plus de cette orchestration synthétique de l’action, un vaste répertoire de signes vient complexifier la situation immersive. Ces éléments se superposent aux leurres perceptifs pour renseigner le joueur sur les variations d’état pertinentes, pour guider son regard au sein des environnements, et ultimement pour appuyer ses choix actantiels. Dans le jeu d’action, une réalité aussi complexe que l’intégrité physique de l’avatar ou d’un antagoniste peut être évoquée par les fluctuations abstraites d’une ligne, ou encore de manière numérique. Par ailleurs, les concepteurs ont mis au point un système de guidage spatio-narratif élaboré: des effets de surlignage coloré ou de surbrillance font ressortir les éléments essentiels à la quête; la réticule de visée indique subtilement le caractère allié ou ennemi des personnages par un code de couleur (vert/rouge) ou d’autres symboles; un indicateur circulaire rouge envahit la surface de l’écran pour préciser l’origine d’une attaque tout juste essuyée par l’avatar corporel, et parfois l’évolution subséquente de la menace; une carte schématique située au bas de l’écran est mise à jour en temps réel avec de l’information pertinente (positions des antagonistes, objectifs). Encore ici, certains concepteurs ont voulu «naturaliser» ce répertoire signifiant: dans Assassin’s Creed (Ubisoft Montréal, 2007), toute l’information qui se superpose à l’écran serait fournie par l’animus, un dispositif fictif qui permet à l’avatar de plonger dans son passé génétique, et les effets de surlignage sont ramenés à l’intuition de l’avatar. Ailleurs, on justifie la présence de ces signes en se référant à l’intuition du personnage, ou alors à des outils technologiques/prothèses cybernétiques qui s’intègrent naturellement au cœur des univers de science-fiction, si communs depuis les premiers temps du jeu vidéo (System Shock 2, Irrational Games, 1999; Dead Space, Visceral Games, 2008).
La surenchère d’information qui se superpose à la vision anthropomorphe n’imite que dans un sens très lointain des situations de perception naturelle, et correspond au mieux à des situations de réalité augmentée. Est-ce que l’usager émerge de la feintise aussitôt qu’il jette un coup d’œil sur la représentation aérienne et abstraite de l’univers qui figure au coin de l’écran? Considérés individuellement, les éléments abstraits mis en scène par le système pourraient ne pas signifier grand-chose. Mais en conjonction avec les éléments figuratifs, ils acquièrent leur pleine signification. Les indicateurs de vitalité et de menace renvoient aux sens proprioceptifs et algiques de l’avatar; la transposition de ces sens sous forme audiovisuelle constitue un exemple inédit de focalisation interne. Cependant, l’information prodiguée dépasse clairement la portée de ces sens dans la plupart des cas, et la présentation abstraite confère à la mise en scène une grande lisibilité. Dans le cas des cartes schématiques, la focalisation est encore plus clairement étendue ou augmentée. Le point de vue fracturé entre plusieurs perspectives peut donner une impression de grande confusion pour le joueur néophyte. Le joueur expérimenté oscille entre toutes ces perspectives afin de comprendre les événements représentés et l’efficacité de sa performance au sein de cet univers. Assisté par cette mise en scène abstraite, c’est le regard qui est «potentialisé»; les indicateurs captent l’attention du joueur et facilitent la compréhension de la situation fictive.
Le corps irréalisé
Grâce au développement d’interfaces plus naturelles, le joueur est invité à «imiter» des séquences actantielles qu’il connaît déjà, ou alors à apprendre les gestes pertinents de manière «naturelle», en imitant un modèle exemplifiant qui se manifeste à l’écran. Contrairement aux interfaces plus mimétiques, l’assimilation des règles d’une interactivité tangible ou synthétique exige beaucoup d’efforts en début de partie, et le fonctionnement des indicateurs en surface nécessite aussi un apprentissage8Par ailleurs, cet apprentissage est facilité pour l’usager qui se «spécialise» dans un genre ou un autre. Les genres vidéoludiques ont tendance à adopter des configurations similaires pour gérer les manipulations fictives, ce qui favorise la «spécialisation» des joueurs selon leurs terreaux génériques de prédilection. Dominic Arsenault y voit l’incarnation plus typiquement vidéoludique de ce que Gérard Genette dénommait la «mémoire générique».. Le joueur ne doit pas seulement réapprendre à agir; à travers un ensemble de signes abstraits qui se superposent aux événements représentés, il doit aussi réapprendre à voir dans une large mesure. Pour Schaeffer, cette situation s’apparente à la posture de l’acteur qui apprend un rôle. Mais le répertoire du joueur n’est plus composé des gestes et de paroles usuelles; un nouveau vocabulaire largement artificiel s’impose. De plus, la feintise vidéoludique se limite rarement à une expérience anthropomorphe qui épouserait la position de l’avatar, de sorte qu’il nous apparaît problématique de déclarer, à la suite de Schaeffer: «Lara Croft, c’est moi» (1999: 254).
Schaeffer affirme ailleurs que «[l]a variabilité des modalités de la posture d’immersion est un des facteurs les plus importants de la richesse cognitive des fictions artistiques, puisqu’elle permet de créer des univers fictionnels à perspectives (ou points d’accès) multiples» (1999: 258). Depuis le contrôle plus ou moins fragmentaire d’un avatar, jusqu’aux perspectives abstraites qui se dessinent à la surface de l’écran, l’expérience vidéoludique constitue un exemple marquant de cette variabilité; plus encore qu’au cinéma, la conscience du joueur oscille entre une multitude de points de vue et de sources focales.
Alors qu’il aspire à une plus grande isomorphie, le dispositif vidéoludique est devenu un outil idéal pour jouer avec la phénoménologie du corps. À travers les principes de potentialisation et de concrétisation synthétique que nous avons mis de l’avant, l’usager peut faire beaucoup, avec très peu. La feintise vidéoludique permet de «monnayer» les efforts actuels dans des situations actantielles élaborées. Voilà sans doute ce qui explique en partie l’omniprésence de feintises qui fonctionnent sur le principe de la puissance et de la domination, comme le notent Grodal et Gregersen. Le corps vidéoludique est irréalisé pour mieux être maîtrisé, et maîtriser le monde qui l’entoure. Bien sûr, une domination trop facile à réaliser pour le joueur risque de s’essouffler rapidement; comme le soulignait déjà le modèle de Csikszentmihalyi, la zone la plus propice à un engagement optimal implique un équilibre précaire, où le joueur peut mettre en œuvre ses compétences face à un défi adéquat. Pour répondre à cet idéal d’engagement optimal, les concepteurs ont développé un système de gestion de la performance élaboré: sauvegarde fréquente de la progression du joueur, tutoriels dynamiques et indices en cours de route, ajustement plus ou moins tacite de la difficulté, etc. Autant d’aspects qui font de l’immersion vidéoludique, malgré toute la frustration et tous les revers essuyés par les joueurs, une expérience idéalisée, où le joueur sait qu’il pourra trouver cette même «clarté inhabituelle» qui caractérise ses excursions ludiques.
Bibliographie
Arsenault, Dominic. 2006. « En eaux troubles: lumière sur l’immersion ». Dire. La recherche à votre portée, vol. 16, no 1, Montréal : Université de Montréal, p. 46-49.
Csikszentmihalyi, Mihaly. 1975. Beyond Boredom and Anxiety. The Experience of Play in Work and Games. Washington : Jossey-Bass Publishers.
Csikszentmihalyi, Mihaly et Rick E. Robinson. 1990. The Art of Seeing. An Interpretation of the Aesthetic Encounter. Malibu : The J. Paul Getty Trust.
Gaudreault, André et François Jost. 1990. Le récit cinématographique. Paris : Nathan.
Grau, Olivier. 2003. From Illusion to Immersion. Cambridge : The MIT Press.
Grodal, Torben et Andreas Gregersen. 2009. « Embodiement and Interface », dans Bernard Perron et Wolf, Mark J. P. (dir.), The Video Game Theory Reader 2. New York : Routledge, p. 65-83.
Juul, Jesper. 2005. Half-Real. Video Games Between Real Rules and Fictional Worlds. Cambridge : The MIT Press.
Klevjer, Rune. 2006. « What is the Avatar ? Fiction and Embodiment in Avatar-Based Singleplayer Computer Games ». Université de Bergen.
Mäyrä, Frans et Laura Ermi. 2005. « Fundamental Components of Gameplay Experience: Analysing Immersion », 12 août 2013. <http://www.digra.org/dl/db/06276.41516.pdf>.
Odin, Roger. 2000. De la fiction. Bruxelles : De Boeck Université.
Poole, Steven. 2000. Trigger Happy. New York : Arcade Publishing.
Ryan, Marie-Laure. 2003. Narrative as Virtual Reality: Immersion and Interactivity in Literature and Electronic Media. Baltimore : The John Hopkins University Press, 416 p.
Ryan, Marie-Laure. 2006. Avatars of Story. Minneapolis, Minnesota : University of Minnesota Press, 296 p.
Ryan, Marie-Laure. 2007 [printemps]. « Jeux narratifs, fictions ludiques ». Intermédialités, no 9, p. 15-34.
Salen, Katie et Eric Zimmerman. 2003. Rules of Play. Game Design Fundamentals. Cambridge : The MIT Press.
Schaeffer, Jean-Marie. 1999. Pourquoi la fiction?. Paris : Seuil, 346 p.
Suits, Bernard. 2005. The Grasshopper: Games, Life and Utopia. Ontario : Broadview Press.
- 1«[T]here is a kind of lucidity and intelligibility about games. “Real life” is full of ambiguities and partially known information, but that is one of the reasons why games as designed systems are artificial and distinct from daily existence. In ordinary life it is rare to inhabit a context with such a high degree of artificial clarity» (Salen et Zimmerman, 2003: 123).
- 2Comme plusieurs chercheurs l’ont souligné, le fait de submerger les sens dans un univers représenté correspond le plus à la définition première du terme immersion, qui désigne l’action de plonger un corps dans un liquide. L’étude d’Oliver Grau (2003) explore cette logique à travers les exemples d’illusions totalisantes créées par l’homme depuis l’Antiquité. Dans cette acception, un dispositif immersif correspond à une configuration qui déploie un leurre sensoriel de manière à occulter sa nature factice.
- 3«Par exemple, lorsque je lis la vie de Marianne, je n’ai accès à l’univers fictionnel que pour autant que je réactive la feintise ludique de Marivaux, c’est-à-dire pour autant que j’adopte la posture qui serait la mienne si une personne nommée Marianne me racontait sa vie». Pour Schaeffer, les feintises verbales peuvent engendrer une identification avec l’intériorité subjective d’un personnage, et même le narrateur dans le cadre de la fiction homodiégétique: «à moins que je ne m’identifie fictivement à Marianne elle-même racontant son histoire» (Schaeffer, 1999: 228).
- 4Schaeffer discute longuement du statut souvent plus alambiqué de la peinture ou de la photographie. Les travaux récents de Samuel Archibald montrent bien comment, dans le contexte de création collective qui s’épanouit sur le web, les «fictions férales» ne demandent qu’à s’échapper de l’enclos pour mieux engendrer la croyance.
- 5Pour Klevjer, la tangibilité constitue l’un des grands attraits des univers fictionnels vidéoludiques. «[Tangibility] does not refer to that which can be physically touched and felt […], but that which can be interacted with in a manner that simulates physical interaction» (2006: 125).
- 6Pour Roger Odin, la mise en phase se définit par une homologie de relation entre le spectateur et l’écran d’une part, et les relations représentées à l’intérieur de l’univers diégétique d’autre part (2000).
- 7«Computer games offer two ways of performing actions: selecting them from a menu, which requires a stopping of the clock and a temporary de-immersion from the virtual world, and performing them within the gameworld by manipulating control devices, a much-more immersive mode of operation, because it doesn’t break the flow of the action».
- 8Par ailleurs, cet apprentissage est facilité pour l’usager qui se «spécialise» dans un genre ou un autre. Les genres vidéoludiques ont tendance à adopter des configurations similaires pour gérer les manipulations fictives, ce qui favorise la «spécialisation» des joueurs selon leurs terreaux génériques de prédilection. Dominic Arsenault y voit l’incarnation plus typiquement vidéoludique de ce que Gérard Genette dénommait la «mémoire générique».