Les besoins de rationalisation des coûts et des moyens de production en Europe et dans le monde amènent les services de médias audiovisuels à avoir de plus en plus recours à de l'automatisation au cours de leurs phases de production comme de post-production. La notion d’automatisation fait en elle-même débat dans la mesure où elle est très mal définie : la plupart des dictionnaires indiquent un laconique « Fait d’automatiser ». Il serait plus juste de la qualifier de « stratégie qui vise, par l'emploi de méthodes et de moyens normalisés et optimisés de technologies, à la réduction de l'intervention de l'Homme dans la réalisation d'une opération ou d'une série d'opérations ». Une tâche automatisée relève ainsi de l'ajout de systèmes informatique, robotique,... dans le but de se substituer à l'Homme – réaliser le montage d’un produit audiovisuel par un algorithme, ou remplacer 3 cadreurs par un seul qui pilote 3 caméras à distance est une tâche automatisée. En ce sens, l’automatisation est actuellement portée par les constructeurs de matériel audiovisuel professionnel à travers des systèmes plus ou moins complexes. La conception de ces outils d'automatisation du « workflow » demeur e partielle et aucun système global unifié n’est actuellement proposé. De ce fait, les chaines de télévision associent équipements traditionnels et automates. Le workflow désigne, dans le jargon de l'audiovisuel, l’intégralité de la chaîne de production de l’idée au produit final archivé au sens de (Leleu-Merviel, 1997).
La production d'images et de sons s'est toujours accompagnée d'instruments plus ou moins élaborés (il est difficile de réaliser un film sans caméra). Cependant, le contrôle de cet outil, la prise de décision quant à son utilisation, change d’entité avec l’automatisation. Le matériel est le même, mais son utilisation est gérée, commandée par un automate. Selon (Arendt, 1958), l'action d'un agent humain est imprévisible, car elle est inextricable d'un réseau de relations humaines. Sans pour autant lui enlever son appellation d'artefact, il est nécessaire de s'interroger sur la nature d'un produit qui n'émerge plus uniquement des processus sociotechniques, mais sur des règles d'inférences d'une unité de calcul informatique. Aussi se pose la question de l'impact de cette diminution de l'intervention humaine dans la production audiovisuelle sur sa réception par le spectateur. Un produit audiovisuel est un artefact à but communicationnel, créé par des humains pour des humains. En effet, les choix des acteurs – au sens de (Latour, 2005) – de la création d’une l’œuvre audiovisuelle ont un impact (variable mais bien présent) sur ce dernier. Si le type de produit (fiction, publicité, émission de divertissement, journal télévisé,...) va influencer les modalités de réception de ce produit – ce que (Jauss, 1978) appelle l’Horizon d’attente – les paramètres de conception et de réalisation du produit doivent eux aussi rentrer en compte. Il est probable que l’automatisation des systèmes de production audiovisuelle, entraînant un formatage plus fort du produit à créer, impacte le sens construit par le spectateur. Toutefois demeure la question de l’importance de chaque maillon de la chaîne de production : quelle est la signifiance apportée par l’humain vis-à-vis d’un automate dans la production de l’œuvre ?
L'analyse des processus sociotechniques en régie de production et des acteurs du programme sur le plateau, comparée aux nouvelles méthodes de travail d'un « workflow » automatisé, permet de relever des différences dans la conception du produit. Ces différences, dans l'esprit des travaux de (Latour, 2005) seront soulignées par les agents contribuant à la création du produit eux-mêmes. Ainsi, la méthode permet de déceler des finesses qu'une simple comparaison des tâches à effectuer ne permet pas. Par la suite la mise en parallèle avec un test d'impact de plusieurs versions d'un même événement télévisuel (traditionnelle et automatisée) sur le public permet au chercheur de faire le lien entre modification d'un réseau d'acteurs de la chaîne de produit et sens construit par le spectateur.
Dans le cadre de cette étude, une captation multi-caméra et à plusieurs systèmes de captation a été mise en place. Le sujet filmé relevait de parenthèses musicales lors d'une remise de diplômes à l'Université de Valenciennes. Trois systèmes ont été utilisés en parallèle :
- Un système “témoin”, mobilisant une régie professionnelle d'une vingtaine de personnes, étudiants de master audiovisuel de l'Université de Valenciennes ;
- Un système “semi-automatisé”, utilisant une régie miniaturisée pour une personne (réalisateur professionnel) ainsi que des caméras robotisées pilotées à distance par un second opérateur ;
- Un système “mono”, consistant en une caméra filmant le sujet en plan large fixe.
Par la suite, les encadrants de l'équipe “standard” et les intervenants de l'équipe “semi-automatisée” ont été interrogés sur la préparation et le déroulement de la captation dans leurs régies respectives. Ces résultats ont été croisés avec une étude statistique de l'utilisation des différentes caméras et des réalisations sur les séquences filmées, reconstitués à partir de l’enregistrement des réalisations ainsi que de chaque caméra individuellement.
Les premiers résultats ont souligné une préparation plus forte de la réalisation et un formatage des angles de caméras pour la régie semi-automatisée par rapport à la régie standard. Du fait que les cadres soient mémorisés par le système de contrôle des caméras robotisées, ces derniers sont peu appelés à évoluer au fil du temps, simplifiant les échanges entre réalisateur et opérateur des caméras. À l’inverse, les valeurs de plans du système témoin sont plus fluctuantes. Malgré cette différence, les valeurs employées par les deux systèmes sont globalement identiques quant au découpage de l’espace pour le réalisateur.
Dans la continuité, un test d'impact des séquences filmées sur le public sera effectué selon une adaptation de la méthode Média-Repères (Labour, 2011), qui a pour objectif de diagnostiquer l'impact d'un extrait vidéo sur le public par l'identification des construits de sens chez la personne. La méthode permettra de distinguer des registres de sens construit chez le spectateur afin de discriminer les apports de chaque système de captation en fonction de leur impact sur le public. En particulier, une partie du protocole se fondra sur l'analyse des émotions du spectateur lors du visionnage via le procédé SYM (Yvart et al., 2016). Les résultats issus de cette expérimentation prochaine seront présentés lors du congrès.
Des améliorations sont prévues pour la prochaine étude des systèmes de captations, où la récolte de traces se verra renforcée afin de d'améliorer la qualité de la réminiscence des acteurs ainsi que de d'identifier des nouveaux paramètres quant à l'impact de l'automatisation chez le spectateur. De plus, il sera possible de tester les différents systèmes de captation successivement (ce qui évite les contraintes de placements des multi captations) et pourra se faire sur les mêmes équipements, mais utilisés soit par des humains, soit pilotés par des machines.