Microsoft a révélé qu’il avait créé une annonce d’une minute pour son matériel Surface Pro et Surface Ordinktop en utilisant une IA générative. Mais il y a une torsion: il a publié l’annonce il y a près de trois mois, et personne ne semblait remarquer les éléments de l’IA.
L’annonce, qui a été mise en ligne sur YouTube le 30 janvier, n’est pas entièrement composée de contenu généré. Dans un article de blog de Microsoft Design publié mercredi, le directeur principal des communications de conception Jay Tan admet que «l’hallucination occasionnelle de l’IA ferait sauver la tête», ce qui signifie que les créateurs ont dû corriger une partie de la sortie de l’IA et l’intégrer à de vraies images.
“Lorsqu’il a décidé de quels tirs dans l’annonce devaient être générés par l’IA, l’équipe a déterminé que tout mouvement complexe tel que les gros plans de mains tapant sur les claviers devait être tourné en direct”, explique Tan. «Cependant, les prises de vue qui ont été des coupes rapides ou avec un mouvement limité étaient privilégiées pour la co-création avec des outils d’IA génératifs.»
Microsoft n’a pas spécifié exactement quels tirs ont été générés à l’aide de l’IA, bien que Tan ait détaillé le processus. Les outils d’IA ont d’abord été utilisés pour générer «un script convaincant, des storyboards et un deck de pitch». L’équipe de Microsoft a ensuite utilisé une combinaison d’invites écrites et d’échantillonnage d’images pour obtenir un chatbot pour générer des invites de texte qui pourraient être introduites dans des générateurs d’images. Ces images ont été itérées plus loin, éditées pour corriger les hallucinations et autres erreurs, puis introduites dans des générateurs de vidéos comme Hailuo ou Kling. Ce sont les seuls outils d’IA spécifiques nommés par Tan, avec les chatbots et les générateurs d’images non spécifiés.
«Nous avons probablement parcouru des milliers d’invites différentes, ciselant peu de temps à peu jusqu’à peu jusqu’à ce que nous voulions. «Cela vient d’être implacable.» Cela fait que le processus sonne comme plus de travail qu’il en aurait pu être autrement, mais le concepteur visuel Brian Townsend estime que l’équipe «a probablement économisé 90% du temps et du coût que cela prendrait généralement».
Malgré le fait que la vidéo soit en ligne depuis près de trois mois, il y a peu de signe que quiconque a remarqué la sortie de l’IA jusqu’à présent. L’annonce a un peu plus de 40 000 vues sur YouTube au moment de la rédaction, et aucun des meilleurs commentaires ne suppose que la vidéo a été produite à l’aide de l’IA.
Sachant que l’IA était impliquée, il est assez facile de deviner où – des photos de notes de rencontre qui n’étaient clairement pas écrites à la main, un pot Mason qui est gêné, le disque de l’IA révélateur – mais sans savoir à le chercher, il est clair que beaucoup de téléspectateurs ne pouvaient pas repérer la différence. Les coupes rapides de l’annonce aident à cacher les défauts de la sortie AI, mais suggèrent que dans les bonnes mains, les outils d’IA sont désormais assez puissants pour passer inaperçus.