Toute la planète se souvient de ce 30 novembre 2022, lorsque la société OpenAI dévoila son robot conversationnel ChatGPT. Nouvelle révolution technologique, avènement des IA génératives… Génération de textes, d’images d’audio et balbutiements de production de vidéos avec des outils comme Pika, Runway, Pixverse…
Jusqu’à ce 15 février 2024. OpenAI crée l’événement avec la mise en ligne d’une dizaine de bandes-annonces de son nouveau modèle de « text-to-video » baptisé Sora. L’accueil de la communauté d’artistes IA est immédiat : Bienvenue dans le futur de la vidéo !
« Quelle (r) évolution ! Ça va tellement changer la donne dans le marketing, l’Entertainment, l’art numérique… Hollywood va en devenir fou. Il est temps de transformer les scénarios qui dorment dans nos tiroirs en prompts détaillés. La liberté de créer va reprendre le pouvoir sur l’argent ! »
Michaël Mourot, auteur et scénariste
Bon, ne nous emballons pas. Pour l’heure, Sora d’OpenAI n’est pas disponible, pas même en version bêta. Et même, si les bandes-annonces sont alléchantes, certains sont étonnés que l’on puisse obtenir une telle finesse avec des prompts aussi courts.
« Si n’importe qui peut produire des vidéos, de n’importe quel type, sans limites, ça va être le chaos en 24 h. Et surtout une année d’élections »
Jean-Philippe Timsits, expert digital.
D’ailleurs, OpenAI semble en avoir déjà pris conscience et anticipe les craintes que va susciter son nouvel outil, notamment en matière de deepfake. « Nous nous adresserons aux décideurs politiques, aux éducateurs et aux artistes du monde entier pour saisir leurs inquiétudes et déceler les applications bénéfiques de cette technologie naissante. Malgré des études et des tests poussés, il nous est impossible d’anticiper toutes les manières dont notre technologie sera employée ou détournée. C’est la raison pour laquelle nous considérons que l’apprentissage à travers l’expérience directe constitue un pilier fondamental dans le développement et la distribution de systèmes d’IA de plus en plus fiables avec le temps » souligne OpenAI sur son site de présentation.
Du point de vue technique, certains se posent des questions « Comment DALL E 3 peut paraître parfois si artificiel au point de laisser transparaître clairement son côté IA et Sora sembler si réaliste ? » Une volonté délibérée d’OpenAI ? Un temps de développement plus important ? Un DALL-E 4 sur le point d’être lancé ? Il y a de fortes chances que Sora ait été entraînée sur d’autres datasets, probablement UnrealEngine 5.
En attendant de connaître les modalités (intégré ou non dans ChatGPT comme DALL-E) et surtout le prix de l’outil, profitons de ces premières bandes-annonces, époustouflantes, bluffantes, incroyables d’ores et déjà disponibles.
Zoé HITZA