En 2023, le podcast a séduit 464 millions d’auditeurs. Une audience qui devrait encore croître de 50 millions d’ici la fin de l’année, et les projections pour 2025 sont prometteuses. Le format audio connaît un succès fulgurant, une tendance que personne n’ignore, pas même Elevenlabs. Leader du text-to-speech, ce dernier propose désormais de générer des voix lisant vos textes, documents ou sites Web de manière fluide et intelligible. Une avancée technologique notable. Mais l’intérêt grandissant pour le podcast a aussi attiré l’attention d’un poids lourd : Google.
Il y a quelques mois, la firme de Mountain View a dévoilé son outil de prise de notes basé sur un large language model (LLM). Son lancement est resté discret, éclipsé par des acteurs comme OpenAI qui dominaient l’attention. Mais Google n’avait pas encore joué toutes ses cartes. L’entreprise vient de révéler une nouvelle fonctionnalité nommée Audio Overview.
Avec cette nouvelle fonctionnalité, n’importe quel texte peut se transformer en podcast. Vous pensez peut-être : « Elevenlabs propose déjà cela ! » Certes, mais… laissez-moi vous présenter l’innovation apportée par Gemini. Grâce à NotebookLM, il est possible d’intégrer différentes sources : des documents PDF, des textes, des sites Web, voire de connecter directement votre Google Drive. C’est ici que la véritable magie entre en jeu.
NotebookLM : un podcast sur mesure, partout, tout le temps
C’est une réalité incontournable. Fini les lectures fastidieuses de rapports. Désormais, vous les écoutez où et quand vous le souhaitez : en voiture, pendant une séance de sport, ou même en cuisinant. Avec cette fonctionnalité, vos documents prennent vie. En cliquant simplement sur « générer », deux animateurs IA entament une discussion dynamique, résument les points clés, tissent des liens entre les sujets, rendant le contenu bien plus accessible. Un mini-podcast, à portée de clic.
Que vous soyez créateur de contenu, étudiant ou professionnel débordé, Audio Overview devient un atout majeur pour optimiser votre temps. Un rapport de 30 pages se retrouve condensé en quelques minutes d’audio. Un dossier complexe devient une écoute agréable lors d’une balade à vélo. Même un site web intéressant se transforme en conversation audio enrichissante.
En un clic, un podcast est généré. Mais là où NotebookLM se démarque de la concurrence, c’est en proposant un podcast avec deux interlocuteurs virtuels au micro ! Contrairement à d’autres outils comme Elevenlabs, ces (AI)nimateurs ne se contentent pas de réciter le texte fourni. Grâce à Gemini, l’intelligence artificielle de Google, l’audio produit aborde votre contenu sous un angle inédit, donnant naissance à un échange créatif et intelligent. L’IA démontre ainsi sa capacité à comprendre en profondeur les textes soumis et à simplifier les écrits les plus complexes de manière accessible. Le résultat est saisissant : les deux « voix » animant la discussion paraissent incroyablement réalistes.
Pour tester, j’ai soumis le plan de mon prochain épisode de podcast, axé sur la thématique suivante : « Réalité vs fiction : l’IA de l’ère ChatGPT correspond-elle à celle du cinéma ? » Le résultat a dépassé mes attentes. Les deux « voix » virtuelles ont mené une discussion posée, sans stress ni oublis (enfin, presque… mais nous y reviendrons). L’angle d’approche des différents textes soumis s’est révélé captivant. L’IA a imaginé une conversation autour de ma thématique, développant un contenu unique et surprenant, bien différent de ce que j’avais initialement envisagé.
Les petits bémols à connaître
Cependant, NotebookLM, encore en phase bêta, présente quelques limites. Comme toutes les IA génératives, il est sujet aux hallucinations, potentiellement injectant des erreurs et des contenus inappropriés dans vos podcasts. Autre inconvénient : les audios générés sont uniquement disponibles en anglais. Google travaille déjà sur l’ajout d’autres langues, dont le français.
Mais il existe une solution simple. Avec des outils comme Elevenlabs ou Lipitt, la traduction de l’audio s’effectue en quelques secondes, rendant ainsi votre podcast multilingue, prêt pour un public international. Aucune barrière à la diffusion de votre contenu !
Avec NotebookLM, l’avenir de l’information se décline en version audio. Google NotebookLM, Google démontre une fois de plus son avance dans la manière d’accéder à l’information. Que vous soyez adepte de la lecture ou de l’écoute, cette fonctionnalité s’annonce comme une révolution.
Personnellement, c’est déjà un coup de cœur !
J’anime mon propre podcast et le choix est simple. Soit passer par un studio d’enregistrement pour 100 euros de l’heure, soit acheter tout le matériel. Un bon micro coûte au minimum 80 euros. À cela s’ajoutent un programme de traitement des fichiers sources, des heures de travail, et quelques nuits blanches.
Steve VOUILLOZ (Podcasts)