De Texte à Discussion : La Nouvelle Fonctionnalité de Gemini Transforme les Rapports en Podcasts en Quelques Secondes

Google a fusionné deux technologies clés — Deep Research et Audio Overviews — pour créer des podcasts audio dynamiques. Désormais, les utilisateurs peuvent transformer des rapports analytiques complexes en conversations engageantes entre des hôtes virtuels, ouvrant de nouvelles possibilités d'apprentissage et de travail avec l'information.
La fonctionnalité Deep Research, lancée précédemment, permet à Gemini d'analyser d'énormes quantités de données provenant d'internet et de générer des rapports détaillés sur un sujet donné. À partir d'aujourd'hui, cet outil inclut désormais l'option Générer un aperçu audio, qui transforme des faits secs en un podcast interactif. Une fois la recherche terminée, l'utilisateur sélectionne le bouton approprié, et Gemini génère un dialogue entre deux « hôtes » IA discutant des principales conclusions dans un format de conversation animé.
La technologie de résumé vocal a fait ses débuts en septembre 2023 dans l'application NotebookLM, conçue pour l'analyse de documents. Au cours de l'année et demie écoulée, Google a considérablement amélioré cette fonctionnalité : les utilisateurs peuvent désormais influencer le script du dialogue, poser des questions aux intervenants virtuels et même changer le style de la présentation du contenu. En mars 2025, le service sera disponible dans Gemini pour tout le monde — tant pour les utilisateurs gratuits que pour les abonnés.
Alors que le système ne fonctionnait auparavant qu'avec des textes courts et des présentations, l'intégration avec Deep Research permet désormais de traiter des recherches à grande échelle — allant des rapports climatiques aux analyses de marché. Les experts notent que la transition des résumés textuels monotones aux podcasts interactifs résout le problème de la « fatigue informationnelle ». Les deux interlocuteurs IA simulent une discussion, mettant en évidence des contradictions, soutenant des arguments avec des exemples, et ajoutant même des éléments narratifs. Selon les représentants de Google, ce format améliore la rétention des données de 40 % par rapport aux méthodes traditionnelles.
À la fin de 2025, Google prévoit d'ajouter la possibilité de choisir les voix des hôtes, d'ajuster la durée des épisodes et d'insérer des questions générées par les utilisateurs en temps réel. La nouvelle ère du contenu audio personnalisé, où chaque demande devient un spectacle unique, a déjà commencé.
-
Jeux mobiles sur bureau : Google lance le portage automatique de jeux sur PC
-
Chat Au Lieu de Photoshop : Le Flash Gemini 2.0 de Google Apprend à Éditer des Images par le Dialogue
-
L'IA de Google apprend à analyser le monde à travers l'appareil photo d'un smartphone
-
Google commence l'élimination mondiale de l'Assistant au profit de Gemini
-
Le département de la Justice des États-Unis exige toujours que Google vende le navigateur Web Chrome