Nouvelles De Texte à Discussion : La Nouvelle Fonctionnalité de Gemini Transforme les Rapports en Podcasts en Quelques Secondes

De Texte à Discussion : La Nouvelle Fonctionnalité de Gemini Transforme les Rapports en Podcasts en Quelques Secondes

24 mars 2025, 13:36

Google a fusionné deux technologies clés — Deep Research et Audio Overviews — pour créer des podcasts audio dynamiques. Désormais, les utilisateurs peuvent transformer des rapports analytiques complexes en conversations engageantes entre des hôtes virtuels, ouvrant de nouvelles possibilités d'apprentissage et de travail avec l'information.

La fonctionnalité Deep Research, lancée précédemment, permet à Gemini d'analyser d'énormes quantités de données provenant d'internet et de générer des rapports détaillés sur un sujet donné. À partir d'aujourd'hui, cet outil inclut désormais l'option Générer un aperçu audio, qui transforme des faits secs en un podcast interactif. Une fois la recherche terminée, l'utilisateur sélectionne le bouton approprié, et Gemini génère un dialogue entre deux « hôtes » IA discutant des principales conclusions dans un format de conversation animé.

La technologie de résumé vocal a fait ses débuts en septembre 2023 dans l'application NotebookLM, conçue pour l'analyse de documents. Au cours de l'année et demie écoulée, Google a considérablement amélioré cette fonctionnalité : les utilisateurs peuvent désormais influencer le script du dialogue, poser des questions aux intervenants virtuels et même changer le style de la présentation du contenu. En mars 2025, le service sera disponible dans Gemini pour tout le monde — tant pour les utilisateurs gratuits que pour les abonnés.

Alors que le système ne fonctionnait auparavant qu'avec des textes courts et des présentations, l'intégration avec Deep Research permet désormais de traiter des recherches à grande échelle — allant des rapports climatiques aux analyses de marché. Les experts notent que la transition des résumés textuels monotones aux podcasts interactifs résout le problème de la « fatigue informationnelle ». Les deux interlocuteurs IA simulent une discussion, mettant en évidence des contradictions, soutenant des arguments avec des exemples, et ajoutant même des éléments narratifs. Selon les représentants de Google, ce format améliore la rétention des données de 40 % par rapport aux méthodes traditionnelles.

À la fin de 2025, Google prévoit d'ajouter la possibilité de choisir les voix des hôtes, d'ajuster la durée des épisodes et d'insérer des questions générées par les utilisateurs en temps réel. La nouvelle ère du contenu audio personnalisé, où chaque demande devient un spectacle unique, a déjà commencé.

Le post a été traduit Afficher l'original (EN)

Arkadiy Andrienko

Auteur de nouvelles

As a tech journalist at VGTimes, I'm equally comfortable discussing the latest GPUs and diving deep into the intricacies of classic RPGs. Writing about games and hardware since 2018, my background in sound engineering has given me a keen ear for the nuances of audio technology, and I'm always on the lookout for the next groundbreaking innovation in gaming hardware. When I'm not writing about tech, you'll likely find me exploring the post-apocalyptic wasteland of Fallout, managing a colony in RimWorld, or commanding armies in Hearts of Iron IV. For me, gaming is more than just a hobby; it's a passion that fuels my creativity and keeps me connected to the ever-evolving world of technology.

Nouvelles Matériel et Technologies Google

Commentaires 0