La mejor herramienta de Google para hacer un podcast sin humanos: solo necesitarás la IA Gemini y tu información

Esta función transforma documentos, diapositivas e incluso informes de Deep Research en discusiones de audio estilo podcast sin necesidad de hacer la locución

Guardar
Los Resúmenes de audio simulan
Los Resúmenes de audio simulan una conversación entre voces sintéticas sin intervención humana. REUTERS/Dado Ruvic/Illustration/File Photo

Google ha presentado una función impulsada por inteligencia artificial (IA) que permite crear contenido en formato podcast sin necesidad de grabaciones humanas. Se trata de los ‘Resúmenes de audio’, una herramienta integrada a la plataforma Gemini, que genera discusiones en audio a partir de documentos o archivos cargados por el usuario.

Esta tecnología se basa en la generación automática de voces y guiones por medio de sistemas conversacionales. En este caso, Gemini produce una conversación entre dos presentadores de IA que simulan una discusión sobre el contenido proporcionado por el usuario, sin intervención humana en la locución ni en el diseño del diálogo.

Según explicó la empresa, “los ‘Resúmenes de audio’ transforman tus documentos, diapositivas e incluso informes de ‘Deep Research’ en discusiones de audio estilo podcast”. La herramienta fue concebida para facilitar el procesamiento de información compleja mediante resúmenes auditivos generados en lenguaje natural.

Google automatiza la creación de
Google automatiza la creación de contenido sonoro con su herramienta de Resúmenes de audio. (Imagen Ilustrativa Infobae)

De acuerdo con la compañía, para realizar el producto, “Gemini creará una discusión estilo podcast entre dos presentadores de IA que se lanzarán a una conversación profunda y animada basada en los archivos cargados. Los locutores resumirán el material, establecerán conexiones entre temas, participarán en un intercambio dinámico y proporcionarán perspectivas únicas”.

La herramienta está disponible, en esta primera fase, para suscriptores de los planes Gemini y Gemini Advanced en idioma inglés. Sin embargo, Google informó que próximamente se habilitará en más idiomas, aunque no especificó fechas concretas.

Los usos previstos para esta función abarcan desde la revisión de apuntes académicos hasta el resumen de informes corporativos o análisis de tendencias sectoriales.

Gemini convierte archivos de texto
Gemini convierte archivos de texto en discusiones auditivas con tecnología de inteligencia artificial. Google Gemini Canvas

La empresa destacó su utilidad para personas que requieren procesar información mientras realizan otras actividades. “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”, aseguran desde Google.

A diferencia de otros sistemas automatizados que generan únicamente transcripciones o extractos textuales, los ‘Resúmenes de audio’ de Gemini integran elementos de síntesis, organización narrativa y locución artificial, reproduciendo el ritmo y tono de una conversación entre humanos.

La herramienta se basa en NotebookLM, un asistente de lectura y análisis de textos lanzado por Google en 2023, que permite a los usuarios subir documentos y hacer preguntas sobre su contenido. Los ‘Resúmenes de audio’ representan una extensión de esa tecnología hacia formatos multimedia.

Los Resúmenes de audio simulan
Los Resúmenes de audio simulan una conversación entre voces sintéticas sin intervención humana. (Imagen Ilustrativa Infobae)

Con esta función, Google avanza en su estrategia de integrar capacidades generativas de voz dentro de sus plataformas de productividad, en un contexto donde la creación automatizada de contenido ha adquirido protagonismo en múltiples industrias.

El desarrollo de sistemas que generan locución artificial a partir de texto no es nuevo, pero la integración de esas capacidades en herramientas de consumo masivo representa un cambio en la forma en que se produce y distribuye información.

Hasta ahora, el proceso tradicional de creación de podcasts requería una serie de pasos manuales —desde la escritura del guion hasta la edición final—. Con funciones como los ‘Resúmenes de audio’, este flujo de trabajo puede realizarse de forma completamente automatizada.

Los Resúmenes de audio simulan
Los Resúmenes de audio simulan una conversación entre voces sintéticas sin intervención humana. (Imagen Ilustrativa Infobae)

Aunque la herramienta aún se encuentra limitada por idioma y acceso, su disponibilidad marca un hito en la automatización del formato podcast, en línea con una tendencia más amplia de producción de contenido sin intervención humana directa. Google promueve esta capacidad como una forma de “dar vida a tus ideas”, utilizando únicamente insumos textuales como punto de partida.

Por ahora, la función está disponible en la web y la aplicación móvil de Gemini. El contenido generado puede ser compartido o descargado para escucharse en distintos momentos. La plataforma no requiere conocimientos técnicos avanzados ni experiencia previa en producción de audio, lo que sugiere un posible impacto en el modelo actual de creación de contenidos sonoros.