
Google ha presentado una función impulsada por inteligencia artificial (IA) que permite crear contenido en formato podcast sin necesidad de grabaciones humanas. Se trata de los ‘Resúmenes de audio’, una herramienta integrada a la plataforma Gemini, que genera discusiones en audio a partir de documentos o archivos cargados por el usuario.
Esta tecnología se basa en la generación automática de voces y guiones por medio de sistemas conversacionales. En este caso, Gemini produce una conversación entre dos presentadores de IA que simulan una discusión sobre el contenido proporcionado por el usuario, sin intervención humana en la locución ni en el diseño del diálogo.
Según explicó la empresa, “los ‘Resúmenes de audio’ transforman tus documentos, diapositivas e incluso informes de ‘Deep Research’ en discusiones de audio estilo podcast”. La herramienta fue concebida para facilitar el procesamiento de información compleja mediante resúmenes auditivos generados en lenguaje natural.

De acuerdo con la compañía, para realizar el producto, “Gemini creará una discusión estilo podcast entre dos presentadores de IA que se lanzarán a una conversación profunda y animada basada en los archivos cargados. Los locutores resumirán el material, establecerán conexiones entre temas, participarán en un intercambio dinámico y proporcionarán perspectivas únicas”.
La herramienta está disponible, en esta primera fase, para suscriptores de los planes Gemini y Gemini Advanced en idioma inglés. Sin embargo, Google informó que próximamente se habilitará en más idiomas, aunque no especificó fechas concretas.
Los usos previstos para esta función abarcan desde la revisión de apuntes académicos hasta el resumen de informes corporativos o análisis de tendencias sectoriales.

La empresa destacó su utilidad para personas que requieren procesar información mientras realizan otras actividades. “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”, aseguran desde Google.
A diferencia de otros sistemas automatizados que generan únicamente transcripciones o extractos textuales, los ‘Resúmenes de audio’ de Gemini integran elementos de síntesis, organización narrativa y locución artificial, reproduciendo el ritmo y tono de una conversación entre humanos.
La herramienta se basa en NotebookLM, un asistente de lectura y análisis de textos lanzado por Google en 2023, que permite a los usuarios subir documentos y hacer preguntas sobre su contenido. Los ‘Resúmenes de audio’ representan una extensión de esa tecnología hacia formatos multimedia.

Con esta función, Google avanza en su estrategia de integrar capacidades generativas de voz dentro de sus plataformas de productividad, en un contexto donde la creación automatizada de contenido ha adquirido protagonismo en múltiples industrias.
El desarrollo de sistemas que generan locución artificial a partir de texto no es nuevo, pero la integración de esas capacidades en herramientas de consumo masivo representa un cambio en la forma en que se produce y distribuye información.
Hasta ahora, el proceso tradicional de creación de podcasts requería una serie de pasos manuales —desde la escritura del guion hasta la edición final—. Con funciones como los ‘Resúmenes de audio’, este flujo de trabajo puede realizarse de forma completamente automatizada.

Aunque la herramienta aún se encuentra limitada por idioma y acceso, su disponibilidad marca un hito en la automatización del formato podcast, en línea con una tendencia más amplia de producción de contenido sin intervención humana directa. Google promueve esta capacidad como una forma de “dar vida a tus ideas”, utilizando únicamente insumos textuales como punto de partida.
Por ahora, la función está disponible en la web y la aplicación móvil de Gemini. El contenido generado puede ser compartido o descargado para escucharse en distintos momentos. La plataforma no requiere conocimientos técnicos avanzados ni experiencia previa en producción de audio, lo que sugiere un posible impacto en el modelo actual de creación de contenidos sonoros.
Últimas Noticias
Descubre el horror de una familia víctima de imágenes de desnudos creadas con IA: una niña de 14 años resultó afectada
El caso impulsó cambios legales y abrió el debate sobre la protección infantil en el ámbito digital

iPhone 17 Pro y Pro Max: cuáles son sus precios en Argentina para noviembre de 2025
El precio de estos celulares puede variar según el distribuidor, la capacidad de almacenamiento y si la compra se realiza directamente con Apple
Así será el primer avión hipersónico del mundo propulsado por hidrógeno: volará a 14.701 km/h
Este avión no utiliza queroseno como combustible y se planea que despegue desde las instalaciones de la NASA

Ansiedad y depresión, las consecuencias de los niños al pasar tiempo frente a redes sociales, videojuegos y celulares
La incapacidad de controlar el impulso digital puede afectar el desarrollo emocional y social, según una investigación con más de 4.000 menores

Así es Charlotte, el prototipo que revolucionaría la exploración espacial con la construcción de casas 3D en la Luna
Con diseño innovador y tecnología de impresión tridimensional, el dispositivo busca utilizar materiales lunares para lograr los primeros hábitats autosuficientes, un avance que acerca la posibilidad de permanencia humana al satélite natural



