
La integración de inteligencia artificial en los servicios de Google continúa avanzando con pasos firmes, y ahora Google Docs incorpora una función largamente esperada: la lectura en voz alta a través de Gemini. A partir de este mes, el popular procesador de textos permite a los usuarios transformar cualquier documento en inglés en un archivo de audio de manera sencilla y con un grado de personalización avanzada, marcando un nuevo paradigma en la accesibilidad y la experiencia de edición en la nube.
Con la llegada de esta funcionalidad, Google Docs da un salto significativo en la interacción entre usuario y documento. Ahora, gracias a Gemini, es posible escuchar el contenido textual reproducido mediante voces artificiales de notable naturalidad. Se pueden escoger diferentes estilos y velocidades, adecuando la narración según las necesidades o el propósito del texto. Entre las opciones de entonación que Google ha puesto a disposición destacan perfiles como Narrador, Educador, Profesor, Persuasor, Explicador, Coach y Motivador, cada uno orientado a adaptarse al tono y la intención del documento original.
PUBLICIDAD
Por ahora, esta innovación está limitada a documentos en inglés y en la versión de escritorio web, con un despliegue progresivo que arrancó esta semana y que se extenderá durante las siguientes. La compañía no ha especificado cuándo ni si planea habilitar la función en otros idiomas o plataformas móviles. El acceso a la herramienta está reservado a usuarios que cuenten con planes Workspace comerciales, empresariales o educativos, así como a suscriptores de los servicios AI Pro y Ultra, y quienes dispongan del complemento Gemini Education Premium.

Cómo usar la voz de Gemini en Google Docs
El proceso para activar la lectura en voz alta es intuitivo y no requiere conocimientos técnicos avanzados. Dentro de la versión web de Google Docs, basta con dirigirse al menú de herramientas, donde la opción de audio se encuentra situada entre la entrada por voz y el acceso directo a Gemini. Al seleccionarla, aparecerá en la pantalla un reproductor con formato de pastilla que muestra la duración total del audio generado. El usuario puede controlar la reproducción, pausar o adelantar, además de escoger la voz y la velocidad que se ajusten mejor a sus preferencias.
PUBLICIDAD
Un detalle relevante es que el sistema de voces de Gemini no se limita a ofrecer un simple lector automático, sino que proporciona una experiencia variada y personalizable. Esta posibilidad hace que la narración no solo resulte útil para la accesibilidad, sino también para dar un enfoque más profesional o emocional a los contenidos, dependiendo de si se prefiere un tono pedagógico, motivacional o simplemente informativo.
Otra característica destacada es la capacidad de insertar botones de audio en puntos específicos del documento, lo que facilita que cualquier persona con acceso pueda escuchar el fragmento correspondiente sin necesidad de recorrer el texto completo. Esta opción se gestiona desde el menú de “Insertar”, eligiendo la función de botones de audio y después “Listen to tab”, aunque de momento está disponible únicamente en inglés.
PUBLICIDAD

Expertos y plataformas especializadas como 9to5Google han valorado muy positivamente la nueva función, subrayando la utilidad que representa para revisar y detectar errores en un texto, o simplemente para consumir información de un modo más eficiente en situaciones donde no es posible leer directamente. El despliegue paulatino responde al objetivo de afinar la experiencia y recoger sugerencias de usuarios reales antes de considerar futuras ampliaciones.
La apuesta por la integración de inteligencia artificial generativa no se detiene aquí. Paralelamente, Google Docs en Android ha introducido la capacidad de generar imágenes dentro de los documentos, ampliando así las opciones para añadir contenido visual atractivo. Estas novedades siguen la tendencia de otros productos de la compañía, como NotebookLM, aplicación basada en IA que ha revolucionado la creación de podcasts a partir de PDFs y otros archivos.
PUBLICIDAD
En definitiva, la opción de lectura en voz alta mediante Gemini refuerza la posición de Google Docs como una plataforma de edición avanzada, donde la inteligencia artificial no solo ayuda a crear y organizar texto, sino también a mejorar la accesibilidad, la revisión y la creatividad de los usuarios. El futuro cercano apunta a una convivencia más fluida entre palabras, voz e imagen dentro del entorno laboral y educativo.
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
La IA de Elon Musk destruyó una sociedad virtual en 96 horas, mientras que las de Google y Anthropic lograron mantener la paz
Al poner a Grok, Gemini y Claude a planificar recursos y aplicar normas en sociedades virtuales, los investigadores hallaron que el diseño de seguridad condiciona la convivencia, con resultados opuestos entre xAI y sus rivales

Westcol, de subir videos de Minecraft a entrevisar a De la Estrpilla, Uribe y Petro
El streamer colombiano empezó en 2015 en YouTube y hoy tiene un modelo de negocio que incluye un sello discográfico

Alerta para hinchas en el Mundial 2026: el peligro oculto en el Wi-Fi gratis si vas a México a apoyar tu Selección
La investigación revisó decenas de miles de señales inalámbricas y halló que cerca de uno de cada seis accesos abiertos presenta configuraciones obsoleta

Por qué Google quiere liberar más de 30 millones de mosquitos en Estados Unidos y qué busca conseguir
La iniciativa busca reducir las poblaciones de mosquitos que transmiten enfermedades como el dengue y el zika mediante una técnica biológica

Por qué las empresas de IA están contratando asesores de sexualidad: es el empleo millonario más extraño
Más de 100.000 personas aplicaron al puesto de trabajo: “consultor de masturbación”




