
La integración de inteligencia artificial en los servicios de Google continúa avanzando con pasos firmes, y ahora Google Docs incorpora una función largamente esperada: la lectura en voz alta a través de Gemini. A partir de este mes, el popular procesador de textos permite a los usuarios transformar cualquier documento en inglés en un archivo de audio de manera sencilla y con un grado de personalización avanzada, marcando un nuevo paradigma en la accesibilidad y la experiencia de edición en la nube.
Con la llegada de esta funcionalidad, Google Docs da un salto significativo en la interacción entre usuario y documento. Ahora, gracias a Gemini, es posible escuchar el contenido textual reproducido mediante voces artificiales de notable naturalidad. Se pueden escoger diferentes estilos y velocidades, adecuando la narración según las necesidades o el propósito del texto. Entre las opciones de entonación que Google ha puesto a disposición destacan perfiles como Narrador, Educador, Profesor, Persuasor, Explicador, Coach y Motivador, cada uno orientado a adaptarse al tono y la intención del documento original.
Por ahora, esta innovación está limitada a documentos en inglés y en la versión de escritorio web, con un despliegue progresivo que arrancó esta semana y que se extenderá durante las siguientes. La compañía no ha especificado cuándo ni si planea habilitar la función en otros idiomas o plataformas móviles. El acceso a la herramienta está reservado a usuarios que cuenten con planes Workspace comerciales, empresariales o educativos, así como a suscriptores de los servicios AI Pro y Ultra, y quienes dispongan del complemento Gemini Education Premium.

Cómo usar la voz de Gemini en Google Docs
El proceso para activar la lectura en voz alta es intuitivo y no requiere conocimientos técnicos avanzados. Dentro de la versión web de Google Docs, basta con dirigirse al menú de herramientas, donde la opción de audio se encuentra situada entre la entrada por voz y el acceso directo a Gemini. Al seleccionarla, aparecerá en la pantalla un reproductor con formato de pastilla que muestra la duración total del audio generado. El usuario puede controlar la reproducción, pausar o adelantar, además de escoger la voz y la velocidad que se ajusten mejor a sus preferencias.
Un detalle relevante es que el sistema de voces de Gemini no se limita a ofrecer un simple lector automático, sino que proporciona una experiencia variada y personalizable. Esta posibilidad hace que la narración no solo resulte útil para la accesibilidad, sino también para dar un enfoque más profesional o emocional a los contenidos, dependiendo de si se prefiere un tono pedagógico, motivacional o simplemente informativo.
Otra característica destacada es la capacidad de insertar botones de audio en puntos específicos del documento, lo que facilita que cualquier persona con acceso pueda escuchar el fragmento correspondiente sin necesidad de recorrer el texto completo. Esta opción se gestiona desde el menú de “Insertar”, eligiendo la función de botones de audio y después “Listen to tab”, aunque de momento está disponible únicamente en inglés.

Expertos y plataformas especializadas como 9to5Google han valorado muy positivamente la nueva función, subrayando la utilidad que representa para revisar y detectar errores en un texto, o simplemente para consumir información de un modo más eficiente en situaciones donde no es posible leer directamente. El despliegue paulatino responde al objetivo de afinar la experiencia y recoger sugerencias de usuarios reales antes de considerar futuras ampliaciones.
La apuesta por la integración de inteligencia artificial generativa no se detiene aquí. Paralelamente, Google Docs en Android ha introducido la capacidad de generar imágenes dentro de los documentos, ampliando así las opciones para añadir contenido visual atractivo. Estas novedades siguen la tendencia de otros productos de la compañía, como NotebookLM, aplicación basada en IA que ha revolucionado la creación de podcasts a partir de PDFs y otros archivos.
En definitiva, la opción de lectura en voz alta mediante Gemini refuerza la posición de Google Docs como una plataforma de edición avanzada, donde la inteligencia artificial no solo ayuda a crear y organizar texto, sino también a mejorar la accesibilidad, la revisión y la creatividad de los usuarios. El futuro cercano apunta a una convivencia más fluida entre palabras, voz e imagen dentro del entorno laboral y educativo.
Últimas Noticias
Privacidad mejorada en WhatsApp: para qué sirve y cómo te beneficia
La activación de esta función no es obligatoria, pero sí recomendable, especialmente en chats donde circula información sensible

Cómo funcionan las nuevas ‘playlists de gustos en común’ de YouTube Music
Para usar la función solo necesitas actualizar la aplicación y aceptar la invitación que aparecerá en la pantalla

Glosario de tecnología: qué significa Sistema electrónico
Conocer el significado de nuevas palabras ayudará a incrementar el conocimiento y vocabulario por igual

Fraudes telefónicos: palabras que nunca debes decir al contestar una llamada
Los estafadores emplean grabaciones de voz para fabricar pruebas de consentimiento, vulnerar sistemas de verificación automática o simular conversaciones

Descubre 5 formas de aprovechar NotebookLM, la inteligencia artificial de Google
El verdadero valor de esta herramienta de IA radica en su capacidad de interactuar directamente con los documentos que el usuario carga en la plataforma
