Impresiona programa de Inteligencia Artificial que recrea caras a partir de audios

Guardar

Fotos a imágenes reconstruidas tras la muestra de audio (Foto: Captura de pantalla/Speech2Face)

La tecnología sigue creciendo a pasos agigantados, apoyándose de varias áreas para explorar nuevas capacidades y funciones. Una de ellas es poder “reconstruir” la cara de una persona a través de un fragmento de voz.

El estudio Speech2Face presentado el 2019 en una conferencia de Visión y Patrones de reconocimiento mostró que una Inteligencia Artificial (AI) puede descifrar el aspecto de una persona a través de segmentos cortos de audio.

En el documento, se explica que la meta de los investigadores Tae-Hyun On, Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman y Michael Rubinstein del Programa de Investigación y Ciencia del MIT, no es la de reconstruir de forma idéntica los rostros de las personas sino hacer una imagen con las características físicas que estén relacionadas con el audio analizado.

Para lograrlo usaron, diseñaron y entrenaron una red neuronal profunda que analizó millones de videos tomados de YouTube en donde hay personas hablando. Durante el entrenamiento el modelo aprendió a correlacionar las voces con los rostros, permitiéndole producir imágenes con atributos físicos similares a los hablantes, incluyendo la edad, género y etnicidad.

Coincidencias del programa con la voz (Foto: Captura de pantalla/Speech2Face)

El entrenamiento fue realizado bajo supervisión y utilizando la concurrencia de las caras y voces de los videos de Internet, sin necesidad de modelar características físicas detalladas de la cara.

Detallaron que debido a que este estudio podría tener aspectos sensibles por la etnicidad, así como por la privacidad, es que no se han añadido aspectos físicos específicos a la recreación de rostros y aseguran que al igual que cualquier otro sistema de machine learning, este va mejorando con el tiempo, ya que en cada uso aumenta su biblioteca de conocimientos.

Si bien sus pruebas mostradas dejan ver que Speech2Face tiene un alto número de coincidencias de los rostros con las voces, también tuvo algunas fallas, en donde no coincidió la etnicidad, la edad o el género con la muestra de voz utilizada.

Ejemplos de errores. La primera foto corresponde a la cara de la persona del audio y la segunda a la recreada por el programa (Foto: Captura de pantalla/Speech2Face)

El modelo está designado para presentar correlaciones estadísticas que existen entre las características faciales con la voz. Cabe recordar que la IA aprendió por videos de YouTube, los cuales no representan una muestra real de la población en el mundo, por ejemplo, en algunos idiomas muestra discrepancias con los datos de entrenamiento.

En ese sentido el propio estudio recomienda al final de sus resultados, que quienes decidan explorar y modernizar el sistema, tomen en consideración una muestra más amplia de personas y voces para que de ese modo el machine learning tenga un repertorio más amplio de emparejamiento y recreación de caras.

El programa también pudo hacer la recreación de la voz en caricaturas, las cuales también tienen un increíble parecido con las voces de los audios analizados.

Debido a que esta tecnología también podría ser usada para fines maliciosos, la recreación de la cara solo se mantiene lo más parecido a la persona y no da rostros completos, pues esto podría ser un problema para la privacidad de las personas. Aún así ha sorprendido lo que puede hacer la tecnología a partir de muestras de audio.

SEGUIR LEYENDO:

Cuidado: hackers se hacen pasar por WeTransfer para robar información

eSalud, qué es y por qué es el futuro de la medicina

Paneles solares que funcionan sin el sol; crean placas que también producen energía en la noche

WhatsApp presenta 6 reacciones con emojis para los mensajes y más opciones de privacidad

Últimas Noticias

Salir de un grupo de WhatsApp en modo incógnito es posible

La actualización está activa para iPhone y teléfonos Android

Apple Music lanza “Replay”, una lista de canciones preferidas cada semana

La recopilación de canciones favoritas será actualizada cada domingo hasta el final del año 2023

Inteligencia artificial elimina marcas de agua en fotografías

Según WatermarkRemover, estos sellos que garantizan los derechos de autor también arruinan la estética de las fotografías

Así se puede usar un iPhone como traductor de idiomas, sin internet

La aplicación de Traducción se encuentra instalada de forma predeterminada en los celulares de Apple y puede descargarse desde la App Store

Juegos de rol en TikTok: “escoge tu aventura” es el nuevo desafío

Los usuarios aprovechan las herramientas de la red social para proponer escenarios entretenidos a sus seguidores

MÁS NOTICIAS

Impresiona programa de Inteligencia Artificial que recrea caras a partir de audios

Speech2Face es un estudio que demostró que es posible saber cómo es el rostro de una persona solo con un pequeño fragmento de su voz

Últimas Noticias

Salir de un grupo de WhatsApp en modo incógnito es posible

La actualización está activa para iPhone y teléfonos Android

Apple Music lanza “Replay”, una lista de canciones preferidas cada semana

La recopilación de canciones favoritas será actualizada cada domingo hasta el final del año 2023

Inteligencia artificial elimina marcas de agua en fotografías

Según WatermarkRemover, estos sellos que garantizan los derechos de autor también arruinan la estética de las fotografías

Así se puede usar un iPhone como traductor de idiomas, sin internet

La aplicación de Traducción se encuentra instalada de forma predeterminada en los celulares de Apple y puede descargarse desde la App Store

Juegos de rol en TikTok: “escoge tu aventura” es el nuevo desafío

Los usuarios aprovechan las herramientas de la red social para proponer escenarios entretenidos a sus seguidores

Amalia de Holanda sorprende en Sevilla como invitada sorpresa en una boda aristocrática: la heredera al trono visita la Maestranza

Última hora de las elecciones de Castilla y León: la participación a las 11:30 es del 12,72%, más de un punto por encima de 2022

Las tres rutas de senderismo más espectaculares y populares de España están en Aragón, según Wikiloc: cascadas, ibones y cañones en el corazón de los Pirineos

Mexicanos buscan brillar en los Oscar 2026: talento nacional destaca en cine, sonido, animación y efectos visuales

La indagatoria de Cristina Kirchner: militancia en San José 1111, traslado a Comodoro Py y la tesis K del “pan y circo”

Hamás espera que Teherán continúe apoyando la causa palestina bajo el liderazgo de Mojtaba Jamenei

Miguel Méndez: "Va a ser mi primer Mundial y estoy encantado, más con este grupo"

EEUU despliega un bombardero B-52 en una misión nocturna y afirma seguir debilitando la capacidad militar iraní

Crónica del España - Puerto Rico, 91-52

Colombia y Venezuela pedirán su ingreso como miembros de pleno derecho a Mercosur

ENTRETENIMIENTO

Premios Oscar 2026 EN VIVO: todos los detalles de la gala más importante del cine

Así es el ambicioso proyecto de Cillian Murphy para transformar el cine de su infancia en un centro creativo

Desde golpes en vivo hasta escándalos de abuso: los actores que fueron expulsados de los Premios Oscar

Con Timothée Chalamet como su principal fan, Kylie Jenner da el gran salto y debuta en la pantalla grande

Sebastian Bach habló por primera vez sobre el episodio en que Christina Applegate dejó a Brad Pitt por él

Temas Relacionados

Últimas Noticias

Salir de un grupo de WhatsApp en modo incógnito es posible

La actualización está activa para iPhone y teléfonos Android

Apple Music lanza “Replay”, una lista de canciones preferidas cada semana

La recopilación de canciones favoritas será actualizada cada domingo hasta el final del año 2023

Inteligencia artificial elimina marcas de agua en fotografías

Según WatermarkRemover, estos sellos que garantizan los derechos de autor también arruinan la estética de las fotografías

Así se puede usar un iPhone como traductor de idiomas, sin internet

La aplicación de Traducción se encuentra instalada de forma predeterminada en los celulares de Apple y puede descargarse desde la App Store

Juegos de rol en TikTok: “escoge tu aventura” es el nuevo desafío

Los usuarios aprovechan las herramientas de la red social para proponer escenarios entretenidos a sus seguidores

Amalia de Holanda sorprende en Sevilla como invitada sorpresa en una boda aristocrática: la heredera al trono visita la Maestranza

Última hora de las elecciones de Castilla y León: la participación a las 11:30 es del 12,72%, más de un punto por encima de 2022

Las tres rutas de senderismo más espectaculares y populares de España están en Aragón, según Wikiloc: cascadas, ibones y cañones en el corazón de los Pirineos

Mexicanos buscan brillar en los Oscar 2026: talento nacional destaca en cine, sonido, animación y efectos visuales

La indagatoria de Cristina Kirchner: militancia en San José 1111, traslado a Comodoro Py y la tesis K del “pan y circo”

Hamás espera que Teherán continúe apoyando la causa palestina bajo el liderazgo de Mojtaba Jamenei

Miguel Méndez: "Va a ser mi primer Mundial y estoy encantado, más con este grupo"

EEUU despliega un bombardero B-52 en una misión nocturna y afirma seguir debilitando la capacidad militar iraní

Crónica del España - Puerto Rico, 91-52

Colombia y Venezuela pedirán su ingreso como miembros de pleno derecho a Mercosur

ENTRETENIMIENTO

Premios Oscar 2026 EN VIVO: todos los detalles de la gala más importante del cine

Así es el ambicioso proyecto de Cillian Murphy para transformar el cine de su infancia en un centro creativo

Desde golpes en vivo hasta escándalos de abuso: los actores que fueron expulsados de los Premios Oscar

Con Timothée Chalamet como su principal fan, Kylie Jenner da el gran salto y debuta en la pantalla grande

Sebastian Bach habló por primera vez sobre el episodio en que Christina Applegate dejó a Brad Pitt por él