Impresiona programa de Inteligencia Artificial que recrea caras a partir de audios

Speech2Face es un estudio que demostró que es posible saber cómo es el rostro de una persona solo con un pequeño fragmento de su voz

Guardar
Fotos a imágenes reconstruidas tras
Fotos a imágenes reconstruidas tras la muestra de audio (Foto: Captura de pantalla/Speech2Face)

La tecnología sigue creciendo a pasos agigantados, apoyándose de varias áreas para explorar nuevas capacidades y funciones. Una de ellas es poder “reconstruir” la cara de una persona a través de un fragmento de voz.

El estudio Speech2Face presentado el 2019 en una conferencia de Visión y Patrones de reconocimiento mostró que una Inteligencia Artificial (AI) puede descifrar el aspecto de una persona a través de segmentos cortos de audio.

En el documento, se explica que la meta de los investigadores Tae-Hyun On, Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman y Michael Rubinstein del Programa de Investigación y Ciencia del MIT, no es la de reconstruir de forma idéntica los rostros de las personas sino hacer una imagen con las características físicas que estén relacionadas con el audio analizado.

Para lograrlo usaron, diseñaron y entrenaron una red neuronal profunda que analizó millones de videos tomados de YouTube en donde hay personas hablando. Durante el entrenamiento el modelo aprendió a correlacionar las voces con los rostros, permitiéndole producir imágenes con atributos físicos similares a los hablantes, incluyendo la edad, género y etnicidad.

Coincidencias del programa con la
Coincidencias del programa con la voz (Foto: Captura de pantalla/Speech2Face)

El entrenamiento fue realizado bajo supervisión y utilizando la concurrencia de las caras y voces de los videos de Internet, sin necesidad de modelar características físicas detalladas de la cara.

“Nuestras reconstrucciones, obtenidas directamente del audio, revelan las correlaciones entre rostros y voces. Evaluamos y cuantificamos numéricamente cómo, y de qué manera, nuestras reconstrucciones Speech2Face a partir de audio se asemejan a las imágenes reales de los rostros de los hablantes”.

Detallaron que debido a que este estudio podría tener aspectos sensibles por la etnicidad, así como por la privacidad, es que no se han añadido aspectos físicos específicos a la recreación de rostros y aseguran que al igual que cualquier otro sistema de machine learning, este va mejorando con el tiempo, ya que en cada uso aumenta su biblioteca de conocimientos.

Si bien sus pruebas mostradas dejan ver que Speech2Face tiene un alto número de coincidencias de los rostros con las voces, también tuvo algunas fallas, en donde no coincidió la etnicidad, la edad o el género con la muestra de voz utilizada.

Ejemplos de errores. La primera
Ejemplos de errores. La primera foto corresponde a la cara de la persona del audio y la segunda a la recreada por el programa (Foto: Captura de pantalla/Speech2Face)

El modelo está designado para presentar correlaciones estadísticas que existen entre las características faciales con la voz. Cabe recordar que la IA aprendió por videos de YouTube, los cuales no representan una muestra real de la población en el mundo, por ejemplo, en algunos idiomas muestra discrepancias con los datos de entrenamiento.

En ese sentido el propio estudio recomienda al final de sus resultados, que quienes decidan explorar y modernizar el sistema, tomen en consideración una muestra más amplia de personas y voces para que de ese modo el machine learning tenga un repertorio más amplio de emparejamiento y recreación de caras.

El programa también pudo hacer la recreación de la voz en caricaturas, las cuales también tienen un increíble parecido con las voces de los audios analizados.

Debido a que esta tecnología también podría ser usada para fines maliciosos, la recreación de la cara solo se mantiene lo más parecido a la persona y no da rostros completos, pues esto podría ser un problema para la privacidad de las personas. Aún así ha sorprendido lo que puede hacer la tecnología a partir de muestras de audio.

SEGUIR LEYENDO:

Guardar

Últimas Noticias

Rafael López Aliaga aseguró que invitó a Speed por una semana, pero streamer estadounidense se fue de Lima el mismo día

Speed abandonó la capital peruana el último martes, a pesar de que el alcalde de Lima afirmó que había destinado fondos propios para que permaneciera una semana en la ciudad. “Le he pedido que con su productor vaya y nos haga conocido a nivel mundial”, señaló

Rafael López Aliaga aseguró que

Rafael López Aliaga acudió al Opus Dei ante denuncia de abuso sexual contra Juan Luis Cipriani, señala Paola Ugaz: “No puede decir que no sabe nada”

La coautora de ‘Mitad monjes, mitad soldados’ criticó al alcalde de Lima por defender al cardenal y señaló que no puede desconocer la gravedad del caso, pues el Opus Dei ya ha pedido disculpas al denunciante

Rafael López Aliaga acudió al

Sorteo elección judicial hoy 30 de enero EN VIVO: Senado define con tómbola a candidatos que aparecerán en la boleta

Algunas de las candidaturas no serán insaculadas derivado al número de mujeres aspirantes registradas

Sorteo elección judicial hoy 30

Tomás Etcheverry enfrenta a Nicolai Budkov Kjaer en el primer punto de la serie de Copa Davis ante Noruega

El equipo argentino se presenta en Oslo por la primera ronda de los clasificatorios del certamen más importante del tenis a nivel naciones

Tomás Etcheverry enfrenta a Nicolai

Polo Polo respondió a los ataques tras anunciar su precandidatura a la Presidencia en el 2026: “Por qué me tienen tanto miedo”

El representante señaló que su anuncio provocó un remezón el país político y que el Pacto Histórico ve en él a una figura con altas posibilidades en la política y el poder

Polo Polo respondió a los
MÁS NOTICIAS