Inteligencia artificial ayuda a conservar lenguas indígenas mexicanas en riesgo de extinción

Un proyecto de la UNAM explora cómo la tecnología puede evitar que los idiomas originarios desaparezcan del mapa cultural

Guardar
México cuenta actualmente con 68
México cuenta actualmente con 68 lenguas indígenas y 364 variantes, pero la mayoría enfrenta una drástica disminución de hablantes.-(Jesús Avilés/ Infobae)

El uso de la inteligencia artificial (IA) continúa siendo un debate en cuanto a los límites y las tareas que se le asignan; sin embargo, esta herramienta también ayuda en diferentes ámbitos, como en la preservación de lenguas originarias en México.

En este caso, un grupo de especialistas del Departamento de Ciencias de la Computación del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas de la UNAM impulsa el uso de tecnologías digitales para evitar la desaparición de estos idiomas, muchos de los cuales ya no cuentan con hablantes activos.

La situación de las lenguas nativas es crítica. México cuenta con 68 lenguas, agrupadas en 11 familias y 364 variantes.

Según datos expuestos por Iván Vladimir Meza Ruiz, investigador de la UNAM, la proporción de hablantes se redujo drásticamente desde 1930, cuando representaba el 15% de la población, hasta 2020, año en el que apenas alcanzaban el 6.2%.

(Crédito: UNAM)
(Crédito: UNAM)

Esta reducción afecta sobre todo a las nuevas generaciones, que casi no practican estos idiomas, mientras que la mayoría de los hablantes actuales son adultos mayores.

En palabras de Meza Ruiz, la inteligencia artificial podría mantener “vivas” las lenguas originarias “aunque sea de manera artificial”, ya que muchas se encuentran al borde de la extinción y carecen de registros suficientes.

La iniciativa se enfrenta a un desafío tecnológico y ético: si bien existen los conocimientos para crear registros digitales masivos, el proceso depende de contar con datos suficientes y de calidad.

Obstáculos para el registro digital

Uno de los retos principales que enfrenta este proyecto es la escasez de datos. Meza Ruiz detalló que la mayoría de los registros disponibles está enfocada en la música y son escasos los que corresponden al habla cotidiana, lo que dificulta el desarrollo de herramientas de inteligencia artificial basadas en ejemplos reales.

Este sesgo limita la representación de los idiomas y, por extensión, la posibilidad de su preservación tecnológica.

Especialistas de la UNAM lideran
Especialistas de la UNAM lideran una estrategia tecnológica para evitar la extinción de idiomas indígenas en México. | (Crédito: UNAM)

Actualmente, el acceso a corpus digitales en lenguas originarias es mínimo. Por ejemplo, según Wikipedia, el náhuatl clásico solo cuenta con 4.272 artículos; el maya yucateco, 1.201; el náhuatl central, 224; el mixteco, 113; el hñahñu, 90; el purépecha, 12; y el mixe del norte, apenas 10. Estas cifras reflejan la brecha existente entre idiomas mayoritarios y las lenguas indígenas en la esfera digital.

El dilema ético y la función social

Meza Ruiz puso sobre la mesa una cuestión ética relevante: muchos textos y documentos en lenguas originarias están protegidos por derechos de autor, lo que complica la captación de datos para uso académico o tecnológico. Esta barrera se suma al deseo de fomentar la ciencia abierta y la colaboración, pero sin vulnerar los derechos morales y patrimoniales de las comunidades.

La digitalización de las lenguas, según el especialista, no solo busca conservar el patrimonio cultural, sino también facilitar el acceso de las comunidades a servicios fundamentales.

La digitalización de idiomas indígenas
La digitalización de idiomas indígenas busca garantizar el acceso a salud, justicia y educación en la lengua materna de las comunidades. | Crédito: UNAM

La implementación de una estrategia digital permitiría a los hablantes acceder a: salud, justicia, educación y autonomía económica en su propio idioma, además de garantizar la transmisión oral y escrita de su legado.

El siguiente paso, según Meza Ruiz, es crear el ecosistema adecuado para recolectar y procesar los datos necesarios. Solo así será posible conservar digitalmente los idiomas y garantizar que las futuras generaciones tengan acceso a ellos, aunque sea en entornos virtuales o a través de aplicaciones basadas en inteligencia artificial.