La capacidad de diferenciar unas cuatro mil lenguas que están en peligro de desaparecer

Edición Impresa

Meta desarrolló una serie de modelos de inteligencia artificial para preservar las lenguas que están en peligro de desaparición, que ya son capaces de abarcar 4.000 idiomas hablados de todo el mundo.

Los modelos de habla multilingüe masivos han expandido las tecnologías de texto a voz y de voz a texto de cien idiomas a más de 1.100, un salto que también se replica en la identificación de lenguas habladas, que ya alcanza las 4.000, “40 veces más que antes”.

La finalidad es que los usuarios puedan acceder a la información y usar su dispositivo en el idioma de su preferencia.

Con este objetivo, anunció la apertura de sus modelos y códigos para que la comunidad de investigadores pueda colaborar con esta tarea. Asimismo, explicó el enfoque que han aplicado a los trabajos con los modelos de habla multilingüe masivos, que permitieron el salto en la cantidad de idiomas que admite. Para ello, recurrió a la Biblia, ya que se ha traducido a multitud de idiomas.

Las traducciones de la Biblia se usaron en la investigación de la traducción de idiomas basada en texto, y se acompañan de lecturas grabadas que están disponibles de forma pública. A partir de estos audios, Meta creó “un conjunto de datos de lecturas del Nuevo Testamento en más de 1.100 idiomas, que proporcionó un promedio de 32 horas de datos por idioma”.

Para alcanzar la cifra de los 4.000 idiomas, consideraron también “grabaciones no etiquetadas de otras lecturas religiosas cristianas”. Pese a ser contenido religioso, la compañía asegura que los modelos no presentan un sesgo para producir un lenguaje más religioso.

La compañía espera en un futuro ampliar el número de idiomas que los modelos de habla multilingüe masivos pueden soportar, e incorporar dialectos.

 

Las noticias locales nunca fueron tan importantes
SUSCRIBITE