Meta usa la Biblia para entrenar a su inteligencia artificial
El Nuevo Testamento de la Biblia ha sido una de las fuentes de entrenamiento utilizadas por Meta, la empresa matriz de Facebook e Instagram, para desarrollar un modelo de inteligencia artificial. Este modelo tiene la capacidad de identificar hasta 4,000 idiomas y facilitar la traducción de voz a texto y de texto a voz en 1,107 idiomas.
El equipamiento de sistemas con la habilidad de comprender y producir voces tiene el potencial de permitir que un mayor número de personas accedan a la información, especialmente aquellas que dependen exclusivamente de la voz para hacerlo.
Sin embargo, la creación de modelos de aprendizaje automático de alta calidad para estas tareas requiere grandes cantidades de datos etiquetados. En este caso, se necesitan miles de horas de audio y transcripciones, lo cual es escaso para la mayoría de los idiomas.
Actualmente, los modelos de reconocimiento de voz solo abarcan aproximadamente 100 idiomas, lo cual representa una fracción de los más de 7,000 idiomas que se hablan en todo el mundo.
La Biblia uno de los libros mas traducidos
La recolección de datos de audio en miles de idiomas ha sido el primer desafío para Meta, ya que los conjuntos de datos de voz existentes solo abarcaban un máximo de 100 idiomas. Para superar este obstáculo, los investigadores recurrieron a textos religiosos, como la Biblia, que han sido traducidos a numerosos idiomas y cuyas traducciones han sido estudiadas en detalle para investigar la traducción de textos lingüísticos.
Estas traducciones de la Biblia incluyen grabaciones de audio disponibles al público, donde personas leen estos textos en diferentes idiomas. Como parte de este proyecto, se ha creado un conjunto de datos que consiste en lecturas del Nuevo Testamento en más de 1,100 idiomas, lo que equivale a un promedio de 32 horas de datos por idioma.
Mediante la inclusión de grabaciones no etiquetadas de otras lecturas religiosas cristianas, los investigadores han logrado aumentar el número de idiomas disponibles a más de 4,000.
Entrenada para hablar 4,000 idiomas
En el proyecto «Massively Multilingual Speech» (MMS), se ha integrado el modelo wav2vec 2.0, que es un precursor en el aprendizaje auto-supervisado. Además, se ha utilizado un nuevo conjunto de datos que proporciona información etiquetada para más de 1,100 idiomas y datos no etiquetados para casi 4,000 idiomas. Los resultados demuestran que el nuevo modelo de inteligencia artificial de Meta tiene un buen rendimiento en comparación con los modelos existentes y cubre 10 veces más idiomas.
Aunque estos datos se originan en un contexto religioso y suelen ser leídos por hablantes masculinos, el análisis demuestra que los modelos funcionan con la misma eficacia tanto para voces masculinas como femeninas.
«Además, a pesar de que el contenido de las grabaciones de audio es religioso, nuestro análisis indica que esto no sesga el modelo para producir un lenguaje más religioso. Creemos que esto se debe a que hemos utilizado un enfoque de clasificación temporal conexionista (CTC), que está más limitado en comparación con los grandes modelos de lenguaje (LLM) o los modelos secuencia a secuencia de reconocimiento de voz», afirmó la compañía en su blog oficial.
A medida que se aumenta el número de idiomas, el rendimiento disminuye ligeramente. Por ejemplo, al pasar de 61 a 1,107 idiomas, el porcentaje de errores de caracteres aumenta solo un 0,4%. Sin embargo, la cobertura lingüística se incrementa más de 17 veces.
¿Es este el mejor modelo de inteligencia artificial para idiomas?
En una comparación directa con el modelo Whisper de OpenAI, los investigadores de Meta descubrieron que los modelos entrenados con los datos de su proyecto de inteligencia artificial reducen a la mitad el porcentaje de errores en palabras, pero MMS abarca 11 veces más idiomas. Esto demuestra que el modelo de Meta tiene un rendimiento muy bueno en comparación con los mejores modelos de voz actuales.
Según los investigadores, incluso con el entrenamiento en más de 4,000 idiomas, el rendimiento del modelo sigue siendo sólido. Además, han creado sistemas de conversión de texto a voz para más de 1,100 idiomas.
«Estamos satisfechos con nuestros resultados, pero como ocurre con todas las nuevas tecnologías de inteligencia artificial, estos modelos no son perfectos. Existe un cierto riesgo de que el modelo de voz a texto pueda transcribir incorrectamente ciertas palabras o frases, lo que podría generar un lenguaje ofensivo o inexacto. Creemos que la colaboración dentro de la comunidad de inteligencia artificial es fundamental para el desarrollo responsable de tecnologías impulsadas por la inteligencia artificial», aclaró Meta en su blog oficial.
Idiomas en riesgo de desaparecer
Muchos idiomas en el mundo están en peligro de desaparecer, y las limitaciones de las tecnologías actuales de reconocimiento y generación de voz solo acelerarán esta tendencia. Por esta razón, Meta busca preservar estos idiomas en riesgo.
«Nuestro objetivo es facilitar el acceso a la información y el uso de dispositivos en el idioma preferido de las personas», concluyó la compañía.
También te puede interesar: Elon Musk ahora regala cuentas de Twitter Blue (marketnews.pe)
Sigamos Conectados
Si te gusta el contenido de MarketNews.pe y quieres estar al día de las últimas novedades, consejos y oportunidades, te invitamos a que nos sigas en nuestras redes sociales. En Facebook, Twitter y LinkedIn compartimos información de valor, recursos gratuitos, casos de éxito y mucho más. Además, podrás interactuar con otros lectores y profesionales del sector, resolver tus dudas y ampliar tu red de contactos. No esperes más y únete a nuestra comunidad online. ¡Te esperamos!