Facebook traducirá 100 idiomas sin necesitar el inglés como paso intermedio

Facebook ha decidido ponerlo un poco más fácil a la hora de la comunicación entre usuarios y acaba de lanzar una nueva herramienta que permitirá traducir entre 100 idiomas diferentes sin que sea necesario acudir al inglés como paso intermedio, sistema utilizado por la mayoría de los sistemas de traducción en la actualidad. 

Se trata de la herramienta M2M-100, cuyas habilidades ha explicado Facebook en un comunicado, y que logra unos resultados hasta diez puntos superiores a los mecanismos basados en inglés, utilizando para ello la escala BLEU, que se utiliza para evaluar la calidad de las traducciones realizadas por sistemas de traducción automática.

El inglés es el idioma utilizado como intermediario para traducir entre varios idiomas porque se trata del idioma con más datos disponibles. Esto es en la mayoría de los traducciones tradicionales, pero ahora en Facebook la cosa cambia, ya que se usará la traducción directamente sin tener que pasar por el inglés. 

Se trata entonces de 2.200 tipos distintos de traducciones, lo que significa diez veces más que las que se emplean en el método más convencional.

Y es que para Facebook, “romper las barreras del idioma a través de la traducción automática es una de las formas más importantes de unir a las personas, proporcionar información autorizada sobre el coronavirus y mantenerlos a salvo de contenidos dañinos”.

Para ello, la nueva herramienta de Facebook cuenta con 7.500 millones de pares de oraciones en 100 idiomas diferentes, gracias a la combinación de recursos complementarios de minería de datos que se han desarrollado a lo largo de los años. 

Como parte de ese esfuerzo, se creó un nuevo Laser 2.0, mejorando la identificación del lenguaje fastText, que mejora la calidad de la minería e incluye scripts de capacitación y evaluación de código abierto. 

Es precisamente el Laser 2.0 lo que se utiliza para la reducción de los datos necesarios y además se enfoca en los idiomas con mayor cantidad de datos disponibles, pero no solo en inglés, sino obviando traducciones poco frecuentes como del islandés al nepalí.

Otra de las medidas establecidas por Facebook para que esta herramienta funcione es tener en cuenta la geografía y las similitudes culturales. De esta manera, se priorizan las lenguas que más se traducen en ellas y se seleccionan 14 grupos de lenguas, en las que cada uno se ha conectado con los idiomas de su grupo.

Ana Lacasa
Periodista y Filóloga. Dos áreas que se dan de la mano para informar de la actualidad emprendedora y tecnológica.