“ChatGPT tiene los valores de un hombre blanco, universitario y de la costa oeste de EE.UU.”
Dos académicas latinoamericanas, la argentina Luciana Benotti y la chilena Jocelyn Dunstan, explican por qué son importantes los esfuerzos hispanos para ampliar los modelos de lenguaje disponibles en idiomas distintos al inglés

El lanzamiento de ChatGPT en noviembre de 2022 asombró al mundo por lo bien que escribía en cualquier lengua. Ese éxito ocultó que un modelo que sabe responder cualquier pregunta esconde más valores detrás de esa gramática o sintaxis correcta. Con el paso del tiempo aparecen cada vez más trabajos que destacan la importancia de entrenar modelos con lenguas y valores distintos: “Necesitamos la infraestructura técnica para alentar el entrenamiento de modelos de IA con datos culturales franceses y europeos”, dice un informe del gobierno francés de marzo, que insiste en que sin IA propia, Europa se arriesga “a perder control del futuro”.
Recibí las noticias en tu email
Accedé a las últimas noticias desde tu emailNo es extraño que el Gobierno francés dé importancia a los datos culturales. “Cuando uno habla de modelos de español se refiere a lo lingüístico, pero los modelos de lenguaje incluyen una posición geográfica, de valores. Los modelos como ChatGPT tienen valores parecidos a los de un hombre de unos 30 años, blanco, que fue a la universidad, nacido en la costa oeste de Estados Unidos”, dice Luciana Benotti, informática con un doctorado en lingüística computacional e investigadora de la Universidad Nacional de Córdoba (Argentina).
Para ampliar este panorama anglocéntrico, el Gobierno de España anunció su proyecto de modelo de lenguaje Alia. Al menos un 20% del total de textos con los que se entrene se corresponderán con lenguas habladas en España, mientras que ChatGPT y sus competidores no alcanzan el 5% en español. Eso hará que su fiabilidad sea mayor para los hispanohablantes, pues se corregirán problemas típicos como los sesgos: el uso del género masculino y el femenino es distinto en castellano respecto al inglés, por ejemplo.