Diversidad del español enloquece a la inteligencia artificial | El Nuevo Siglo
Foto: AFP
Martes, 28 de Marzo de 2023
Redacción internacional con AFP y Europa Press

POR SER el segundo idioma materno más hablado del mundo, el que más se está aprendiendo, al igual que expandiendo, y la segunda lengua de comunicación internacional, el español busca posicionarse en la Inteligencia Artificial (IA) y su competencia frente al tradicional competidor, el inglés. Sin embargo, dicha meta no será tan fácil ni inmediata.

Sin duda, como lo manifestó el rey Felipe VI al inaugurar el lunes el IX Congreso de la Lengua Española, en el Teatro de Falla de Cádiz, “esta es la hora del español, con todas sus voces, sus giros y matices y con todos sus acentos, con toda su riqueza…El siglo XXI debe ser el siglo del español, hagámoslo posible”. Pero, precisamente, son esas cualidades destacadas de este idioma, el más diverso y mestizo de todos en el planeta, que no han podido la Inteligencia Artificial no ha podido hablar bien en ‘español’ e inclusive la tiene enloquecida.

De esta forma la IA artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

La inauguración del IX Congreso Internacional de la Lengua Española (Cile) dejó una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

Correctores incorrectos 

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

¿Variantes dominantes?

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

Ahora se escriben así

Entre tanto, la Real Academia Española presentó una nueva edición del Diccionario Panhispánico de Dudas, en la que se abordan diversas cuestiones relativas al idioma como, por ejemplo, las grafías recomendadas en casos de tener que usar extranjerismos.

'Jol' por 'hall', 'jáquer' por 'hacker', 'wiski' por 'whisky' o 'jol' por 'hall' son algunos de los ejemplos aportados por el encargado de esta obra, Salvador Gutiérrez Ordóñez, quien ha remarcado no obstante que "la primera obligación que tiene la Academia" es hacer "propuestas de equivalencia".

"Si triunfan, bien, y si no, no pasa nada", ha señalado, recordando que este diccionario no es normativo como el diccionario de la lengua, sino que responde a las dudas de los hablantes. Por ejemplo, para 'backstage' se recomienda usar la palabra 'trascenio'; para 'bullying', 'acoso escolar' -para 'bully' también 'matón'- o para 'hall', 'vestíbulo', 'entrada' o 'recibidor'.

Ahora bien, en este diccionario también se aportan otras grafías 'alternativas' en castellano que también sirven como recomendación para estas palabras extranjeras. Es el caso de 'jol' para 'hall'. "La adaptación del anglicismo es innecesaria, pero, de hacerse, la grafía 'jol' sería posible y correcta", explica el nuevo diccionario panhispánico.

Otro caso llamativo citado por el propio Gutiérrez Ordóñez ha sido el de 'whisky', que también podría sustituirse por la palabra 'wiski'. Hasta ahora, la fórmula recomendada por la RAE en su grafía española era la de 'güisqui', pero ha cambiado debido también a una mayor aceptación de letras como 'w' o 'k' en español.



"Esas letras eran vistas como extranjeras y se podría decir que estaban condenadas durante una época, pero ahora ha cambiado", ha destacado el lingüista. "Este diccionario se adelanta a algunas cuestiones y trata de dar respuesta a preguntas que no están en el diccionario. Es verdad que casi nadie escribe así, pero si se pregunta, hay que decir esto y dejar claro que no son faltas ortográficas", ha añadido.

Durante la presentación, se han mencionado otros ejemplos como el de 'tour' --"ya usamos turista o turoperador, pero no está recogida una adaptación", ha indicado-- o, por el contrario, otras asimilaciones ya consolidadas, como es el caso de 'fútbol'. "Fue una adaptación difícil, porque primero se hablaba de balompié y las derivadas son un problema", ha reconocido.

'Sambernardo' ha sido otro de los ejemplos que han surgido de ejemplo de recomendación de escritura, 'brauni' para 'brownie' o 'baipás' para 'bypass'. Y, antes de concluir, ha remarcado que aún existen extranjerismos como 'hardware' o 'software' que son "muy difíciles de desenterrar" en español.

Solo, solo sin tilde

En este diccionario la RAE también incluyó cambios al respecto de la escritura de 'solo' -para tildar cuando haya riesgo de ambigüedad, a juicio del que escribe-, si bien "lo ideal es que nadie lo escriba con tilde", según el responsable del panhispánico, Salvador Gutiérrez Ordóñez.

"Igual que pasen diez años y ya nadie lo escriba con tilde es poco tiempo, pero lo ideal es que nadie lo escriba así", ha señalado antes de la presentación Gutiérrez Ordóñez, quien también es director del Departamento de Español al día desde 2008.

Explicó que los cambios en la normativa se deben a que la anterior "era menos clara", pero en general se mantiene la redacción del año 2010. "Esa normativa era más oscura y ahora la nueva redacción es más taxativa y clara", ha señalado.

De hecho, se ha expuesto cómo queda la nueva redacción en el diccionario: 'Se ha determinado que el uso de la tilde no sea obligatorio, sino potestativo en casos de ambigüedad. Es obligatorio escribirlo sin tilde en un contexto donde no entraña riesgos de ambigüedad y optativo donde sí, a juicio del que escribe'.