Cambios en el lenguaje

La lA está aplanando el lenguaje y tiene un impacto lingüístico real

Los algoritmos basados en la probabilidad tienden a homogeneizar el lenguaje. Adiós a la riqueza del lenguaje. Hola a la estadística lingüística. Por Andrea Sastre.

Hagamos el ejercicio de pensar en un mundo donde todo lo que escribimos y pensamos es igual. No hay originalidad ni mente crítica, todo parece escrito y pensado por la misma persona. Es un escenario anodino, sin diversidad y sin ideas nuevas. Este supuesto mundo podría estar más cerca de lo que imaginamos debido a la IA.

La inteligencia artificial nos ayuda a ser más productivos y más rápidos, pero su uso está homogeneizando el lenguaje y el pensamiento silenciosamente. Esto se debe a que los sistemas algorítmicos siguen los mismos patrones estadísticos y predictivos, por lo que el resultado siempre es similar. Esto significa que, el lenguaje, que siempre ha estado en movimiento, podría estancarse en pocos años. Tanto texto generado con IA está cambiando la espontaneidad y riqueza del lenguaje por un tono plano, predecible y uniforme.

La palabra más probable

La creación de textos mediante la inteligencia artificial generativa es uno de los usos más frecuentes en el día a día. El proceso es bastante sencillo, al menos en apariencia. El usuario hace una petición mediante un prompt y la IA crea ese contenido instantáneamente. Aunque suene sencillo, el proceso es más complejo.

Para generar este texto, la IA utiliza modelos de lenguaje grandes(LLM)que sirven de entrenamiento. Esta cantidad gigante de datos(terabytes de texto extraídos de internet, artículos, libros, etc.) se utiliza para que el sistema aprenda los patrones estadísticos del lenguaje. Estos modelos no entienden ni interpretan el significado real de las palabras, únicamente predicen la palabra más probable que debería aparecer a continuación. Esta predicción se consigue dividiendo el texto en tokens(pequeños fragmentos como palabras o sílabas), lo que permite manejar la gran cantidad de vocabulario y entender como se relacionan las palabras entre sí.

El problema de elegir siempre la opción más probable estadísticamente es que se pierde la riqueza del lenguaje. Al final, el sistema busca el camino más predecible y acaba aplanando nuestra forma de escribir.

Hacia un lenguaje global y sin esencia

El lenguaje siempre ha sido un sistema comunicativo rico y flexible que nos permite expresarnos de diferentes formas. Sin embargo, desde la llegada de ChatGPT en 2022, diversos estudios han comprobado que la diversidad estilística del lenguaje ha descendido. El mayor ejemplo de esto lo detectó Hiromu Yakura, investigador del Instituto Max Planck para el Desarrollo Humano, al demostrar que el uso de ciertas palabras como delve(profundizar) o meticulous(meticuloso)y estructuras lingüísticas coincidían con los patrones más frecuentes de los LLM. Esta investigación se extendió de la escritura al lenguaje conversacional y tras analizar más de 700.000 horas de vídeos y pódcastconfirmaron que la homogeneización de los LLM ya se estaba aplicando a nuestro lenguaje escrito y oral.

Otro estudio publicado por la revista Science Advances señala que aunque la IA generativa puede mejorar la calidad de los textos individuales, reduce la diversidad colectiva. Esto se debe principalmente a que las herramientas algorítmicas son las mismas, por lo que de manera involuntaria se produce un sesgo de imitación y todos los textos acaban siendo iguales. Oliver Hauser, uno de los autores de esta investigación, advierte que esto va más allá de una homogeneización en el lenguaje y que el uso de estos asistentes podría impactar en la innovación y creatividad de la ciencia.

La realidad a la que nos enfrentamos es una encrucijada doble: un lenguaje uniforme y un pensamiento idéntico. Las palabras que enriquecen el vocabulario podrían volverse impensables en el futuro y la capacidad crítica y creativa virar a una única. Y es que el lenguaje describe la realidad y aunque es algo que está en continuo cambio, la falta de matices en el vocabulario y el pensamiento influiría en la forma de expresarse de las personas. Lo que no existe no puede nombrarse y lo que no puede nombrarse se vuelve impensable.

De lo real a lo impensable

La homogeneización del lenguaje debido a la IA puede tener efectos a largo plazo. Lo que hoy es real y conocemos podría volverse impensable si no hay constancia de su existencia. Esta reducción de la diversidad lingüística, debido a la consolidación de un registro neutro y uniforme, corre el riesgo de perder expresiones menos frecuentes, locales o creativas.

La UNESCO ha puesto el foco en el impacto que podría tener a largo plazo esta situación. El más importante afecta a nuestra forma de ver el mundo y nuestras ideas. La riqueza del vocabulario ayuda a que las personas se expresen mejor, pero también contribuye a la representación de conceptos morales y sociales. La desaparición de palabras, ya sea por desuso o sustitución por otras más simples y frecuentes, produciría un vacío muy complicado de llenar. De esta manera, nos enfrentaríamos a una forma de censura indirecta y pasiva: lo que no se piensa, no se puede aplicar. Al final, no solo perderíamos palabras, también estaríamos perdiendo la forma en la que vemos el mundo y nuestras propias ideas e identidad personal.

Sin embargo, este impacto no solo influiría en las personas que utilizan la IA. Repercutiría también en en la educación, ya que si los profesores la utilizan frecuentemente, su comunicación terminaría viéndose afectada y los estudiantes estarían expuestos a un vocabulario repetitivo y poco enriquecedor. Esto provocaría una limitación en el desarrollo lingüístico e intelectual desde edad temprana.

Levanta la Cabeza

| | 15/06/2026

Levanta la cabeza

La lA está aplanando el lenguaje y tiene un impacto lingüístico real

La palabra más probable

Hacia un lenguaje global y sin esencia

De lo real a lo impensable

Los mas vistos

Categorías

Levanta la cabeza

La palabra más probable

Hacia un lenguaje global y sin esencia

De lo real a lo impensable

Tags relacionados

Los mas vistos

Categorías