CIFRAS E LETRAS

¿E8E5 KA9AZ 0E I3ER E5LE A2TÍKULO?

Senén Barro Ameneiro

Senén Barro Ameneiro

EN OCASIONES, para evidenciar la capacidad que tenemos las personas de enfrentarnos a tareas para las que no hemos sido previamente adiestrados, muestro un texto en el que he cambiado algunas de las letras por otras elegidas al azar. Salvo que el texto original esté muy distorsionado, no tenemos mayor dificultad para identificarlo. El propio título de este artículo es un ejemplo que espero haya podido descifrar. ¿ERES CAPAZ DE LEER ESTE ARTÍCULO?, es el texto del que partí, cambiando casi todas las consonantes y alguna vocal.  

¿Ha identificado el texto original? ¿Ha sido usted entrenado específicamente para leer este tipo de textos? ¿Lo había hecho antes y en repetidas ocasiones? Si ha respondido sí a la primera pregunta y no a las siguientes, es probable que se pregunte cómo entonces ha podido su cerebro descubrir el texto original a partir de una versión claramente alterada del mismo. 

La neurociencia revela aspectos fascinantes sobre cómo nuestro cerebro puede leer textos intencionadamente mal escritos, en el que las letras están desordenadas, son reemplazadas por números o están alteradas de alguna otra manera. Nuestro cerebro intenta siempre encajar aquello que percibe en lo que antes vivió o aprendió de alguna manera. Es como intentar que el presente encaje en el pasado. 

Tenemos una excepcional capacidad para reconocer patrones –nos va la vida en ello, sobre todo nos iba, así que la evolución se encargó de la tarea–. Aunque cambiemos algunas letras o las desordenemos de algún modo, podemos identificar las palabras originales basándonos en el contexto y la forma general de la palabra. Para ello son especialmente importantes las primeras y últimas letras de una palabra si estas se mantienen en su lugar, ya que facilita que nuestro cerebro interprete más fácilmente cómo tendrían que ser las letras intermedias. Esto se debe a que tendemos a leer palabras enteras en lugar de letras individuales. Por otra parte, el contexto de una oración o párrafo ayuda al cerebro a predecir qué palabra viene a continuación. Esta expectativa facilita también la lectura de palabras, aunque estén mal escritas. 

Bien es cierto que si practicamos la resolución de este tipo de acertijos, cada vez lo haremos mejor. Nuestro cerebro aprende muy rápido. No necesita en general, como sí ocurre con las máquinas, un gran número de ejemplos para aprender a resolver un problema dado. 

Permítanme que les ponga otro ejemplo: “N0 A4REN2Í A LEE3 EJ7E BIP0 2E TEX80S Y AÚW A5Í PUE80 HAZ3RÑ0”. Seguro que han identificado también en él el texto original: “NO APRENDÍ A LEER ESTE TIPO DE TEXTOS Y AÚN ASÍ PUEDO HACERLO”. 

Este es un ejemplo que he usado en ocasiones para evidenciar que, al contrario que nosotros, una máquina no era capaz de resolver algo tan aparentemente simple para nosotros, salvo que hubiese sido diseñada o entrenada específicamente para ello. Con el diseño apropiado, eso sí, las máquinas pueden superarnos en tareas muchísimo más complejas, como el ajedrez, traducir textos o reconocer objetos en imágenes. Sin embargo, los grandes modelos de lenguaje, como ChatGPT, sí pueden identificar la frase original del ejemplo anterior. 

¿Cómo lo hace? Creo que ni sus creadores podrán dar una explicación detallada, pero sabiendo cómo está diseñado, cómo ha sido entrenado y cómo construye sus respuestas, me aventuro a dar algunas pistas: como nosotros, la máquina hace suposiciones informadas. Por ejemplo, si una palabra con caracteres alterados está rodeada de palabras que forman una frase coherente, puede inferirla. Además, utiliza modelos estadísticos para predecir cuál es la letra/palabra más probable en un contexto dado, a partir de la frecuencia con la que aparecen ciertas letras o combinaciones de letras en los textos de un cierto idioma. 

Pensemos que durante su entrenamiento estos grandes modelos de lenguaje son expuestos a un corpus de texto inmenso (incluyendo buena parte de los textos de Internet). ChatGPT aprende de estos textos, así que se ve expuesto a diversas formas de escritura, incluyendo textos con errores ortográficos o alteraciones intencionadas, como pueden ser las de ejemplos semejantes a los que les he puesto. Incluso textos en los que se comentan este tipo de adivinanzas y la sorprendente capacidad humana para resolverlas. 

Ya me ha pasado otras veces con ejemplos que he usado para evidenciar cosas que nosotros podemos hacer y las máquinas no, y es que tienen fecha de caducidad.