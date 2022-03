EL APRENDIZAJE automático es una rama de la inteligencia artificial (IA), centrada en cómo hacer que las máquinas aprendan a resolver un problema o a mejorar su competencia en su entorno de operación.

El primer hito del aprendizaje automático fue el logrado por Arthur Samuel, a quién precisamente se le atribuye el término “aprendizaje automático”. Samuel diseñó un programa para jugar a las damas que era capaz de mejorar su juego aprendiendo por su cuenta. Hace nada menos que sesenta años años que este programa ganó a Robert Nealey, un maestro en el juego.

Comparado con algunos de los logros actuales puede parecernos poca cosa, pero hay que pensar que en buena medida esta hazaña abrió un ámbito científico-tecnológico nuevo, y de un potencial inmenso. Además, hablamos de seis décadas atrás, cuando el IBM 7094 en el que se ejecutaba este programa tenía una potencia de cálculo ridícula, incluso comparándola con un móvil actual, a pesar de costar casi tres millones de dólares de la época.

Para hacer que las máquinas aprendan se usan datos, a modo de ejemplos representativos de lo que ha de aprenderse, y algoritmos que guían el uso de esos datos para aprender a resolver el problema abordado. No hay magia en el aprendizaje automático. Son matemáticas que aprenden, como les digo a mis alumnos. Matemáticas que dan el soporte formal a los algoritmos diseñados para calcular el valor de aquellos parámetros que al final rigen el comportamiento de la máquina una vez que esta ha aprendido.

Los parámetros a calcular, que en los modelos más complejos para el procesamiento del lenguaje pueden llegar a superar el billón, se ajustan a partir de ejemplos. Esos ejemplos son, pongamos por caso, radiografías de tórax con y sin nódulos cancerosos.

A través de los algoritmos que procesan esas imágenes y ajustan los parámetros que condicionan la respuesta de la máquina ante ellas, podemos diseñar un sistema capaz de detectar dichos nódulos sobre nuevas imágenes. Son imágenes obtenidas ya en condiciones normales de operación y con nuevos pacientes, a los que se quiere diagnosticar. En todo caso, no es coser y cantar (o contar, por ser más preciso), ya que la labor, en este caso humana, de quien ha de prepararlo todo para que los algoritmos hagan su trabajo, es crítica y compleja.

Al final, con los algoritmos adecuados, la potencia de cálculo suficiente y muchos datos, sobre todo datos de calidad, podemos conseguir que los coches conduzcan solos, traducir en segundos y con alta calidad textos inmensos o descubrir nuevos fármacos, por citar solo algunos ejemplos de una lista que crece a diario.

Los algoritmos, por otra parte, no han de aprender los ejemplos al pie de la letra (o del dato, más bien), ya que no se trata simplemente de dar la respuesta pertinente a cada uno de los ejemplos de los que dispongamos en un momento dado. Si fuese tan simple, sería suficiente con tener una tabla, por grande que fuese, con las entradas posibles y las respuestas o salidas del sistema para cada una de ellas. No, esto no nos vale, ya que los problemas reales son mucho más complejos que eso.

Las entradas pueden ser prácticamente infinitas, sin ir más lejos. Pensemos en el ejemplo de las radiografías de tórax, que no es precisamente de los más difíciles. Las imágenes a tratar tienen una gran variabilidad y los nódulos a detectar pueden presentar en ellas un sinfín de formas, tamaños, ubicaciones... En definitiva, nunca tendremos a priori todos los casos que puedan aparecer cuando ya analicemos las radiografías de nuevos pacientes.

Aprender a partir de ejemplos requiere, por tanto, poder generalizar a partir de lo aprendido. Así lo hacemos las personas, de hecho. Cuando de niños nos enseñan un perro, no solo aprendemos a reconocerlo en condiciones muy diversas (de frente y de lado, estando cerca o lejos y en condiciones muy diversas de iluminación) sino que pronto aprendemos a reconocer muchos otros perros, incluso de razas distintas, y con el tiempo a cualquier perro, lo hayamos visto antes o no.

En definitiva, para nosotros aprender, pero también para las máquinas, no es solo almacenar algo como la lista de los reyes godos o los cabos de España. Si bien aprender un número de teléfono no tiene alternativa a su memorización ni mejor uso que poder marcarlo para hablar con alguien, para reconocer a su dueño no sería suficiente con tener instalada en nuestro cerebro su fotografía, por fiel que esta fuese. Aunque parezca un poco exagerado, no volveremos a ver exactamente igual a alguien que hayamos visto solo unos segundos antes. Un leve giro en su cara, una mueca, una sonrisa, ya la harían distinta, pero nosotros seguimos viendo en ella a la misma persona. Si la memoria y el modo en que el pensamiento la usa no estuviesen unidos, aquella sería poco más que un listín de teléfonos.

Precisamente esa memoria que alimenta el pensamiento me ha traído a la cabeza, por asociación de ideas, el chiste en el que dos amigos están hablando distendidamente y uno le dice al otro que un amigo común se ha aprendido entera la guía telefónica de Madrid. Entonces, el otro responde sorprendido: ¿de memoria?, y el primero replica: ¡Noooo, fue razonándola!, antes de que le fuese mal de la risa.