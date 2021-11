A CANTIDADE DE DATOS e información dispoñible é inmensa e inimaxinable hai non tantos anos. Eu crecín academicamente levando información dun computador a outro mediante discos flexibles que almacenaban os bytes por miles. Identifiquen byte e letra, para ter unha referencia aproximada, e falabamos duns centos de páxinas de texto, que en pouco tempo xa foron miles e cos discos duros millóns. Hoxe o tamaño da internet é de varios Zettabytes. Ou sexa, varios miles de trillóns de bytes. Seguindo coa referencia das páxinas de texto, se distribuísemos o contido da rede entre a poboación mundial, tocaríanos a cada persoa máis de 10.000 tomos, cada un deles de mil páxinas.

Esta crecente dispoñibilidade de datos e de potencia de computación, está a levar a que haxa quen anuncie o fin do método científico, substituíndoo pola aprendizaxe automática. As máquinas encargaríanse por si soas de descubrir o coñecemento que dun modo ou outro reside nos datos, aínda que estea oculto aos nosos ollos. Poderíase así liquidar o método que guiou o avance científico a través da observación sistemática daquilo que se quere coñecer ou explicar, da medición, a experimentación e a formulación de hipóteses, a súa análise e a súa modificación.

Esta idea xa foi exposta en 2008 na moi influente revista do ámbito tecnolóxico “ Wired”. Concretamente nun artigo de título ben explícito: “O fin da teoría: o diluvio de datos deixa obsoleto o método científico”. Desde entón quen cre que esta é xa a realidade son cada vez máis. Supoño que en xeral persoas que non fixeron nunca ciencia.

Sen hipóteses razoables que guíen o que se busca e como se busca, o big data non é máis que “big rubbish”, ou sexa, lixo ao grande, e a aprendizaxe automática queda nunha infinidade de probas e erros, con escasa probabilidade de chegar a algo útil.

Entre os datos e a información hai coñecemento por medio. O valor da temperatura dun corpo só se transforma en febre cando sabemos que falamos da temperatura dunha persoa, esta é superior a 37 graos centígrados e as condicións nas que se atopaba a persoa e foi tomada a temperatura, ademais das características e fiabilidade do termómetro, son as adecuadas para iso. Ese coñecemento non se pode ignorar nese salto do dato á información. Do mesmo xeito, pasar dos datos ao coñecemento esixe a intermediación dun método científico, que pode non facerse explícito, pero non pode estar ausente.

En definitiva, como xa ocorreu ao longo da historia da ciencia, as técnicas da aprendizaxe automática e big data achegan novos recursos á inmensa caixa de ferramentas conceptuais, formais e tecnolóxicas que manexa o método científico para seguir avanzando no coñecemento, pero non o substitúen.