El poder de les dades per a la indústria, i per a moltes coses més
Aquest és el títol d’una sessió que farem a la Cambra el proper 3 de maig, en el marc del projecte Ocupació al Bages Industrial (en vindran més… sobre impressió 3D, realitat augmentada, robòtica, etc.). No va del mes de les flors, sinó que parlarem de la Revolució Industrial que ens ve basada en les dades. I entre d’altres coses, en la Intel·ligència Artificial en majúscules.
Quan parlem d’Intel·ligència Artificial, el primer que ens hem de treure del cap és la ciència-ficció de pel·lícules com Blade Runner o Una Odissea a l’Espai. Molt bones però no com a pista del que ens ve. Tampoc les tesis dels flipats de la Singularity University californiana de Silicon Valley ens donen gaire llum. El Terminator encara no arriba, però potser sí el seu germà petit anomenat Gran Germà…
No parlem doncs d’una Intel·ligència forta sinó d’una intel·ligència dèbil, estreta i molt focalitzada. No parlem d’una Intel·ligència General amb consciència de si mateixa (què coi ha de ser així si encara no sabem en realitat què és la consciència en tots els seus aspectes o amb prou feines definim què és intel·ligència, des del QI fins a l’emocional…), sinó de processos cibernètics amb molta capacitat de càlcul i moltes dades de tot tipus. És a dir, parlem d’estadística sofisticada (regressions logístiques iterades N vegades amb dades etiquetades o no, arbres de decisió, xarxes neuronals, aprenentatge profund…), massa dur per a un “necessita millorar” de matemàtiques elementals. Però de màgia no en té res. Com diu un dels gurús, el xinès Andrew Ng (no m’he equivocat en escriure el cognom, si et plau corrector intel·ligent, no ho canviïs) “preocupar-nos per la Singularitat en la Super IA és com preocupar-nos per la sobrepoblació i contaminació a Mart”.
La gràcia de tot és anar convertint les dades que tenim en números que puguin passar per un algoritme de tractament. Per exemple, un text està composat de paraules, doncs cada paraula es converteix en un vector d’un mapa amb unes coordenades especifiques, és a dir, uns números determinats. Com més pròximes estan les coordenades, més relació de significat tenen les paraules. Això està en la base del que fa Google o qualsevol altra aplicació cada segon del nostre dia. Per reconèixer imatges i trobar patrons en aquestes, se segueix un procediment similar: cada píxel és un número i es reconeixen i comparen imatges a través de sèries molt llargues de números. Més o menys ben explicat, la revolució de les dades és aquesta. No és res màgic, però té moltes derivades de tot tipus.
Una primera i que aplica a la nostra indústria (som una comarca molt més industrial que la mitjana catalana o europea) és que “tota tasca que pugui ser automatitzada o mesurada per eficiència l’acabaran fent les màquines”. És a dir, partint de les moltes dades generades, i per exemple a través d’una de les tècniques de la Intel·ligència Artificial més popular avui com és el Machine Learning, extreure’n coneixements aplicables. I per tant el primer que s’ha de fer és anar preparant i treballant les dades, pensar en les preguntes sobre els problemes a resoldre, pensar si cal en les possibles respostes i les derivades d’aquestes. La IA com a software es convertirà o ja s’està convertint es una commodity de software aplicat com a servei. I el que passa és que les empreses petites, excepte les molt tecnificades, no hi han pensat encara.
Les altres derivades de què parlàvem abans són tant o més importants (també en parlarem en el transcurs del programa Ocupació al Bages Industrial a través de les conseqüències socials, ja vàrem abans parlar de les laborals) i tenen a veure amb cap on anem tots plegats, si cap a una democràcia 2.0 o cap a un nou feudalisme 2.0. Si alguna cosa és inherent a les dades i els algoritmes és el biaix, tot queda registrat i sempre es parteix d’una determinada concepció del món del que és desitjable i el que no. I tot per fer prediccions del que passarà, des de quan fallarà el motor fins a si podré pagar el deute o trencaré una llibertat condicional. I les prediccions són probabilitats.
El nostre futur sembla que ha agafat un camí matemàtic. Millor que n’estudiem.
Jaume Ferrer. Responsable de l’àrea d’Internacionalització de la Cambra de Comerç de Manresa
big data | dades | INDUSTRIA 4.0