César Fernández: "Una IA necessita mil·lisegons per entrenar-se i realitzar milers d'operacions"
César Fernández és Catedràtic de Ciències de la Computació i IA. Treballa al GREiA, grup que desenvolupa solucions i millores en eficiència energètica i en totes les seves línies
César, què feu a la Universitat, amb Intel·ligència Artificial? El nostre grup de recerca en IA es va fusionar amb el grup d’energia dirigit per Luisa Cabeza, i ara es diu Grup de Recerca en Energia i IA (GREIA). Nosaltres donem sortida a problemes de control. Mentre una part del grup treballa en l’estudi de nous materials d’emmagatzemament tèrmic, fotovoltaic o elèctric o implementen nous sistemes de calefacció i refrigeració en edificis, ens adonem que tot això requereix de nous sistemes de control, més complexos i experimentals. Nosaltres utilitzem la IA per aportar algorismes basats en deep learning per censar l’estat de l’edifici, intern i extern, l’evolució de temperatures i humitat o la previsió a curt termini, i en funció d’això decidim si posem bombes de calor, emmagatzemador o altres sistemes. Una solució que permeti a més reduir la despesa d’emissions de CO2.
Millora, amb la IA?
Sí, ja que són sistemes complexos que difícilment podríem controlar nosaltres, i que ens demostren que el control intel·ligent guanya el 20-25% respecte al control per part d’un expert humà.
Tinc la sensació que a vegades estem anomenant IA coses que es podrien anomenar com a alta tecnologia o algorismes complexos. Pot ser?
Sí, potser hauríem d’haver començat per definir que és la IA. La IA la defineix el 1956 John McCarthy com la capacitat de les màquines de ser intel·ligents. Val a dir que avui aquesta definició no ens serveix de gran cosa, ja que l’hem evolucionat força. Avui es divideix en feble i forta.
D’acord.
La feble té com a objectius que les màquines, a través d’accions, aconsegueixin objectius. Aquesta és l’única IA que hi ha avui en dia. Tu incorpores un sistema, li dones uns objectius, que en el cas dels nostres estudis és emetre el menys CO2 possible mantenint la gent confortable a casa seva, i la IA pren les decisions. Tu no li has donat el model de la casa, que són models termodinàmics complicadíssims, no li has dit com evolucionaran les temperatures, ho ha après ella. Això és el que fan Alexa, Siri o Alphago, se centren en objectius molt determinats i gairebé sempre ho fan millor que nosaltres. En això són millors, en aspectes molt determinats i concrets. Això és la IA feble.
I la IA forta, per tant...
La IA forta estén aquests objectius de manera global, que tu a una màquina li puguis dir: l’objectiu és aquest (per exemple, reduir les emissions de CO2 al planeta) i independentment de quin sigui, demanar-li que prengui les decisions governamentals a gran escala. A aquest punt no hi hem arribat encara. La IA forta es podria entendre com la superintel·ligència.
Creus que falta molt per arribar-hi?
No ho sap ningú, ja que fer prediccions en aquest camp és equivocar-se. La IA històricament ha patit molts daltabaixos. Va arrencar l’any 1956 amb moltes expectatives però va oscil·lar sense rumb i poca inversió, fins que a l’any 2011 apareix Alphago i ho va canviar tot, i apareixen les xarxes neurals i hardware específic. Les xarxes neurals existeixen des de fa molt temps, ja sabíem con anaven, però en el moment en què s’integren amb el Machine learning i a una escala major és quan les empreses hi veuen un filó i comencen a explotar la IA.
Tornem al GREiA. Com utilitzeu la IA?
Actualment som set investigadors que treballem en tres vessants diferents: Machine learning, xarxes neurals profundes i control emmagatzemament energètic i de consum... i hem de decidir si un dia que fa sol escalfem les bombes de calor o no.
Com ho feu?
Amb aprenentatge per reforç, que funciona com el nostre aprenentatge de petits. Inicialment no sabem res de la vida i prenem decisions aleatòries: quan alguna està bé se’ns dona un reforç positiu; si ho fem malament rebem una recompensa negativa i són accions que evitaràs. Així funcionen les màquines durant les primeres interaccions, no saben res i interactuen amb el sistema sense fer res de bo, però a partir d’accions que encerten per casualitat comencen a veure que les coses van bé. A escala humana això és molt lent però en escala màquina cada acció-reacció són mil·lisegons, això vol dir que en poques hores pots entrenar el sistema en milions d’accions de les quals algunes aniran bé, fins a arribar a un sistema quasi òptim. No serà perfecte però serà millor que el que pot fer un humà.
I com sap la màquina que ho està fent bé?
Per la recompensa. La màquina interacciona contra l’edifici i el seu entorn, que al principi és un digital twin, un bessó digital, un simulador. Nosaltres hem de modelar com es comportarà l’edifici, la temperatura, els humans dins de la casa, què encendran, què apagaran. Pots interaccionar mesos d’estada en una casa en poques hores. I la recompensa és la reducció del consum, l’estalvi i la reducció de CO2.
Què en feu, dels resultats?
Es publiquen, formen part de projectes europeus subvencionats i amb aquests resultats es construeixen prototips. Ara estem implementant sistemes a Almatret i a Puigverd. Teniu sinergies perquè això passi a l’empresa privada? No és fàcil. Per exemple amb l’Álvaro de Gracia hem treballat un sistema de les persianes movibles i ara tenim un projecte nacional amb l’objectiu d’arribar a un prototip de mercat.
A ‘Vint-i-dos’ col·laborem amb Eurecat, que fan transmissió entre recerca i món industrial.
Nosaltres estem a la banda més acadèmica i no tenim tanta interacció amb l’empresa privada. Però tenim alguna experiència recent. Fa uns anys vam col·laborar amb Ros-Roca Envirotec, que treballa en la instal·lació de plantes de recol·lecció de deixalles urbanes. Són plantes pneumàtiques, que absorbeixen les deixalles que la gent diposita en contenidors, connectats per un sistema de tubs que l’absorbeixen pneumàticament amb grans ventiladors cap a un dipòsit central. El seu consum elèctric és gran, i nosaltres ho resolem amb IA (Machine learning) i planificant les recollides de forma òptima, basant-nos en l’estat d’ocupació dels contenidors. RosRoca té diverses plantes d’aquest tipus a Barcelona. Fruit d’aquesta col·laboració han sortit dos patents d’explotació.
Dins del món acadèmic teniu algun retorn dels vostres avenços?
Sí, i no només això, sinó que gràcies a la nostra feina i publicacions hem aconseguit fitxar el Joao Marques, un investigador portuguès de primer nivell, de renom internacional, que s’incorpora al nostre grup.