Com fa el que fa la IA generativa
Executive HR Talent - Ingenio Leadership SchoolProfessor associat de la UdL
Els chatbots que coneixem i utilitzem són exemples d’intel·ligència artificial generativa perquè produeixen o generen llenguatge que ens permet interaccionar-hi per a qualsevol cosa que necessitem consultar. Com poden entregar o resoldre pràcticament qualsevol cosa que els demanem? Com fan el que fan?1. El que fa la IA és resultat de com s’ha programat. El codi de programació de la IA generativa és un conjunt d’algoritmes d’aprenentatge automàtic. Aquest punt de partida és important, perquè l’aprenentatge automàtic no es compon del codi lineal habitual d’un programa d’ordinador (del tipus si A és més gran que 10 llavors X, o si A és menor que 10 llavors Y) sinó que consisteix en un conjunt d’algoritmes que estableixen probabilitats i patrons, o prediuen, quina paraula o paraules seran les següents, o quin pas serà el següent (una versió senzilla seria la predicció de text en WhatsApp). Des de meitat del segle passat la investigació científica ha conceptualitzat matemàticament les operacions lingüístiques i lògiques que possibiliten que un programa pugui respondre de manera molt semblant a com ho faria una persona gràcies a algoritmes, que són conjunts de regles i operacions per resoldre problemes.2. Amb l’aprenentatge automàtic un programa pot arribar a aprendre a realitzar tasques per a les quals no se l’ha programat. Tanmateix, per dialogar de manera aparentment natural amb una persona, i contestar o resoldre peticions (prompts), un programa ha de treballar amb alfabet, paraules, imatges i so, és a dir, amb dades relativament desestructurades o desiguals. Perquè pugui fer això es va desenvolupar un tipus d’aprenentatge automàtic anomenat aprenentatge profund, que són algoritmes (regles i operacions) encara més complexos, perquè imiten les estructures mentals que utilitzem al tractar amb la parla, el text o les imatges. Aquests algoritmes més complexos, organitzats per milers, formen xarxes neuronals que poden treballar amb grans quantitats d’informació (dades) per identificar patrons, i amb això reconèixer o entendre escriptura, veu o imatges.3. El 2014 es va arribar a un nou algoritme d’aprenentatge automàtic, les Xarxes Generatives Antagòniques, que permet que un programa generi resultats que sembla que siguin originals. Aquests resultats que ens proporciona la IA generativa que semblen originals (que sembla que hagi pensat) són producte de proporcionar dades a xarxes neuronals perquè competeixin entre si al generar noves dades, i que així puguin ser més autèntiques per a la persona que ha fet la petició o consulta la màquina. Atenció, amb aquestes xarxes neuronals la IA no només contesta el que li preguntem, a més pot donar-nos idees, suggeriments o comentaris, i això és el que converteix la IA generativa en més versàtil i útil.4. L’últim pas és on entren les grans companyies digitals amb molts diners per invertir. Quan a tota aquesta programació complexa se l’alimenta amb la Viquipèdia, amb tots els llibres publicats, i qualsevol cosa disponible a internet, és a dir, amb bilions i bilions de dades, la IA està fent anar el que es denomina Models de Llenguatge de Gran Mida. Al reconèixer pautes en aquests models, i reordenar la informació en aquestes pautes, els chatbots d’IA generativa poden fer el que fan: respondre’ns i ajudar-nos en segons.