Pot tenir un ordinador cultura general, sentit comú, empatia i capacitat de raonar? Ara mateix un pilot automàtic veu el seu entorn, però l’arribarà a entendre? Què és un algorisme d’autoaprenentatge? Com es programa una xarxa neuronal?

A l’Institut d’Investigació en Intel·ligència Artificial (IIIA) del CSIC han desenvolupat un munt d’aplicacions. Una d’elles és capaç de generar narracions audiovisuals a partir de descripcions de les imatges. Per exemple, en un partit de futbol la màquina identifica automàticament el més destacable: gols, penals, faltes i contraatacs, i en fa un resum més ràpid que qualsevol periodista.
L’equip d’Ulises Cortés a la UPC ha desenvolupat un caminador intel·ligent, adreçat a persones amb dificultats de mobilitat. El dispositiu és capaç de mesurar paràmetres físics de les persones, que, convenientment tractats, es podrien traduir en estats d’ànim i permetria millorar-los la qualitat de vida.
L’enginyer Miquel Montero ha treballat durant 15 anys en la computació avançada, la teoria de la informació, la neurolingüística i la psicologia, per desenvolupar un nou model cognitiu anomenat Atomian. El model és capaç de transformar les paraules en unitats mínimes indivisibles, o àtoms de coneixement. Això permet interessant aplicacions. Per exemple, el Servei Català de Salut ha acumulat 180 milions de documents accessibles des de qualsevol centre mèdic de Catalunya. Tanmateix, no hi ha manera d’extreure’n la major part de la informació automàticament. Atomian podria accedir al sistema, llegir tots els documents, entendre’ls i respondre preguntes com: quantes vegades s’ha administrat un determinat medicament, o fer una anàlisi qualitativa dels casos d’ictus.





El test de Turing
La intel·ligència artificial va néixer entre els anys 40 i 50 del segle XX, com una disciplina de la informàtica. Un dels seus principals fundadors va ser el matemàtic britànic Alan Turing. Entre les seves moltes contribucions hi ha un test per discernir si una màquina mostra o no un comportament intel·ligent. Ve a ser una mena d’interrogatori: una persona, l'avaluador, fa preguntes per escrit a un interlocutor desconegut, sense veure’l ni sentir-lo. Si després d'analitzar la conversa l'avaluador no és capaç de saber si parla amb una persona o amb una màquina, o confon la màquina amb una persona, la màquina superaria el test de Turing i es consideraria intel·ligent.

Definició de IA

Hi ha moltes definicions d’intel·ligència artificial. Per Ulises Cortés, del Departament de Ciències de la Computació, UPC:
La IA és una disciplina científica que té com a objectiu entendre quins són els mecanismes subjacents a la intel·ligència animal i intentar reproduir-los en una màquina per comprendre’n la seva naturalesa.
Per Ramon López de Mántaras, Director IIIA, CSIC:
Una intel·ligència ha de tenir una sèrie d’ingredients necessaris, com per exemple la capacitat d’aprendre, la capacitat de fer raonament, la capacitat de comunicar, la capacitat de percebre el seu entorn, per prendre decisions, fer accions, etc.
I per Miquel Montero, CEO Atomian:
Avui dia IA és qualsevol forma d’innovació algorítmica. És a dir, quan algú s’inventa un programa d’ordinador, que fa una cosa que fins llavors no se sabia com fer acció, es considera IA.

Racionalitat artificial
Potser l’àmbit en què la intel·ligència artificial s’ha fet més popular és als escacs. Aquest joc es considera el paradigma de la racionalitat i la intel·ligència humana; per tant, aconseguir una màquina que guanyés els humans va ser un repte tecnològic de primer ordre. Ara dissenyem màquines que s’enfronten entre elles i juguen milers de partides en un sol dia. Amb el director de l’Institut d’Intel·ligència Artificial, Ramon López de Mántaras, reproduïm una partida mítica jugada pels supercomputadors AlphaZero i StockFish-8 el desembre de 2017. El primer ordinador que va vèncer el campió mundial d’escacs Garri Kaspàrov va ser Deep Blue l’any 1996. No tenia la capacitat d’aprenentatge de les màquines actuals, però ho compensava amb molta més força bruta: analitzava 200 milions de jugades per segon. Tot i així, havia d’eliminar de l’anàlisi moltes de les jugades inútils, ja que analitzar totes les jugades possibles als escacs requeriria milions d’anys de càlcul a l’ordinador més potent del món. A l’Institut d’Intel·ligència Artificial han desenvolupat un munt d’aplicacions. Una d’elles és capaç de generar narracions audiovisuals a partir de descripcions de les imatges. Per exemple, en un partit de futbol la màquina identifica automàticament el més destacable: gols, penals, faltes, contraatacs, i en fa un resum més ràpid que qualsevol periodista. Arreu del món segurament l’aplicació d’IA que més expectació genera és el cotxe autònom, desenvolupat per diverses empreses com Tesla o Google. Aquesta tecnologia reduirà molt la sinistralitat, però alhora ha obert un encès debat sobre quin criteri haurà de seguir el cotxe en situacions conflictives: protegir l’ocupant del vehicle o el transeünt?

Emocions artificials
Amb el test de Turing també és possible detectar si l’interlocutor té emocions. La vida és com una obra de teatre. Hi ha moments còmics i moments tràgics, hi ha riure i enuig, amor i odi, enveja i admiració, por i coratge. Un conjunt d’emocions exclusivament humanes... De moment no hem trobat la manera de programa estats d’ànim a les màquines. El que sí que poden fer són activitats artístiques. Alguns programes interpreten una partitura donant-li expressivitat musical. Basant-se en partitures d’estructura similar, interpretades per humans, la màquina aprèn a modificar el vibrato, la intensitat del so, avançar o retardar notes, modificar-ne la durada o produir-les més o menys lligades, per aconseguir una interpretació musical amb personalitat. Altres programes poden produir pintures imitant a la perfecció l’estil d’algun gran artista, o recombinar el contingut i l’estil de diverses imatges en una nova creació. Una app de la plataforma Google Arts & Culture utilitza IA en el reconeixement facial per trobar el nostre doble històric. Alguns resultats són sorprenentment semblants i farien pensar en la reencarnació. El programa no només identifica el sexe, l’edat, o els trets més característics de la fisonomia individual, pot reconèixer fins i tot l’estat d’ànim. Però la millor manera d’interpretar les emocions humanes és a partir de la interacció amb nosaltres. L’equip d’Ulises Cortés a la UPC treballa en sistemes d’IA capaços de mesurar paràmetres físics de les persones, que, convenientment tractats, es podrien traduir en estats d’ànim. Per exemple, han desenvolupat un caminador intel·ligent, adreçat a persones amb dificultats de mobilitat, per millorar-los la qualitat de vida. Carme Caralps, de 92 anys, fa de conillet d’Índies i els ajuda a provar els prototips. Al damunt d’una estructura convencional, el caminador intel·ligent incorpora un seguit de sensors i actuadors a les rodes i a les manetes. Les dades de desplaçament, velocitat, força de recolzament o temps d’activitat, s’enregistren en un petit ordinador situat sota la cadira.

Intel·ligència artificial general

Un altre tipus de preguntes que podem fer al test serveixen per avaluar la cultura general. La màquina que millor respon a preguntes de cultura general és Watson. Creada per IBM, va aconseguir una fita històrica l’any 2011 quan va vèncer els campions de Jeopardy!, un popular concurs televisiu americà. Watson tenia accés a 200 milions de pàgines de text, inclosa la Wikipedia sencera en anglès. Els seus algorismes ajusten models estadístics complexos a quantitats massives de dades. És a dir, Watson dona respostes probabilístiques, llegeix molt, i molt de pressa, sense entendre res. Els humans, en canvi, avancem a poc a poc i amb bona lletra. El llenguatge l’utilitzem per accedir a conceptes subjacents. Si reflexionem una mica veiem que les paraules designen entitats diferents d’elles mateixes. La paraula “llibre” no és el llibre mateix, sinó només la manera de designar-lo. Aquest procés és fonamental per entendre, i ha servit d’inspiració per desenvolupar un nou model cognitiu anomenat Atomian. El seu creador, l’enginyer Miquel Montero, ha treballat durant 15 anys en la computació avançada, la teoria de la informació, la neurolingüística i la psicologia.

Capacitat simbòlica
El model és capaç de transformar les paraules en unitats mínimes indivisibles, o àtoms de coneixement. Aleshores classifica aquests àtoms en un centenar de categories, per exemple subjecte, espai o temps, els jerarquitza i els emmagatzema en memòria. El resultat és que quan el programa llegeix ho fa de manera similar a com llegim les persones, amb la formació d’imatges mentals. Aquesta tecnologia permet interessant aplicacions. Per exemple, el Servei Català de Salut ha acumulat 180 milions de documents accessibles des de qualsevol centre mèdic de Catalunya. Tanmateix, no hi ha manera d’extreure’n la major part de la informació automàticament. Atomian podria accedir al sistema, llegir tots els documents, entendre’ls i respondre preguntes com: quantes vegades s’ha administrat un determinat medicament, o fer una anàlisi qualitativa dels casos d’ictus. Però a banda de les aplicacions concretes, Atomian té molt més potencial. Amb la seva capacitat simbòlica podria superar definitivament el Test de Turing.

Què és un algorisme?
La multiplicació 4x2 no sembla difícil de resoldre. Diem resoldre, que no fer, perquè fer-la seria aplicar el mètode japonès, que en aquest cas consistiria a creuar 4 línies amb 2 línies i comptar els punts d’intersecció. En lloc de fer això, per resoldre-la ràpidament apliquem unes taules que hem memoritzat de petits. En canvi, si hem de resoldre la operació 472x23, que és més complicada, haurem d’aplicar l’algorisme de la multiplicació. Un algorisme és un mètode que té un seguit d’instruccions que permeten resoldre una tasca pas a pas i que ens porten al resultat sense més raonament. Amb un algorisme ben fet, no fa falta entendre el que fas. I així treballen també els ordinadors que s’utilitzen per a la intel·ligència artificial.

Algorismes d’autoaprenentatge
Una premissa de la intel·ligència artificial és que hi hagi aprenentatge, i això no fa referència al fet que l’ordinador memoritzi cada cop més informació... sinó al fet que aprengui fent, és a dir, que modifiqui la seva resposta a partir dels resultats del que fa.
Perquè una màquina aprengui a canviar ella mateixa el seu comportament, es poden utilitzar les xarxes neuronals. Tenen aquest nom perquè estan inspirades en el funcionament de les neurones: petits elements multiestimulats, amb diverses entrades, que segons la informació que reben reaccionen -o no- i que estan enormement interconnectats entre si. Però no imagineu un fregall de cables i transistors: es tracta només de programació informàtica. És un sistema que té diverses entrades d’informació i que pot ponderar individualment cada valor per donar una resposta.
Quan hi ha una entrada d’informació, la unitat neuronal dona una resposta que pot consistir a donar una nova informació, o a no donar-la (que també és una resposta, equivalent al “no”). El sistema atorga diferents valors a la informació, segons un llindar. El llindar és un valor que cal superar per obtenir una resposta: si la resultant de tota la informació donada el supera, emetríem un senyal, posem per cas un 1. Si no supera el llindar, la resposta és zero. La gràcia de tot això és que els valors de llindar i els criteris de ponderació els va modificant el mateix programa informàtic, que és capaç de corregir-se a si mateix fins a aconseguir respostes òptimes. Òbviament, amb una sola “neurona” no es fa res, però si la resposta d’aquesta és part de les entrades d’una altra “neurona”, i aquesta va lligada a una altra i es fa una xarxa de milers ¡o milions! d’aquestes unitats, podem fer coses. Les xarxes neuronals s’utilitzen, per exemple, en el reconeixement de cares. Els sistemes actuals no comparen siluetes, no tenen plantilles d’ulls o nassos. El que fa el software és comparar valors, avalua píxels, i quan dona un resultat se li diu si l’ha encertat o no. I a còpia de milions d’errors i encerts se l’entrena.

Els experts
Amb la participació o assessorament de Ramon López de Mántaras, director de l’Institut Investigació IA, CSIC; Ulises Cortés, catedràtic del Departament de Ciències de la Computació, UPC; Carme Caralps, Atia Cortés, del Departament de Ciències de la Computació, UPC, i Miquel Montero CEO i fundador d’Atomian.


Director i presentador del programa: Jaume Vilalta
Un reportatge de: Pere Renom i Cari Pardo