TECNOLOGIA
Un projecte de la Universitat de Lleida i RTVE crea la primera IA ensinistrada en lleidatà
L’ens públic liquida el pla i es queda amb el model i les dades en què es basa

El tècnic César Padial, l’alumne Pau León i la professora Mariona Visa a l’estudi.
Un projecte en què han participat la UdL, RTVE i l’empresa tecnològica lleidatana Monoceros Labs ha creat el primer programa d’intel·ligència artificial (IA) que utilitza com a llenguatge específic el lleidatà, és a dir, el català amb la pronunciació característica de la demarcació de Ponent. El projecte es troba en suspens actualment.
Un projecte en què han col·laborat el grau de Comunicació de la UdL, RTVE i l’empresa tecnològica lleidatana Monoceros Labs ha creat el primer programa d’intel·ligència artificial (IA) entrenat en lleidatà, la variant occidental del català amb la pronunciació característica de les comarques de Ponent.
“Ja existeix una base per produir IA en lleidatà”, explica Mariona Visa, una de les cinc professores de la universitat lleidatana que, amb Guillem Suau, Metzeri Sánchez i Rosalía Sánchez, tots ells de Comunicació, i Carlos Rizos, de Filologia, han participat en el projecte.
El projecte, que va anar canviant així que evolucionava, va arrancar el març de l’any passat, quan la UdL i el departament d’Estratègia Tecnològica d’RTVE van subscriure un conveni que en principi havia de finalitzar amb la creació d’una IA per informar sobre les eleccions al Parlament en pobles de menys de mil habitants. “Es tracta d’un mitjà públic, i allà la IA no pot substituir els periodistes ni la seua tasca, per la qual cosa vam optar per les localitats a les quals els mitjans no arriben”, explica Visa.

Pau León cursava 4t de Comunicació. - UDL
L’avanç electoral va malmetre el projecte, la qual cosa els va portar a buscar una nova orientació. “Vam pensar a treballar els continguts d’El Tiempo, que es basa en dades fàcilment interpretables per la IA”, afegeix la professora.
Al juliol van començar a treballar en el disseny del projecte en àudio, que havia de traduir al lleidatà les previsions meteorològiques de cinc petites localitats: Llimiana, Bossòst, la Pobla de Cérvoles, Torà i el Soleràs. I, per això, van començar a gravar les locucions amb la veu femenina de la meteoròloga lleidatana Sònia Papell i la masculina de Pau León, alumne de quart curs de Comunicació.
Van utilitzar com a base 500 frases amb al·locucions habituals d’El Tiempo que, una vegada revisades pels professors, León va anar gravant amb el seu accent a l’estudi d’enregistrament de la UdL amb la supervisió del tècnic de so César Padial. Les de Papell ja estaven en suport audiovisual.
“Els enregistraments van durar tres dies. Com més textos es llegeixen, més s’enriqueix la IA”, assenyala la professora.
Tanmateix, aclareix, “la veu de l’alumne no és la que després s’escolta a les al·locucions que genera la IA, sinó que els enregistraments es van passar a Monoceros perquè l’entrenés amb aquest accent. Una vegada acabat aquest procés, a la IA se li pot fer dir el que sigui”, afegeix.
El procés va incloure algunes complicacions entre les quals van destacar la dificultat que el programa trobava per pronunciar correctament ruixat, migdia, lleuger i lleugera.
El mateix va ocórrer amb la tendència de la IA a pronunciar cel com sa i, també, amb la inclinació a tancar la e de set i, per tant, a posar una sensació de sequedat on, en realitat, havia de sonar un número.
El programa d’IA va estar generant continguts de previsió meteorològica per a aquestes cinc localitats des del novembre fins al dia 25 de desembre, quan RTVE va decidir suspendre’l.
La nova direcció, de fet, va prescindir al gener de tot el departament d’Estratègia Tecnològica que dirigia Pedro Vila, amb la qual cosa el conveni que havia firmat la UdL es quedava d’un dia per l’altre sense contrapart que permetés la continuïtat dels treballs.
Tanmateix, i malgrat haver estat impulsat per dos ens públics, ni el model ni les dades utilitzades per a l’entrenament no són de domini públic i ús universal sinó que són propietat d’RTVE.
El document va ser firmat el 15 d’abril de l’any passat, coincidint amb la celebració de la 21a Setmana de la Comunicació, i tenia una vigència inicial d’un any. A partir de la mateixa data d’aquest any, les dos parts podien decidir la renovació per períodes anuals fins a un màxim de quatre anualitats.
Els àudios estan disponibles a RTVE

Caràtula de l’última locució per IA disponible de Llimiana. - UDL
Els àudios generats a través d’IA amb les previsions meteorològiques de diverses setmanes de Llimiana, el Soleràs, Bossòst, la Pobla de Cérvoles i Torà es troben disponibles al web rtveia.es. S’hi accedeix en la pestanya Meteo Lleida, on hi ha l’accés a les locucions de cada localitat.