TECNOLOGÍA
Un proyecto de la Universidad de Lleida y RTVE alumbra la primera IA entrenada en ‘lleidatà’
El ente público finiquita el plan y se queda con el modelo y los datos en los que se basa

El técnico César Padial, el alumno Pau León y la profesora Mariona Visa en el estudio.
Un proyecto en el que han participado la UdL, RTVE y la empresa tecnológica leridana Monoceros Labs ha alumbrado el primer programa de Inteligencia Artificial (IA) que utiliza como lenguaje específico el lleidatà, es decir, el catalán con la pronunciación característica de la demarcación de Ponent. El proyecto se encuentra en suspenso actualmente.
Un proyecto en el que han colaborado el grado de Comunicación de la UdL, RTVE y la empresa tecnológica leridana Monoceros Labs ha alumbrado el primer programa de inteligencia artificial (IA) entrenado en Lleidatà, la variante occidental del catalán con la pronunciación característica de las comarcas de Ponent.
“Ya existe una base para producir IA en lleidatà”, explica Mariona Visa, una de las cinco profesoras de la universidad leridana que, junto con Guillem Suau, Metzeri Sánchez y Rosalía Sánchez, todos ellos de Comunicación, y Carlos Rizos, de Filología, han participado en el proyecto.

Pau León cursava 4t de Comunicació. - UDL
El proyecto, que fue cambiando conforme evolucionaba, arrancó en marzo del año pasado, cuando la UdL y el departamento de Estrategia Tecnológica de RTVE suscribieron un convenio que en principio debía finalizar con la creación de una IA para informar sobre las elecciones al Parlament en pueblos de menos de mil habitantes. “Se trata de un medio público, y ahí la IA no puede sustituir a los periodistas ni su labor, por lo que optamos por las localidades a las que los medios no llegan”, explica Visa.
El adelanto electoral dio al traste con el proyecto, lo que les llevó a buscar una nueva orientación. “Pensamos en trabajar los contenidos de El Tiempo, que se basa en datos fácilmente interpretables por la IA”, añade la profesora.
En julio comenzaron a trabajar en el diseño del proyecto en audio, que iba a traducir al lleidatà las previsiones meteorológicas de cinco pequeñas localidades: Llimiana, Bossòst, La Pobla de Cérvoles, Torà y El Soleràs. Y, para ello, comenzaron a grabar las locuciones con la voz femenina de la meteoróloga leridana Sònia Papell y la masculina de Pau León, alumno de cuarto curso de Comunicación.
Utilizaron como base 500 frases con alocuciones habituales de El Tiempo que, una vez revisados por los profesores, León fue grabando con su acento en el estudio de grabación de la UdL con la supervisión del técnico de sonido César Padial. Las de Papell ya estaban en soporte audiovisual.
“Las grabaciones duraron tres días. Cuantos más textos se leen, más se enriquece la IA”, señala la profesora.
Sin embargo, aclara, “la voz del alumno no es la que luego se escucha en las alocuciones que genera la IA, sino que las grabaciones se pasaron a Monoceros para que la entrenara con ese acento. Una vez acabado ese proceso, a la IA se le puede hacer decir lo que sea”, añade.
El proceso incluyó algunas complicaciones entre las que destacaron la dificultad que el programa encontraba para pronunciar correctamente ruixat (aguacero), migdia, lleuger y lleugera.
Lo mismo ocurrió con la tendencia de la IA a pronunciar cel (cielo) como sa (sano) y, también, con la inclinación a cerrar la e de set y, por lo tanto, a poner una sensación de sequedad donde, en realidad, debía sonar un número.
El programa de IA estuvo generando contenidos de previsión meteorológica para esas cinco localidades desde noviembre hasta el 25 de diciembre, cuando RTVE decidió suspenderlo.
La nueva dirección, de hecho, prescindió en enero de todo el departamento de Estrategia Tecnológica que dirigía Pedro Vila, con lo que el convenio que había firmado la UdL se quedaba de un día para otro sin contraparte que vaya a permitir la continuidad de los trabajos.
Sin embargo, y pese a haber sido impulsado por dos entes públicos, ni el modelo ni los datos utilizados para el entrenamiento son de dominio público y uso universal sino que son propiedad de RTVE.
El documento fue firmado el 15 de abril del año pasado, coincidiendo con la celebración de la 21ª Semana de la Comunicación, y tenía una vigencia inicial de un año. A partir de la misma fecha de este año, las dos partes podían decidir su renovación por periodos anuales hasta un máximo de cuatro anualidades.
Los audios están disponibles en RTVE

Caràtula de l’última locució per IA disponible de Llimiana. - UDL
Los audios generados a través de IA con las previsiones meteorológicas de varias semanas de Llimiana, El Soleràs, Bossòst, La Pobla de Cérvoles y Torà se encuentran disponibles en la web rtveia.es. Se accede a ellas en la pestaña Meteo Lleida, donde está el acceso a las locuciones de cada localidad.