TECNOLOGIA PROJECTES
Ensenyar català a les màquines
Ensenyar a comprendre i parlar el català als dispositius electrònics intel·ligents és l’objectiu que té el Projecte Aina, impulsat pel departament de la Vicepresidència i de Polítiques Digitals i Territori de la Generalitat amb la col·laboració del Barcelona Supercomputing Center - Centre Nacional de Supercomputació (BSC-CNS). El projecte busca crear una base de dades de text i veu que representi tots els dialectes de l’idioma perquè les màquines puguin generar un llenguatge digital.
Fins ara 30.000 persones han donat la seua veu a la campanya La nostra llengua és la teva veu, assolint el milió de registres a la plataforma Common Voices. Tot i així, el director general d’Innovació i Economia Digital de la Generalitat, Dani Marco, destaca que hi ha dos problemes. D’una banda, s’han registrat 1.400 hores, de les quals tan sols 400 han estat verificades, és a dir, n’hi ha mil que no es poden confirmar. És per això que demanen que la ciutadania col·labori a través de la plataforma escoltant els àudios i confirmant que s’entenen i tenen bona qualitat.
Un altre dels problemes és la falta de diversitat dialectal. De les hores verificades, el 53% pertany a la Catalunya Central, seguida del dialecte nord-occidental –es parla les comarques de Lleida (excepte Aran), així com Priorat, Terra Alta, Baix Ebre, Montsià, Ribagorça, Llitera, Baix Cinca i Matarranya– que representa un 4%. “Hi ha una infrarepresentativitat del territori”, assegura Marco. A això s’hi suma el fet que el perfil majoritari del donant correspon a un home de mitjana edat. Per això, demanen que més dones i persones joves i majors de 50 anys col·laborin per poder representar el català en la seua totalitat.
El projecte va nàixer a finals del 2020 amb la creació d’una base de dades de text. Ara l’objectiu és aconseguir més veus i verificar les que ja tenen. Val a destacar que cap aportació s’utilitzarà per donar veu a cap assistent virtual.
Quina finalitat té el Projecte Aina?
La idea és que els sistemes d’intel·ligència artificial tinguin un fons de veu per poder entrenar-se i entendre el català. Això serviria per als assistents de veu o els chat box, entre d’altres. Per què és rellevant aquesta iniciativa per al català? Això que estem fent amb el català ho haurien de fer totes les llengües perquè, altrament, les empenyem a l’extinció digital.
Com s’hi pot col·laborar?
Qualsevol persona pot donar la seua veu a través de la plataforma Common Voices gravant cinc frases. També es pot validar els registres.