Investigadors de la Universitat Pompeu Fabra i l’empresa tecnològica Sorensen han creat una eina pionera que permet, per primer cop, que les persones sordes signants puguin fer ràdio utilitzant una veu sintètica personalitzada:
Es tracta de SignarIA, un projecte que té com a responsable tècnic a un tianenc, el Xavi Vinaixa. Actualment, Vinaixa centra la seva activitat a redefinir l’aplicació de la intel·ligència artificial i el processament de llenguatge des d’una mirada ètica, conscient i humanista. Des del 2023 és el director tècnic de Sorensen, una empresa que desenvolupa solucions d’intel·ligència artificial per mitjans, educació, cultura i arts. “Ens vam ajuntar perquè volíem començar a explorar el món de la IA, que jo ja ho estava fent a nivell individual, però sobretot de cara a fer una IA més amb visió humana i amb visió ètica”, explica:
L’oportunitat de treballar en el projecte de SignarIA li va arribar a través del Josep Maria Ganyet, CEO de Sorensen i professor del Departament de Comunicació de la Pompeu:
SignarIA es va començar a gestar als passadissos de la universitat per donar resposta a una necessitat molt concreta: la de la Berta, la primera alumna sorda que cursava el grau de Periodisme. Davant l’assignatura de primer ‘Teoria i tècniques del periodisme audiovisual l’, dedicada a la ràdio, l’estudiant va plantejar el repte de trobar una manera de cursar l’assignatura en igualtat de condicions que els seus companys.
A partir d’aquesta demanda, l’equip docent i investigador va iniciar un procés de recerca que ha derivat en el desenvolupament d’un prototip tecnològic que permet transformar la llengua de signes catalana en una veu personalitzada. Un projecte que “casa perfecte amb la nostra filosofia”, diu el Xavi:
Per dur a terme aquest prototip, el Xavi explica que “hem tingut la sort de comptar amb els lingüistes de la UPF que tenen una expertesa en llengua de signes impressionant”:
Per a ell ha sigut tot un repte d’enginyeria. “Ens hem hagut d’inventar coses”, diu. “El primer que ens vam inventar és el sistema de detecció de signes”:
El segon repte amb què es van trobar és que “encara que generem moltes dades, seguim no tenint prou dades com per a fer un sistema finalista”:
El tercer repte va ser el de la veu. “Necessitàvem que hi hagués una identitat pròpia de la persona”, diu. Per aconseguir-ho, han reconstruït el timbre potencial de la Berta utilitzant la prosòdia de la seva cosina, a partir de la qual han creat una veu híbrida que barreja la seva identitat latent amb el to familiar:
La presentació oficial de SignarIA s’ha fet aquest dimarts 17 de març amb les ponències dels dos investigadors principals, Marcel Mauri i Roger Cassany; els enginyers del projecte, Xavi Vinaixa i Inés Broto, i la presentació dels resultats qualitatius del projecte a càrrec de la lingüista i investigadora Gemma Barberà i la coordinadora del projecte Cecilia Barba.
La sessió va culminar amb la taula rodona “Periodisme i inclusió, l’assignatura pendent” i amb una demostració en directe del prototip a través de la Júlia Vila, una entrevistadora sorda signant que va utilitzar SignarIA per fer-li una entrevista a la periodista Mònica Terribas. “Van estar molt bé les preguntes, van estar molt bé les respostes, i l’acte en general va estar molt bé també perquè la meitat de la sala eren persones sordes”, explica el Xavi:
A més, durant el torn obert de preguntes va intervenir el pare de la Júlia, que va comentar que els hi havien presentat moltes solucions tecnològiques, però que aquesta era la primera vegada que veia una que realment pensava en preservar la llengua de signes:
Per a ell, això és molt important perquè amb aquest projecte “no els volem esborrar la identitat”, diu:
“Crec que s’ha de visibilitzar molt més tot el tema de la llengua de signes, perquè molta gent creiem, per desconeixement, que la llengua de signes catalana és català signat, i no és veritat”, afegeix:
Vinaixa també remarca que SignarIA “no busca substituir als intèrprets”:
El que han presentat, doncs, és un primer prototip. Ara, “estem buscant més línies de subvenció, més finançament, per ampliar-ho més encara, per ampliar més coses, i fer també el pas invers, que seria de veu oral a llengua de signes”:
“És un prototip funcional, el que passa és que està fet per una persona en concret, tot i que ja ho hem pensat perquè sigui escalable”, afegeix:
De moment, amb aquest prototip la Berta ja podrà participar de manera directa al Taller Integrat de Periodisme de tercer, que inclou quinze hores setmanals de ràdio. “Ella també l’anirà millorant perquè el sistema va aprenent amb les decisions”, diu el Xavi Vinaixa:
Més enllà de l’eina en si, el projecte SignarIA ha generat una sèrie de conjunts de dades de lliure accés per impulsar la recerca en el reconeixement i la síntesi de la llengua de signes catalana. “A mi cada projecte m’enriqueix, però la veritat és que humanament [SignarIA] m’està enriquint un munt”, diu el Xavi. A més, per a ell és un camp fascinant perquè “està tot per fer”. “Estem picant pedra i estem fent coses inèdites i estem creant coneixement”, diu:
A banda de SignarIA, Vinaixa desenvolupa altres projectes, com és el cas de Larsson, una caixa d’eines per a periodistes i creadors de continguts que té la transcripció en dos o tres idiomes alhora com a eina estrella:
“La idea sempre és que et tregui la feina feixuga, la feina que no té valor”, diu. L’última milla, però, sempre ha de ser humana:
El Xavi Vinaixa va conduir, juntament amb el Pere Esteve, el taller d’intel·ligència artificial que va tenir lloc a l’Espai Dioptria. Durant tres sessions, van ensenyar a utilitzar i a treure partit d’eines pràctiques per a la recerca i la creació de text i contingut audiovisual amb una perspectiva ètica i crítica sobre el seu impacte. “Crec que la visió esbiaixada que la gent té de la IA és culpa de les falses expectatives”, explica:
El taller va anar molt bé. “A mi em va encantar que hi hagués gent molt jove, gent de totes les edats, homes, dones…”, diu:
Vinaixa acaba amb una última reflexió. “La intel·ligència artificial és el reflex de la nostra intel·ligència, perquè si nosaltres som prou intel·ligents i prou hàbils per extreure aquest coneixement, doncs ens donarà el coneixement, però si no ho som, no ho farà”: