Fes voluntariat amb la teva veu i ajuda a que la tecnologia entengui i parli el català

Comparteix

Compartir en altres xarxes socials

01/03/2022

Entitat redactora

LaviniaNext

Autor/a

Carlos Faneca

El projecte AINA, impulsat pel Departament de la Vicepresidència i de Polítiques Digitals i Territori i el Barcelona Supercomputing Center (BSC), elaborarà recursos digitals per posar-los a disposició d'empreses i entitats.

Siri, Alexa, Cortana, Bixby, Google Assistant... Aquests són els més coneguts, però d'assistents de veu n'hi ha molts, cada cop més. Malgrat que la llista d'eines digitals de veu és llarga, cadascuna d'elles comparteixen una característica que ens afecta, i molt, a Catalunya. I és que cap dels assistents de veu, existents actualment, entén i parla català. Per tal de capgirar aquesta situació, el projecte AINA treballa per crear les infraestructures lingüístiques necessàries perquè les ciutadanes de Catalunya puguin fer vida digital amb normalitat.

La tasca de la iniciativa, impulsada pel Departament de la Vicepresidència i de Polítiques Digitals i Territori i el Barcelona Supercomputing Center (BSC), és la de recollir dades suficients al voltant del català i la veu, així com la creació de recursos digitals, posant-los a disposició d'empreses i entitats d'arreu del món, quelcom que permeti a la ciutadania participar en català, sense obstacles, en el món digital, una situació que, com hem dit, ara per ara no és possible.

"No pot ser que, com a ciutadania, normalitzem el fet que, quan ens adrecem a una màquina, ho haguem de fer en una altra llengua. Si ho normalitzem, haurem perdut una oportunitat enorme: hem de poder fer vida digital en català amb normalitat", explica la Marta Villegas, responsable del projecte AINA al Barcelona Supercomputing Center.

Villegas destaca que la tecnologia de la llengua han sofert un canvi disruptiu tecnològicament, des de fa cinc anys, amb l'ús de les xarxes neuronals profundes que ha suposat una "absoluta revolució". I, per què no hi és el català en aquesta revolució? Per què hi ha dades insuficients i per què, malgrat ser un nínxol de mercat interessant, les empreses no tenen els recursos bàsics per incloure el català en aquesta tecnologia. És aquí on l'administració pública tracta de proveir d'aquesta infraestructura a qui la vulgui utilitzar.

Quan ens referim a aquesta tecnologia, no només parlem de grans empreses tecnològiques i d'assistents de veu. Parlem també d'empreses locals, emprenedores i PIMES, i de xatbots, assistència al client i altres eines en les quals el català encara no és present, sobretot, per manca de recursos.

Voluntariat amb la veu

Tal com assenyala Villegas, una de les passes més importants per desenvolupar el projecte AINA és recollir totes les dades possibles entorn de la veu. Per a funcionar correctament, la tecnología necessita una gran quantitat de dades. És en aquest punt on la ciutadania té un paper essencial. I és que qualsevol persona que vulgui pot posar a disposició del projecte, de forma voluntària, la seva veu i ajudar, així, a fer entrar el català en una tecnologia que ja ha demostrat la seva projecció i potencial.

Per ampliar les dades al voltant del català, les persones responsables del projecte AINA han iniciat una campanya de recollida de veu demanant, a milions de persones, la seva col·laboració. "Necessitem moltes dades perquè el sistema reconegui la veu en català en totes les seves varietats: la veu d'home, la de dona, de diferents edats, de diferent procedència geogràfica, diferents accents, etcètera, i també pugui generar veu per comunicar-se", explica Villegas.

Aquesta setmana hem assolit la fita de 1.500 hores enregistrades al #CommonVoiceCAT !
Recordeu que també podeu col·laborar amb el projecte Aina
Validant els talls de veu
Escrivint i validant frases escrites: https://t.co/w2sVje0XcO
— Aina (@projecte_aina) February 25, 2022

Per fer aquesta recopilació, el projecte AINA s'ha adherit al projecte Commonvoice, una iniciativa de crowdsourcing impulsada per Mozilla que Softcatalà ha liderat a casa nostra. "Hem tingut molt èxit de participació, però la campanya continua. Afortunadament, vivim en un país en el qual la gent, de seguida que es fa una crida, se sent interpel·lat i actua", valora la responsable del projecte AINA al Barcelona Supercomputing Center. Així que, qualsevol persona que vulgui donar la seva veu o els seus textos, és benvinguda.

Aquesta recopilació de dades es va iniciar al primer any de projecte, al 2020, quan es va fer un primer corpus textual massiu, aconseguint 10 gigabytes de dades, amb més de 1.700 milions de paraules, fins ara, explica Villegas, el corpus més gran que hi ha pel català. En el temps que el projecte AINA porta actiu, hi ha ens que han aportat les seves dades com, per exemple l'Enciclopèdia Catalana, Racó Català o l'Agencia Catalana de Notícies, o persones a títol individual, com Màrius Serra.

Etiquetes