Alumnado de Filoloxía da USC revisa fragmentos de voz en galego para o seu uso en tecnoloxías intelixentes

Trinta estudantes, tras analizar uns 23.000 na plataforma Common Voice, apreciaron as distintas variedades dialectais e pronuncias

Participantes no Validatón ILG recibindo instrucións de Adina Vladu

Participantes no Validatón ILG recibindo instrucións de Adina Vladu / Cedida

Trinta estudantes da Facultade de Filoloxía da USC, coa colaboración de dez docentes e investigadores, participaron recentemente nunha xornada que servirá para acelerar o desenvolvemento de tecnoloxías da lingua galega. Revisáronse máis de 30.000 fragmentos de voz en galego na plataforma Common Voice nunha actividade enmarcada no Proxecto Nós, que desenvolve de forma conxunta o Instituto da Lingua Galega (ILG) e o Centro Singular de Investigación en Tecnoloxías Intelixentes (Citius). 

O Proxecto Nós xa desenvolveu o pasado ano o primeiro tradutor neuronal multilingüe feito en Galicia, o primeiro recoñecedor de voz que entende o galego oral e o converte a texto e unha aplicación de síntese de voz que a partir dun texto é quen de ler en galego.

Common Voice é unha plataforma pública de datos de voz alimentada por persoas voluntarias de todo o mundo que doan a súa voz, lendo unha serie de frases que veñen proporcionadas, e tamén contribúen xulgando como válidas ou non as doazóns xa feitas por outras persoas. O obxectivo deste proxecto colaborativo é crear grandes corpus de datos orais que poidan ser empregados para adestrar modelos de recoñecemento da fala en distintas linguas, entre as que está o galego. “Para crear estas tecnoloxías de intelixencia artificial necesítanse enormes cantidades de datos de voz, e a maioría, especialmente as que usan as grandes compañías, non están dispoñibles ao tratarse de datos pechados”, comenta a EL CORREO a investigadora do Proxecto Nós, Adina Ioana Vladu, quen asegura que “ Common Voice axuda a que as tecnoloxías sexan accesibles para todas as persoas que queiran desenvolvelas”.

Na actualidade son 120 linguas incluídas na plataforma e outras en desenvolvemento, que integra falantes de distintos xéneros, idades, variedades dialectais e rexistros.“É interesante que os datos sexan diversos para que logo o recoñecemento da fala sexa o máis inclusivo posible”, manifesta Adina Vladu.

 Validar os fragmentos de voz en galego doados en Common Voice permitirá que no futuro distintas aplicacións informáticas poidan comprender as persoas que falen en lingua galega. En palabras de Vladu, trátase de tecnoloxías que co paso do tempo “estarán máis presentes na sociedade”. Son dispositivos con interface por voz, axentes conversacionais como Siri e Alexa e sistemas de tradución.

A actividade, que levou o nome de Validatón, desenvolveuse o pasado martes 19 de marzo nas instalacións do ILG, de 16 a 20 horas. O número total de validacións realizadas en Common Voice foi de 23.314, o que supuxo un 64% de todos os fragmentos certificados nesa xornada na plataforma en todas as linguas.

“O obxectivo diario de validacións do proxecto para cada lingua é de 2.400 votos, polo que nunha soa tarde chegamos a preto do 1.000% da meta diaria”, asegura.

En referencia ao galego, a investigadora comenta que o número de validacións varía en función do día, habendo máis de xeito habitual nas fins de semana. Con todo, asegura que “todos os días se utiliza a aplicación para validar o galego e todos os días hai persoas que doan a súa voz”. Na actualidade hai máis de 3.000 persoas rexistradas como doantes de voz de galego, unha lingua activa na base de datos dende o ano 2021.

No apartado de ‘escoitar’, calquera persoa que sexa galegofalante, debe responder á pregunta que leva por título: “dixeron a frase de forma precisa?” Adina Vladu explica que o principal a comprobar é “que o texto que le unha persoa se corresponda coa pronunciación do mesmo”.

Tras a finalización da actividade, cada estudante tivo que dar a súa opinión das validacións realizadas. O máis habitual son problemas de carácter técnico. “En ocasións dase que o micrófono pode non ter a calidade suficiente polo que se introducen ruídos innecesarios e interrómpese o audio, ou ben non se rexistra o son”, pon como exemplo. Tamén pode haber problemas coas frases “xa que calquera persoa pode rexistralas na plataforma, e en ocasións non hai unha correspondencia exacta”.

Todos os estudantes coincidiron en que “hai moita variedade dialectal, de rexistros e nas pronuncias”. Isto é para Vladu un aspecto positivo. “Queremos que a xente que lea represente todos os fenómenos do galego como poden ser a gheada ou o seseo”, relata.

Os estudantes que se achegaron ao Instituto da Lingua Galega, ademais de participar no Validatón, puideron coñecer o centro. Ademais, a persoa que máis fragmentos validou, un total de 1.299, o estudante Nicolás Acebedo Torrego, recibiu un premio de 100 euros, mentres as outras nove persoas finalistas obteron un agasallo sorpresa.