Senén Barro: «As tecnoloxías da linguaxe son a parte fundamental da IA»
Este xoves déronse a coñecer os resultados dos tres últimos anos de traballo do Proxecto Nós
Difundir os principais avances logrados no trienio 2022-2025 no marco das tecnoloxías lingüísticas, en particular para o galego, tanto a nivel de datos, como de ferramentas tecnolóxicas, modelos de IA e casos de uso, recursos dispoñibles en aberto. Ese foi o obxectivo da xornada de presentación de resultados do Proxecto Nós dentro do proxecto Ilenia, do Goberno de España, que se celebrou onte no Centro de Estudos Avanzados da USC e que contou cun elevado número de asistentes.
Aleida Alcaide, directora general de IA do Ministerio para a Transformación Dixital e da Función Pública, foi a encargada de abrir a xornada poñendo o foco en que se pecha a etapa da rede Ilenia dando paso a Alia, a nova infraestrutura pública de IA en español e linguas cooficiais (catalán, valenciano, euskera e galego). Alcaide tamén asegurou que se producirán importantes avances en Galicia coa fábrica europea de intelixencia artificial que se instalará no Cesga destacando o «talento gallego».
Pola súa parte, Elisa Fernández Rei e Senén Barro, responsables dos dous centros de investigación que lideran o Proxecto Nós, o Instituto da Lingua Galega (ILG) e o Centro Singular de Investigación en Tecnoloxías Intelixentes da USC (Citius), deron o agradecemento a todas as entidades colaboradoras, ademais do Ministerio e a Xunta de Galicia.
Fernández Rei destacou que na actualidade existe «un amplo abalo de recursos multilingües, se ben recoñeceu que «aínda queda moito por facer». Tamén quixo facer referencia a que é preciso ver «se podemos garantir os dereitos lingüísticos en calquera lingua que falemos».
Pola súa banda, Senén Barro, comezou a súa intervención apuntando que «as tecnoloxías da linguaxe son a parte fundamental da IA». O director do Citius recoñeceu que foron tres anos de «duro traballo» pero agora o obxectivo é «que xurdan iniciativas novas». Barro cre que para valorizar estes recursos precisánse iniciativas público-privadas «xa que isto ten que acabar en produtos e servizos». Pensando nun futuro, sostivo que é preciso «un compromiso do Estado coas comunidades autónomas que teñen linguas propias».
O galego é a décima lingua do mundo con máis horas rexistradas en Common Voice
Entrando xa nos resultados do Proxecto Nós nestes últimos tres anos, detalladas por investigadores do propio proxecto, Adina Vladu foi a encargada de falar dos datos. Neste tempo recopiláronse «grandes cantidades» obtidos a través de acordos de cesión de datos e campañas de captación en voces en Common Voice. De cara a un futuro esperan novos acordos de colaboración, «fluxos de datos estables con provedores» e bases sólidas para a colaboración cidadá. Conseguiuse que a lingua galega sexa hoxe a décima do mundo con maior número de horas recollidas na plataforma pública Common Voice, ao multiplicar por 20 a súa presenza, pasando de 18 a 367 horas de rexistros de voz dispoñibles. A maiores, a plataforma ten 8.674 usuarios e 1.001.739 frases.
Sobre o coñecido tradutor neuronal Nós, Pablo Gamallo recordou que ademais de textos traduce ficheiros «en máis de dez formatos». Pode ser utilizado por calquera usuario e, ee cara a un futuro, buscarase a tradución neuronal da linguaxe administrativa e a integración en asistentes IA e dispositivos de uso corrente. Como exemplo puxo un sistema de voz para «traducir en directo aulas universitarias».
Por último, sobre o apartado das voces, falou Carmen Magariños que as definiu como «de alta calidade e naturalidade». O Proxecto Nós conta con locutores profesionais e as voces son libres e de código aberto. Na actualidade disponse de seis voces, tres masculinas e tres femininas.
Magariños tamén detallou sobre os AhoMyTTS que serve para a personalización de voces sintéticas para as persoas que perden a voz ou teñen discapacidade na fala.
A maiores, a xornada incluíu unha mesa redonda sobre ‘A importancia do galego no mundo dixital’, así como unha presentación das dúas factorías de IA en España. En concreto, a factoría 1HealthAI, foi presentada por Lois Orosa, director do Cesga, o centro no que residirá o núcleo de infraestruturas e operativo de dita factoría.
