Nova versión do Corpus de Referencia do Galego Actual con novidades
Contempla máis de 43 millóns de palabras ortográficas e 51 millóns de gramaticais
Santiago. O secretario xeral de Política Lingüística, Valentín García, participou onte na presentación da versión 4.0 do Corpus de Referencia do Galego Actual (CORGA) no marco do convenio entre o Centro Ramón Piñeiro para a Investigación en Humanidades, dependente da Xunta, e a Universidade de Santiago (USC).
Trátase dun corpus documental aberto a través de internet que abrangue cronoloxicamente desde 1975 ata a actualidade co obxectivo de fornecer datos para o estudo da lingua galega actual desde múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica, comunicativa etc.
O secretario xeral saudou “esta nova versión do Corpus, un proxecto que continúa avanzando para poñer a disposición dos lingüistas que se ocupan do galego novas funcionalidades que permitan facer estudos cada vez máis amplos e variados”.
Este recurso, un dos máis destacados do Centro Ramón Piñeiro, é unha ferramenta en liña potente, flexible, amigable e tamén innovadora, de suma utilidade para extraer datos da lingua galega actual de tipo léxico, gramatical, terminolóxico, fraseolóxico, discursivo etc.
Enriquecido automaticamente coa etiquetaxe morfosintáctica dos seus textos, o Corpus contén 43.162.364 palabras ortográficas (51.451.088 elementos gramaticais) pertencentes maioritariamente a distintos tipos de textos escritos representativos do galego actual, mais tamén inclúe preto de 45 horas de transcricións, sobre todo de programas de radio, nas que se aliña o texto coa voz.
Esta nova versión 4.0 presenta utilidades tan innovadoras como son a recuperación de información pola modalidade inventario, o recoñecemento automático median- te regras lingüísticas dos apreciativos en -iño, os relativos en -ísimo e unha boa parte das formas con gheada, así como a posibilidade de realizar estudos desde a perspectiva de xénero, ben tendo en conta as formas con grafías innovadoras para linguaxe inclusiva, ben atendendo á discriminación dos resultados en función do sexo do autor.
Tamén participaron neste acto María Sol López Martínez, Guillermo Rojo (directores do proxecto), Eva María Domínguez; Ernesto González e Francisco Mario Barcala. redacción