Santiago
+15° C
Actualizado
martes, 23 abril 2024
16:11
h

Nova versión do Corpus de Referencia do Galego Actual con novidades

Contempla máis de 43 millóns de palabras ortográficas e 51 millóns de gramaticais

Santiago. O secretario xeral de Política Lingüística, Valentín García, participou onte na presentación da versión 4.0 do Corpus de Referencia do Galego Actual (CORGA) no marco do convenio entre o Centro Ramón Piñeiro para a Investigación en Humanidades, dependente da Xunta, e a Universidade de Santiago (USC).

Trátase dun corpus documental aberto a través de internet que abrangue cronoloxicamente desde 1975 ata a actualidade co obxectivo de fornecer datos para o estudo da lingua galega actual desde múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica, comunicativa etc.

O secretario xeral saudou “esta nova versión do Corpus, un proxecto que continúa avanzando para poñer a disposición dos lingüistas que se ocupan do galego novas funcionalidades que permitan facer estudos cada vez máis amplos e variados”.

Este recurso, un dos máis destacados do Centro Ramón Piñeiro, é unha ferramenta en liña potente, flexible, amigable e tamén innovadora, de suma utilidade para extraer datos da lingua galega actual de tipo léxico, gramatical, terminolóxico, fraseolóxico, discursivo etc.

Enriquecido automaticamente coa etiquetaxe morfosintáctica dos seus textos, o Corpus contén 43.162.364 palabras ortográficas (51.451.088 elementos gramaticais) pertencentes maioritariamente a distintos tipos de textos escritos representativos do galego actual, mais tamén inclúe preto de 45 horas de transcricións, sobre todo de programas de radio, nas que se aliña o texto coa voz.

Esta nova versión 4.0 presenta utilidades tan innovadoras como son a recuperación de información pola modalidade inventario, o recoñecemento automático median- te regras lingüísticas dos apreciativos en -iño, os relativos en -ísimo e unha boa parte das formas con gheada, así como a posibilidade de realizar estudos desde a perspectiva de xénero, ben tendo en conta as formas con grafías innovadoras para linguaxe inclusiva, ben atendendo á discriminación dos resultados en función do sexo do autor.

Tamén participaron neste acto María Sol López Martínez, Guillermo Rojo (directores do proxecto), Eva María Domínguez; Ernesto González e Francisco Mario Barcala. redacción

10 feb 2022 / 18:37
  • Ver comentarios
Noticia marcada para leer más tarde en Tu Correo Gallego
TEMAS
Tema marcado como favorito
Selecciona los que más te interesen y verás todas las noticias relacionadas con ellos en Mi Correo Gallego.