La mejor tesis de humanidades digitales: “Por primera vez hemos calculado la probabilidad de ‘padecer’ un apellido”

La profesora de la USC María José Ginzo recibió el reconocimiento por un trabajo sobre técnicas estadísticas en geolingüística

Creó una biblioteca de código abierto con los métodos desarrollados para el uso de investigadores 

María José Ginzo, en la Facultad de Matemáticas de la Universidade de Santiago

María José Ginzo, en la Facultad de Matemáticas de la Universidade de Santiago / Natalia Sequeiro

Aplicar metodología estadística a datos de apellidos. Ese era el objetivo del trabajo “Técnicas estadísticas en geolingüística. Modelización onomástica”, de María José Ginzo Vilamayor, profesora ayudante doctora en el Departamento de Estatística, Análisis Matemática y Optimización de la USC, que viene de ganar el Premio Sociedad Internacional de Humanidades Digitales Hispánicas-Fundación BBVA a la Mejor Tesis Doctoral 2023.

María José Ginzo, también investigadora vinculada al Centro de Investigación e Tecnoloxía Matemática de Galicia (CITMAga), relata en conversación con EL CORREO que la onomástica en general se venía estudiando desde hace muchos años con metodología que se aplica en el ámbito lingüístico y también en el ámbito de la biología. “Nosotros le hemos dado otro enfoque tratando los apellidos con técnicas estadísticas avanzadas”, incide.

Variedades dialectales

Bajo la dirección de la profesora Rosa Mª Crujeiras Casais, el objetivo inicial era “analizar si la regionalización de los apellidos en Galicia se asemeja a la actual división de las variedades dialectales del gallego”. La conclusión es que el mapa resultante se parece notablemente al de las actuales diócesis en Galicia, que incluye municipios tanto de la propia comunidad autónoma como de Castilla y León.

Este mismo estudio también se llevó a cabo en la comunidad autónoma de Asturias observando que la agrupación de los apellidos coincide con las variedades lingüísticas del asturiano. Este análisis también se aplicó a las variedades lingüísticas del catalán, utilizando datos de apellidos de Cataluña, Comunidad Valenciana e Islas Baleares, las zonas donde se habla el catalán. “Concluimos que los apellidos en esta gran área también se agrupan conforme a las distintas variedades dialectales del catalán”, relata.

El análisis de la relación entre la distribución territorial de los apellidos y los dialectos, según Crujeiras, ha dado diferentes resultados en los estudios de países y comunidades europeas. Como ejemplo, en Francia se encuentran similitudes entre la regionalización de los apellidos, en cambio en los Países Bajos no.

Los datos de Galicia fueron proporcionados por el Instituto Galego de Estatística (IGE). Los datos de Asturias se obtuvieron de la Sociedad Asturiana de Estudios Económicos e Industriales (SADEI) y los datos restantes provienen del Instituto Nacional de Estadística (INE).

Caracterizar a la población

Con el estudio se confirmó que los apellidos pueden ser una fuente valiosa de información para caracterizar a la población de una región. Hasta ahora, no existían estudios tan detallados de Galicia desde esta perspectiva. “En el Instituto de Lingua Galega (ILG) hay expertos en onomástica, pero no habían empleado la estadística de la manera en que lo hicimos nosotros”, relata.

En concreto, modelaron los datos de los apellidos “aplicando metodologías similares a las utilizadas en la modelización de enfermedades”, empleando técnicas estadísticas avanzadas basadas en Estadística Bayesiana. La idea es calcular la probabilidad de “sufrir” o de “padecer” un apellido en una región específica. Esto, en palabras de la profesora, implica tomar un apellido y analizar su zona de influencia para “determinar hasta dónde se extiende”. La colaboración con investigadores del ILG, como el profesor Xulio Sousa, ha sido beneficiosa para esta tesis. “Nosotros podemos realizar numerosos cálculos matemáticos, estadísticos, pero es esencial que ellos los validen, es decir, que ayuden a ver el sentido y la explicación a los resultados obtenidos”, comenta.

El trabajo ofrece una biblioteca de código abierto que incluye las técnicas aplicadas en la investigación, permitiendo la replicabilidad del estudio y la reutilización de la herramienta por parte de la comunidad científica. “Los métodos que he desarrollado están recopilados en un software estadístico de uso libre llamado OnomasticDiversity, librería de R. De este modo, cualquier investigador que desee aplicar esta metodología a datos de apellidos puede hacerlo”, aclara. Además, este enfoque puede utilizarse desde una perspectiva ecológica, ya que una parte de la tesis trata los apellidos como si fueran especies. Ginzo pone como ejemplo de esto lo que llevaría el nombre de “evolución de los García a través del tiempo”.

“Adentrar la estadística en el campo de las humanidades”

La profesora presentó la tesis el 20 de mayo de 2022, si bien la convocatoria del premio salió en el año 2023 y no se falló hasta este año. 

“Recibir este reconocimiento fue una fuente de alegría enorme para mí, ya que representa algo que trasciende nuestro ámbito cotidiano, la Universidad, Santiago e incluso los congresos de estadística a los que asistimos”, manifiesta.

 Este trabajo ha tenido un impacto significativo al poner la estadística al servicio de la sociedad y adentrarse en el campo de las humanidades. “Tiene una gran repercusión y permitirá aprovechar al máximo estas herramientas”, dice. La profesora destacó la importancia de la transversalidad, debido a la colaboración con otros equipos de investigación en Filología o Historia.