Cursos

Actividades Académicas
Atrás

Filología Digital en español: corpus, estilometría y análisis de datos

Información General

Código
65Z6
Horas
30
Fecha
04 Ago 2025
08 Ago 2025
Precio
157,5 € Tarifa C
Tipo
ACTUALIZACIÓN Y FORMACIÓN CONTINUA
Temática
Cursos avanzados de español
ECTS
2,5

Sede donde se gestiona

Santander

Lugar de impartición

Santander

Descripción de la actividad

DESTINATARIOS:

Estudiantes de estudios hispánicos de último año de grado, posgrado o doctorado

OBJETIVOS

1) Familiarizarse con los principios básicos de la transcripción paleográfica y de la edición de textos hispánicos asistidos con los nuevos desarrollos en las humanidades digitales--reconocimiento automático de escritura manuscrita (HTR) y procesamiento del lenguaje natural (NLP).

2) Adquirir las nociones de ecdótica del manuscrito necesarias para la selección de materiales adecuados para obtener datos lingüísticos.

3) Entender las técnicas para el estudio de la variación lingüística en textos de diferentes épocas.

4) Aprender a evaluar la fiabilidad filológica de los corpus del español más conocidos y empleados.

5) Adiestrarse en las técnicas para controlar la variación cronológica, geográfica y diastrática en el análisis de datos de textos de diferentes épocas.

6) Reflexionar sobre el papel actual de las humanidades digitales en relación con las disciplinas lingüísticas y literarias.

CONTENIDOS

Bloque 1. Introducción. Taller de buenas prácticas en la edición de textos medievales y clásicos (Andrés Enrique-Arias).

Bloque 2. Los corpus lingüísticos del español: definición, criterios de clasificación, tipología (Andrés Enrique-Arias, Francisco Gago-Jover)

Bloque 3. Del documento antiguo al hipertexto digital: teoría y prácticas de transcripción, edición y conformación de corpus documentales (Francisco Gago-Jover, José Manuel Fradejas Rueda).

Bloque 4. Los corpus lingüísticos paralelos: tipología, creación y aprovechamiento (Andrés Enrique-Arias). Taller de variantes textuales y variación lingüística (Marina Gomila Albal).

Bloque 5. Explotación de corpus para estudios lingüísticos: frecuencia léxica, variantes, colocaciones, estilometría, etc. (José Manuel Fradejas Rueda, Francisco Gago-Jover). Taller de utilización del Old Spanish Textual Archive.

Bloque 6. Explotación y visualización de datos de corpus lingüísticos: primer acercamiento a R, creación de gráficos y mapas. Presentación del Atlas Histórico del Español (Marina Gomila Albal)

PERFIL DEL PROFESORADO PARTICIPANTE

Andrés Enrique Arias es catedrático de lengua española en la Universidad de las Islas Baleares. También ha impartido docencia en Boston University, Harvard, Ca’Foscari Venecia. Tiene más de un centenar de publicaciones sobre historia del español, sociolingüística, el español y el catalán en Mallorca y el empleo de técnicas de investigación para el análisis lingüístico en corpus textuales digitales. Es el director del corpus Biblia Medieval y del Atlas Histórico del Español.

Francisco Gago-Jover, catedrático de español en el College of the Holy Cross, es autor de numerosas obras sobre lexicografía y creación de corpus lingüísticos, además de un importante número de transcripciones paleográficas de textos medievales. Ha impartido cursos de doctorado en diversas universidades de Europa y Estados Unidos, y talleres sobre humanidades digitales en áreas como paleografía y diseño de corpus lingüísticos. Es también co-editor del Old Spanish Textual Archive.

José Manuel Fradejas Rueda, catedrático de lengua española en la Universidad de Valladolid. Actualmente su investigación se centra en la edición digital de textos medievales (etiquetado semántico y morfológico), la aplicación de sistemas HTR para la transcripción de textos manuscritos e impresos antiguos y la minería de textos (y estilometría) con R. Es colaborador del Old Spanish Textual Archive.

Marina Gomila Albal es profesora ayudante doctora en la Universidad de las Islas Baleares. Investiga principalmente sobre morfosintaxis histórica desde un punto de vista dialectal y ha impartido talleres de análisis y visualización de datos lingüísticos con R. Trabaja en el Atlas Histórico del Español, proyecto dirigido por Andrés Enrique Arias, que supone la publicación online de mapas de los principales fenómenos de variación en la historia del español

Horas lectivas del curso: 30

Lugar:  Universidad Internacional Menéndez Pelayo - Campus de Las Llamas – Santander

Fechas: 4 de agosto al 8 de agosto de 2025

Horario Propuesto: de 09:00 h. a 14:00 h. y de 16:00 h. a 18:00 h. de lunes a jueves. Viernes de 9 a 13:30 h.