Édition de textes et de corpus numériques (Moyen Âge - XVIe s.)

Domaine d’expertise : langue et littérature française, niveau L2 / L3 / M1

Description du stage : l’objectif du stage est de participer à la création d’éditions numériques de textes anciens (Moyen Âge et/ou XVIe s.), en collaboration avec l’équipe de linguistes-philologues du groupe Cactus (Corpus en diAChronie, Textométrie et Usages) de l’IHRIM.
Différents aspects de l’édition numérique pourront être abordés :
  Scannage, océrisation et vérification d’éditions imprimées de textes médiévaux ou du 16e siècle
  Transcription manuelle de texte à partir de manuscrits ou d’imprimés anciens
  Utilisation des techniques d’HTR (Handwritten text recognition / reconnaissance de l’écriture manuscrite) pour faciliter le travail de transcription
  Vérification et recherche de métadonnées sur les textes
  Enrichissement d’un Thesaurus des noms propres
  Alignement des textes numériques et des images de manuscrits correspondants

Apport pédagogique : découverte de textes variés du Moyen Âge et du XVIe s., initiation à la philologie numérique et aux outils d’édition numérique savante et d’analyse des textes, appropriation des outils collaboratifs numériques

Lieu du stage : ENS de Lyon

Période du stage : à définir. De 70 à 100 heures échelonnées entre novembre 2024 et juin 2025

Encadrement : A. LAVRENTIEV (IR CNRS) et C. GUILLOT-BARBANCE (MCF)

Contact : Celine.Guillot ens-lyon.fr