Édition de textes et de corpus numériques (Moyen Âge - XVIe s.)
Domaine d’expertise : langue et littérature française, niveau L2 / L3 / M1
Description du stage : l’objectif du stage est de participer à la création d’éditions numériques de textes anciens (Moyen Âge et/ou XVIe s.), en collaboration avec l’équipe de linguistes-philologues du groupe Cactus (Corpus en diAChronie, Textométrie et Usages) de l’IHRIM.
Différents aspects de l’édition numérique pourront être abordés :
– Scannage, océrisation et vérification d’éditions imprimées de textes médiévaux ou du 16e siècle
– Transcription manuelle de texte à partir de manuscrits ou d’imprimés anciens
– Utilisation des techniques d’HTR (Handwritten text recognition / reconnaissance de l’écriture manuscrite) pour faciliter le travail de transcription
– Vérification et recherche de métadonnées sur les textes
– Enrichissement d’un Thesaurus des noms propres
– Alignement des textes numériques et des images de manuscrits correspondants
Apport pédagogique : découverte de textes variés du Moyen Âge et du XVIe s., initiation à la philologie numérique et aux outils d’édition numérique savante et d’analyse des textes, appropriation des outils collaboratifs numériques
Lieu du stage : ENS de Lyon
Période du stage : à définir. De 70 à 100 heures échelonnées entre novembre 2024 et juin 2025
Encadrement : A. LAVRENTIEV (IR CNRS) et C. GUILLOT-BARBANCE (MCF)
Contact : Celine.Guillot ens-lyon.fr