Édition de textes et de corpus numériques (Moyen Âge - XVIe s.)

L’objectif du stage est de participer à la création d’éditions numériques de textes anciens (Moyen Âge et/ou XVIe s.), en collaboration avec l’équipe de linguistes-philologues du groupe Cactus (Corpus en diAChronie, Textométrie et Usages) de l’IHRIM.
Différents aspects de l’édition numérique pourront être abordés :

  • Scannage, océrisation et vérification d’éditions imprimées de textes médiévaux ou du 16e siècle
  • Transcription manuelle de textes à partir de manuscrits ou d’imprimés anciens
  • Utilisation des techniques d’HTR (Handwritten text recognition / reconnaissance de l’écriture manuscrite) pour faciliter le travail de transcription
  • Vérification et recherche de métadonnées sur les textes
  • Enrichissement d’un Thesaurus des noms propres
  • Alignement des textes numériques et des images de manuscrits correspondants

Domaine d’expertise et niveau : langue et littérature française, niveau L2 / L3 / M1

Apport pédagogique : découverte de textes variés du Moyen Âge et du XVIe s., initiation à la philologie numérique et aux outils d’édition numérique savante et d’analyse des textes, appropriation des outils collaboratifs numériques

Durée, période et modalités du stage : stage de 2 mois maximum, période à définir

Encadrement :