Annotation linguistique du corpus de fabliaux

Domaine d’expertise, niveau : études médiévales, histoire ou langue et littérature française, niveau L2 / L3 / M1

Description du stage : L’objectif du stage est de participer à la vérification et à la correction des lemmes (formes du dictionnaire) et étiquettes grammaticales dans le corpus des fabliaux de la Base de français médiéval (http://txm.bfm-corpus.org). L’annotation est faite automatiquement et la vérification s’effectue à l’aide du logiciel Pyrrha. La correction manuelle permet d’enrichir le corpus d’apprentissage pour les logiciels (et ainsi améliorer l’annotation automatique dans l’avenir) et augmente la précision de l’analyse linguistique et stylométrique du corpus.

Apport pédagogique : La vérification de l’annotation linguistique est un excellent moyen d’apprentissage du vocabulaire et de la grammaire du français médiéval. Tous les fabliaux sont traduits en français moderne, ce qui facilite la tâche des personnes qui ne sont pas expertes en langue et littérature françaises médiévales. La maîtrise des logiciels d’annotation, d’analyse et de publication de corpus, des dictionnaires en ligne et des jeux d’étiquettes est désormais incontournable pour les médiévistes.

Encadrement : C. PIERREVILLE (PR U. Lyon 3) et A. LAVRENTEV (IR CNRS)

Lieu du stage : ENS de Lyon, télétravail possible

Période du stage : à définir. De 70 à 100 heures échelonnées entre novembre 2024 et juin 2025

Contact : corinne.pierreville univ-lyon3.fr