Indexer les corpus numériques
Coordination / Contacts
Emmanuelle Perrin-Touche – Projet Marc Michel Rey
et Fabienne Vial-Bonacci – Projet Charles Perrault
L’édition critique est l’un des axes structurants de l’IHRIM qui mène en particulier de nombreux projets d’éditions numériques, pour lesquels il jouit d’une véritable reconnaissance...
Séance 2 | Indexation et modélisation
(Ré)écouter les communications de la seconde séance du Séminaire
Captation vidéo : Christian Dury - Montage : Inès Gil-Martinez / MSH Lyon St-Étienne
L’édition critique est l’un des axes structurants de l’Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM UMR 5317). Le laboratoire mène en particulier de nombreux projets d’éditions numériques, pour lesquels il jouit d’une véritable reconnaissance. Dans ce domaine en pleine expansion des Humanités numériques, le partage des compétences et la diffusion des bonnes pratiques se révèlent essentiels.
Pour l’édition numérique de corpus, la constitution d’index est un véritable enjeu scientifique et technique, pour lequel il existe encore peu de documentation. Les index relèvent, avec l’annotation, de l’exploitation scientifique des textes édités : ils sont des outils de navigation dans le corpus et participent à sa compréhension en identifiant les personnes, les lieux et les œuvres mentionnés, ainsi que les matières traitées. L’exploitation de ces données aide par exemple à visualiser des réseaux de relations.
Les référentiels et les notices d’autorités permettent d’uniformiser et de consolider les index grâce à l’emploi d’un vocabulaire contrôlé et de formes normalisées. Ils apportent des solutions au traitement des variantes des patronymes, des toponymes et des titres d’ouvrages. Dans la perspective du Linked Open Data, l’alignement sur des référentiels aide à enrichir les données d’un projet en les complétant avec d’autres ressources et bases de données (data.bnf.fr, IdREF, VIAF, ISNI).
L’atelier, fondé sur le partage d’expériences d’ingénieurs et de chercheurs impliqués dans l’édition de corpus numériques, vise à définir les bonnes pratiques utiles à l’établissement d’index, pour identifier et documenter de manière univoque une notion ou une entité nommée : quels sont les référentiels à utiliser ? Comment valoriser au mieux son corpus ? Comment structurer ces données ? Quelles sont les solutions techniques ?
Le programme de cet atelier propose des présentations générales, des échanges autour de projets en cours et une table-ronde technique, animée par des ingénieurs. Les participants sont invités à suivre les deux journées pour faire part de leurs questions lors de la table-ronde.