Exploration orientée-utilisateur de données semi-structurées

Résumé:

À travers le monde, la création, l’utilisation et le partage sans
précédent des données contribue à de nouvelles applications et
opportunités économiques. Ces données sont souvent larges, hétérogènes
en schéma comme en modèle, et plus ou moins structurées. Pour y mettre
de l’ordre, le consortium du World Wide Web recommande de partager des
graphes RDF, ce qui a été majoritairement adopté dans l’Open Data
(données ouvertes), mais beaucoup d’autres formats sont utilisés en
pratique. C’est le cas des journalistes qui récoltent des jeux de
données de différents acteurs, qui ne se sont pas coordonnés. Plus
généralement, les utilisateurs et producteurs de données (novices ou
non) qui doivent trouver, utiliser ou partager des jeux de données se
trouvent face à un exercice difficile. Dans cette présentation, nous
proposons de nouvelles méthodes pour (i) produire le schéma d’un jeu de
données semi-structuré, (ii) énumérer un ensemble de chemins
intéressants dans ces données, et (iii) aider au requêtage de ces données.

Bio :

Nelly Barret est doctorante à Inria et l’Institut Polytechnique de Paris
(France). Elle travaille sous la supervision de Ioana Manolescu dans
l’équipe CEDAR. Son travail de thèse a pour but de faciliter
l’exploration et l’utilisation de jeux de donnés semi-structurés pour ds
utilisateurs novices, tels que les journalistes. Plus généralement, ses
centres d’intérêt se situent entre l’intégration de donnés, les données
hétérogènes, le management de données, mais aussi les données
géographiques et cartographiques. Elle a obtenu son Master à
l’Université de Lyon (France) en 2020.

Ajouter au calendrier Tous les événements