Fiche de GILLET Annabelle

picture_member_thumbnail
GILLET Annabelle
Science des Données / Enseignant chercheur
Adresse : 9, Avenue Alain Savary - Université de Bourgogne - 21078 Dijon
E-mail : annabelle.gillet@u-bourgogne.fr
Equipe : Science des Données
Fonction : Enseignant chercheur
Statut : MCF
  • Travaux de recherche
  • Enseignements
  • Publications
Travaux de recherche

La thématique générale de mes travaux concerne la gestion des données hétérogènes. Avec l’émergence du Big Data, la variété des données se manifeste au niveau du contenu, des sources de données, ou encore du modèle. En effet, les cas d’utilisation et les données elles-mêmes définissent le ou les modèles utilisés. Par exemple, le modèle relationnel permet de stocker facilement les attributs, le modèle graphe les relations entre les entités et les séries temporelles incorporent nativement une dimension temporelle.

 J’aborde cette thématique suivant deux axes :
– axe polystores :

La diversité des modèles de données servant à stocker ou traiter les données rend difficile leur exploitation. Les polystores permettent d’utiliser plusieurs systèmes de stockage hétérogènes avec une interface unifiée. Toutefois, les polystores sont bien plus complexes à mettre en œuvre qu’un système de stockage unique, puisqu’ils doivent traiter de multiple modèles de données sans perdre leur expressivité, mais également autoriser l’exécution de requêtes visant différents systèmes de stockage tout en prenant en compte leur optimisation. Je vise à proposer une formalisation basée sur la théorie des catégories représentant les différents niveaux d’abstraction des données contenues dans un polystore (par exemple modèle et schéma) et les opérations applicables sur les données.

– axe tenseurs :
Je m’intéresse également à l’analyse de données, principalement à l’aide d’opérateurs tensoriels. Les tenseurs sont des objets mathématiques multidimensionnels, qui peuvent jouer le rôle de modèle pivot pour la majorité des modèles de données. Cela est un avantage certain pour modéliser les données à analyser. Les décompositions tensorielles peuvent avoir différentes finalités, incluant la détection de communautés ou de singularités. Je développe de nouveaux algorithmes basés sur ces décompositions, et les optimise afin de pouvoir les exécuter sur des données réelles qui produisent souvent des tenseurs creux mais ayant des tailles de dimensions importantes.

Enseignements

Licence 2 – Principe des Systèmes d’Exploitation

Master 1 – Systèmes Distribués

Master 2 BDIA – Bases de données et Environnements distribués

Master 2 BDIA – Informatique Décisionnelle

L3 : Conception et développement avancé d’applications, TD, TP

M1 : Gestion de données, TD, TP

Publications
Annabelle Gillet, Mickael Choisnard, Éric Leclercq. Garuda: A lightweight tweet collector tool. Software Impacts, 2023, 16, pp.100496. ⟨10.1016/j.simpa.2023.100496⟩. ⟨hal-04162254⟩
Annabelle Gillet, Éric Leclercq, Lucile Sautot. A Guide to the Tucker Tensor Decomposition for Data Mining: Exploratory Analysis, Clustering and Classification. Transactions on Large-Scale Data- and Knowledge-Centered Systems LIV, 14160, Springer, pp.56-88, 2023, Lecture Notes in Computer Science, 978-3-662-68014-8. ⟨10.1007/978-3-662-68014-8_3⟩. ⟨hal-04641835⟩
Annabelle Gillet, Éric Leclercq. CDMiA: Revealing Impacts of Data Migrations on Schemas in Multi-model Systems. Intelligent Information Systems, 520, Springer Nature Switzerland, pp.120-128, 2024, Lecture Notes in Business Information Processing, ⟨10.1007/978-3-031-61000-4_14⟩. ⟨hal-04641814⟩
Alexis Guyot, Annabelle Gillet, Éric Leclercq, Nadine Cullot. Évaluer la polarisation des réseaux sociaux numériques par l'étude des frontières de communautés -Approche ERIS. NFormatique des ORganisations et Systèmes d'Information et de Décision (INFORSID), May 2023, La Rochelle, France. ⟨hal-04610406⟩
Alexis Guyot, Eric Leclercq, Annabelle Gillet, Nadine Cullot. Prévenir les erreurs techniques des analyses dans les data lakes avec la théorie des types. INFormatique des ORganisations et Systèmes d'Information et de Décision (INFORSID), May 2024, Nancy, France. ⟨hal-04610397⟩
David Camarazo, Sana Debbech, Annabelle Gillet, Ana Roxin. Modélisation des systèmes ferroviaires : objectifs, approches et problématiques. BIM computationnel, des données vers l'IA, Eyrolles, pp.109-129, 2024, Ingénierie & architecture, enseignement & recherche, 978-2-416-01511-3. ⟨hal-04495917⟩
Alexis Guyot, Éric Leclercq, Annabelle Gillet, Nadine Cullot. Preventing Technical Errors in Data Lake Analyses with Type Theory. Big Data Analytics and Knowledge Discovery, Aug 2023, Penang, Malaysia. pp.18-24, ⟨10.1007/978-3-031-39831-5_2⟩. ⟨hal-04452461⟩
David Camarazo, Sana Debbech, Ana Roxin, Annabelle Gillet. Modélisation des systèmes ferroviaires -objectifs, approches et problématiques. eduBIM 2023 - 9e édition des Journées de l'enseignement et de la recherche autour du BIM et de la maquette numérique, Université de Bourgogne, Nov 2023, Dijon, France. ⟨hal-04353184⟩
Annabelle Gillet, Éric Leclercq, Nadine Cullot. Multi-level optimization of the canonical polyadic tensor decomposition at large-scale: Application to the stratification of social networks through deflation. Information Systems, 2023, 112, pp.102142. ⟨10.1016/j.is.2022.102142⟩. ⟨hal-03892040⟩
Annabelle Gillet. Modélisation et développement d'un observatoire générique pour la collecte et l'analyse de données massives. Autre [cs.OH]. Université Bourgogne Franche-Comté, 2021. Français. ⟨NNT : 2021UBFCK076⟩. ⟨tel-04085276⟩