• Recherche,

CHAMEKH Fatma

L'évolution du web de données basée sur un système multi-agents

Publié le 19 décembre 2016 Mis à jour le 31 octobre 2017

Thèse en Informatique soutenue le 7 décembre 2016.

Cette thèse porte sur la modélisation d’un système d’aide à l’évolution du web de données en utilisant un système multi-agents. Plus particulièrement, elle a pour but de guider l’utilisateur dans sa démarche de modification d’une base de connaissances RDF. Elle aborde les problématiques suivantes : intégrer de nouveaux triplets résultant de l'annotation des documents, proposer le changement adéquat dans les deux niveaux, ontologie et données, en se basant sur des mesures de similarités, analyser les effets de changements sur la qualité des données et la gestion des versions en prenant en considération d'éventuels conflits.
Cette question de recherche complexe engendre plusieurs problématiques dont les réponses sont dépendantes les unes des autres. Pour cela, nous nous sommes orientées vers le paradigme agent pour décomposer le problème. Il s’agit de répartir les tâches dans des agents. La coopération entre les agents permet de répondre au besoin de dépendance évoqué ci-dessus pour bénéficier de l’aspect dynamique et combler les inconvénients d’un système modulaire classique.
Le choix d’un tel écosystème nous a permis de proposer une démarche d’évaluation de la qualité des données en employant un modèle d’argumentation. Il s’agit d’établir un consensus entre les agents pour prendre en considération les trois dimensions intrinsèques : la cohérence, la concision la complétude, la validation syntaxique et sémantique. Nous avons modélisé les métriques d’évaluation de chaque dimension sous forme d’arguments. L’acceptation ou pas d’un argument se décide via les préférences des agents.
Chaque modification donne lieu à une nouvelle version de la base de connaissances RDF. Nous avons choisi de garder la dernière version de la base de connaissances. Pour cette raison, nous avons choisi de préserver les URI des ressources. Pour garder la trace des changements, nous annotons chaque ressource modifiée. Néanmoins, une base de connaissances peut être modifiée par plusieurs collaborateurs ce qui peut engendrer des conflits. Ils sont conjointement le résultat d’intégration de plusieurs données et le chevauchement des buts des agents. Pour gérer ces conflits, nous avons défini des règles. Nous avons appliqué notre travail de recherche au domaine de médecine générale.

In this thesis, we investigate the evolution of RDF datasets from documents and LOD. We identify the following issues : the integration of new triples, the proposition of changes by taking into account the data quality and the management of differents versions.

To handle with the complexity of the web of data evolution, we propose an agent based argumentation framework. We assume that the agent specifications could facilitate the process of RDF dataset evolution. The agent technology is one of the most useful solution to cope with a complex problem. The agents work as a team and are autonomous in the sense that they have the ability to decide themselves which goals they should adopt and how these goals should be acheived. The Agents use argumentation theory to reach a consensus about the best change alternative. Relatively to this goal, we propose an argumentation model based on the metric related to the intrinsic dimensions.

To keep a record of all the occured modifications, we are focused on the ressource version. In the case of a collaborative environment, several conflicts could be generated. To manage those conflicts, we define rules.


Mots-Clés : Web de données, qualité de données, évolution, gestion des versions, argumentation, ontologie.

Keywords : web of data, data quality, evolution, version, argumentation theory, ontology.

Directeur de thèse : Danielle BOULANGER
                                  
Membres du jury :
- BOULANGER Danielle, Professeure des universités émérite, Université Jean Moulin Lyon 3, Directrice de thèse
- BUCHE Patrice, Ingénieur de recherche HDR,  INRA Examinateur
- CULLOT Nadine, Professeure des universités,  Université de Bourgogne, Rapporteure
- MARET Pierre, Professeur des universités, Université Jean Monnet Saint-Etienne Président
- REYNAUD Chantal, Professeure des universités, Université Paris Sud Rapporteure
- TALENS Guilaine, Maître de conférences HDR, Université Jean Moulin Lyon 3 Examinatrice

Président du jury : Pierre MARET

Equipe d'accueil :
MAGELLAN
 
Décision : Admis