Développement d’un banc d’essai pour les bases de données et les entrepôts de données à base ontologique

Sujets de thèse

Intitulé de la thèse
Développement d’un banc d’essai pour les bases de données et les entrepôts de données à base ontologique
Publication du sujet sur le site de l’ABG : OUI
Nature du financement : Financement institutionnel, Contrat Doctoral, Financement régional, Contrats université sur projets,)
Domaine de compétences principal (pour l’ABG) : Informatique, électronique
Domaine de compétences secondaire (pour l’ABG) : Sciences pour l’Ingénieur
Spécialité de doctorat : Informatique et Applications

Lieu de travail
LIAS / ENSMA
Date Limite de candidature : 30/09/2012
Laboratoire d’accueil : LIAS

Introduction
Avec l’émergence des ontologies dans plusieurs domaines (ingénierie, E-commerce, médecine, etc.), plusieurs sources de données sont conçues autour d’une ou plusieurs ontologies, appelées base de données à base ontologique (BDBO). Dans la même optique, plusieurs systèmes de gestion de bases de données (SGBD) proposent des solutions pour stocker et gérer des BDBO (Oracle, SOR d’IBM, etc.). La particularité de ces derniers est qu’ils stockent à la fois les données et l’ontologie qui en décrit le sens. Récemment, des travaux ont proposé des méthodologies de conception de BDBO (thèse de CHAKROUN développée au LISI/ENSMA) et entrepôts de données à base ontologique (EDBO) à partir d’un cahier des charges défini d’une ontologie de domaine sous forme de classes.
Lors de la conception logique d’une BDBO ou EDBO, le choix de représentation des classes et des instances ontologiques au sein de la base représente un enjeu crucial pour la performance de la base de données cible. Plusieurs modèles de stockage existent dans la littérature que nous classons en quatre catégories: (i) modèles «orientés bases de données traditionnelles» (verticale, horizontale, etc.), (ii) modèles «orientés Web service» (triplet), (iii) «modèles NoSQL» (BigTable) et (iv) «modèles basés sur File System et/ou mémoire».
Evaluer ces bases de données et entrepôts de données à base ontologique nécessitent le développement de bancs d’essai adéquats. En explorant la littérature, un nombre important de bancs d’essai se sont développés dans les bases de données traditionnelles, XML, les entrepôts de données, etc. Nous pouvons citer ainsi TPC-C, TPC-H, OO7, XOO7, Lehigh University Benchmark, etc. Ces benchmarks ne prennent pas en compte les modèles de stockage des instances ontologiques, les ontologies, la nature des requêtes ontologiques (qui peuvent concernées l’ontologie et les instances ontologiques) et l’infrastructure de déploiement de bases de données ontologiques.
Développer un banc d’essai générique qui prend en considération les modèles de stockage et l’infrastructure de déploiement devient une nécessité afin d’évaluer la qualité des bases de données. Ce développement sera accompagné par la définition de métriques de performance.

Déroulement de la thèse
1. étude des bancs d’essai existants dans les bases de données traditionnelles, orientées objet, entreposage de données, XML, etc.
2. étude les différents modèles de représentation de données et comparer leurs performances en utilisant une étude de cas comportant une ontologie décrivant des instances ontologiques d’une BDBO.
3. proposer un framework pour le développement d’un banc d’essai ontologique.
4. valider ce banc d’essai sur les techniques d’optimisation comme le partitionnement et les index.

Présentation de l’équipe de recherche

Résumé de la thèse en français

Résumé de la thèse en anglais

Description complète du sujet de thèse

Objectifs scientifiques de la thèse

Compétences à l’issue de la thèse

Mots clés (séparés par des virgules)

Conditions restrictive de candidature (nationalité, âge, …) : NON

Expérience/profil souhaité(e)
Bases de données, entrepôt de données, ontologies, modèles de stockage, cloud, machine parallèle

Modalité de dépôt des candidatures

Directeur de thèse
Bellatreche Ladjel
Adresse mail du directeur de thèse : bellatreche@ensma.fr
Téléphone Directeur de thèse : 05 49 49 80 72

Co-directeur de thèse
Jean Stéphane
Adresse mail du co-directeur de thèse : jean@ensma.fr
Téléphone co-Directeur de thèse : 05 49 49 80 73
Cofinancement LABEX SigmaLIM demandé : NON

Recherche

Menu principal

Haut de page