Vers un banc d’essai pour la construction des bases de données extrêmement larges

Sujets de thèse 2013

Intitulé de la thèse
Vers un banc d’essai pour la construction des bases de données extrêmement larges
Publication du sujet sur le site de l’ABG : OUI
Nature du financement : Financement institutionnel, Contrat Doctoral, Financement régional, Contrats université sur projets,)
Domaine de compétences principal (pour l’ABG) : Informatique, électronique
Domaine de compétences secondaire (pour l’ABG) : Mathématiques
Spécialité de doctorat : Informatique et Applications

Lieu de travail
LIAS / ENSMA
Laboratoire d’accueil : LIAS

Présentation de l’équipe de recherche
La thèse se déroulera au sein du LIAS / ENSMA dans l’équipe Ingénierie des Données et des Modèles.

Résumé de la thèse en français
cf. la description complète

Résumé de la thèse en anglais
cf. la description complète

Description complète du sujet de thèse
Le cycle de vie d’un projet autour des bases de données extrêmement larges (BDEL) inclut les phases suivantes: (1) la planification: cette phase vise à préparer le terrain pour le développement de la BDEL. Elle inclut les tâches suivantes: (a) déterminer l’étendue du projet ainsi que les buts et objectifs de la BDEL à développer; (b) évaluer la faisabilité technique et économique de la BDEL, (c) identifier les futurs utilisateurs de la BDEL. (2) La conception et implémentation: cette phase consiste à développer le schéma de la BDEL, et à mettre en place toutes les ressources nécessaires à son implémentation et à son déploiement. (3) La maintenance et l’évolution: la maintenance de la BDEL implique l’optimisation de ses performances périodiquement. L’évolution de la BDEL concerne la mise à jour de son schéma en fonction des différents changements survenant au niveau des sources ou des besoins des utilisateurs. La deuxième phase de conception d’une BDEL se décline en cinq principales sous phases: l’analyse de besoins, la modélisation conceptuelle, la modélisation logique, le processus d’extraction-transformation-chargement (ETL) et une phase de modélisation physique. Récemment, certains travaux s’intéressent au développement des bancs d’essai afin d’évaluer la performance d’une BDEL. Le mot performance dans les BDEL est souvent associé à la phase physique, concernant l’optimisation des traitements.

Actuellement, nous assistons à l’ère de big data, où chaque jour, plus de 5 trillions d’octets de données issues de capteurs, blogs, emails, réseaux sociaux, images, enregistrements transactionnels d’achats en ligne, sms, etc. Traiter et analyser ces données nécessite des outils de conception et d’ETL performants.

Objectifs scientifiques de la thèse
L’objectif de cette thèse est développer un banc d’essai pour la partie ETL et la phase de conception d’une BDEL traitant des données classiques ou sémantiques. Cette thèse représente la continuité de travaux de thèse de Selma BOUARAR, qui s’intéressent au développement d’un banc d’essai pour les phases logique et physique. Cette thèse est primordiale pour l’activité de l’équipe ingénierie de données, car elle contribuera à évaluer tout le cycle de vie de conception de BDEL.

Compétences à l’issue de la thèse
Spécialistes en: ETL, manipulation d’ontologies et architecture de benchmark

Mots clés (séparés par des virgules)
Benchmark, Big Data, ETL, ontologie, cycle de vie, évaluation
Conditions restrictive de candidature (nationalité, âge, …) : NON

Modalité de dépôt des candidatures
contacter le co-encadrant. Prévoir d’envoyer par courriel CV, avec relevé de notes M1-M2, et lettre de motivation.

Date limite de candidature
30 avril 2013

Directeur de thèse
Ladjel BELLATRECHE
Adresse mail du directeur de thèse : bellatreche@ensma.fr
Téléphone Directeur de thèse : 0549498072

Co-directeur de thèse
Stéphane JEAN
Adresse mail du co-directeur de thèse : jean@ensma.fr
Téléphone co-Directeur de thèse : 0549498073
Cofinancement LABEX SigmaLIM demandé : NON

Recherche

Menu principal

Haut de page