WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Intégration de sources de données hétérogènes dans les entrepôts de données


par Sara Djebrit
Université de Ghardaia - Master Systèmes Intelligents pour l’Extraction de Connaissances 2019
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE 1. INTÉGRATION DE DONNÉES

1.3 Hétérogénéité des données

nous parlons cela sur le problèmeème complexe dans les pluparts des systèmes d'intégration, telque les différences de ces systèmes basent sur les différents étapes ou les différentes vues ou les différentes manières qui ont été conçu par ce problèmeème, donc il faut éétudier les façons d'hétérogénéité des données qui effectuer lors de l'intégration. les deux grands types d'hétérogénéité :

1. Hétérogénéité Sémantique:

c'est-à-dire on exprime le même concept mais avec des significations différentes[6], on peut définir deux types des hétérogénéités sémantiques;

-- hétérogénéité sémantique lié au schéma c'est de donner même terme par des terminologies différentes;

-- hétérogénéité sémantique lié aux données c'est le cas de données qui ayant des différentes origines, des différents contenants; et différentes structures et utilisent des conventions différentes.[7]

2. Hétérogénéité structurelle:

on l'appelle aussi hétérogénéité des schémas, c'est-à-dire il existe des mêmes concepts avec de différentes présentations, où en utilisant des modèles différents pour décrire les mêmes données ou d'une manière inverse.

Il existe quatre types principaux d'hétérogénéité sémantiques(conflits sémantiques ) [2] :

-- Conflits de représentation : c'est le cas d'utiliser des différentes schémas ou des différentes propriétés pour décrire le même concept,

-- Conflits de noms (termes) : Ces conflits se trouvent dans le cas où on utilise soit des noms différents pour le même concept ou propriété (synonyme), soit des noms identiques pour des concepts (et des propriétés) différents (homonyme),

-- Conflits de contextes : dans ce cas on donne des différentes représentations d'un seul objet

dans les sources de données tel que chaque source ayant un contexte local pour ce objet, -- Conflits de mesure de valeur : on trouve dans ce cas l'utilisation des unités différentes pour

mesurer les valeurs des mêmes concepts.

1.4 Entrepôt de données

un entrepôt de données a été défini comme une méthode de stockage de données intégrées pour être utilisées dans les systèmes, en offrant des méthodes d'analyse comme OLAP(On-Line Analytical processing), un cube OLAP contient des données servant à faire des analyses de données provenant de différentes sources hétérogènes et distribuées. Cette analyse est effectuée en organisant les données de manière multidimensionnelles .[8],[9]

L'entrepôt de données a été réalisé par passer des étapes qui correspondent au processus ETL (Extract,Transform and Load)[10], c'est a dire :

6

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld