2.4. CARACTÉRISTIQUES D'UN DATA WAREHOUSE15
Un Data Warehouse est une base de données conçue
pour l'interrogation et l'analyse plutôt que le traitement de
transactions. Il contient généralement des données
historiques dérivées de données transactionnelles, mais il
peut comprendre des données d'autres origines.
Les Data Warehouse séparent la charge d'analyse de la
charge transactionnelle. Ils permettent aux entreprises de consolider des
données de différentes origines.
Au sein d'une même entité fonctionnelle, le Data
Warehouse joue le rôle d'outil analytique.
En complément d'une base de données, un Data
Warehouse inclut une solution d'extraction, de transformation et de chargement
(ETL), des fonctionnalités de traitement analytique en ligne (OLAP) et
de Data mining, des outils d'analyse client et d'autres applications qui
gèrent le processus de collecte et de mise à la disposition de
données.
2.5 ARCHITECTURE D'UN DATA WERAHOUSE16

Figure II-1 architecture d'un data werahouse
3.6 L'ETL
Une fois la structure du datawarehouse définie, les
données doivent être insérées. L'outil qui va
permettre le remplissage de notre base est l'ETL (Extract-Transform-Loading).
Comme son nom l'indique, il commence par extraire les données provenant
de différentes sources (Excel, MySQL...), les transforme si besoin est,
puis les charge dans le data warehouse.
15 INMON W.-H., Building the data warehouse, QED
Publishing Group, 1992, p.57.
16 TSHIMANGA Célestin, Cours d'info
centre, UNIKAN L2 info, 2025, P32.
Page | 26

Figure II-2 Data werahouse avec ETL
2.7 ENTREPÔTS ET BASES DE DONNÉES
Dans l'environnement des entrepôts de données,
les opérations, l'organisation des données, les critères
de performance, la gestion des métadonnées, la gestion des
transactions et le processus de requêtes sont très
différents des systèmes de bases de données
opérationnels.
Les SGBD ont été créés pour les
applications de gestion de systèmes transactionnels. Par contre, les
entrepôts de données ont été conçus pour
l'aide à la prise de décision. Ils intègrent les
informations qui ont pour objectif de fournir une vue globale de l'information
aux analystes et aux décideurs.
Le tableau suivant résume les différences entre
les systèmes de gestion de bases de données et les
entrepôts de données.

Tableau II-1 : Différence entre SGBD et
entrepôts de données
Page | 27
2.7.1 Rôle d'un entrepôt de données
Le rôle primordial d'un data warehouse apparait ainsi
évident dans une stratégie décisionnelle. L'alimentation
du data warehouse en est la phase la plus critique.
En effet, importer des données inutiles en portera de
nombreux problèmes, cela consommera des ressources système et du
temps. De plus, cela rendra le service d'analyse plus lent. Autre point
à prendre en compte est la périodicité d'extraction des
données ;
effectivement, le plus souvent, les opérations de
collecte de données sont couteuses en ressource pour la base
accédée.17
|