3.4.1.3 Le modèle de galaxie (Constellation)
Un schéma de galaxie est également connu sous le
nom de schéma de constellation des faits. Dans ce schéma,
plusieurs tables de faits partagent les mêmes tables de dimension. La
disposition des tables de faits et des tables de dimension ressemble à
une collection d'étoiles dans le modèle de schéma
Galaxy.
Ce type de schéma est utilisépour des exigences
sophistiquées et pour des tables de
3.4. MODÉLISATION DE L'ENTREPÔT DE DONNÉES
CHAPITRE 3. DÉMARCHE MÉTHODOLOGIQUE
Mémoire de Master II en Informatique 61 c~NJAMEN M. ZELKIF
2020-2021
faits agrégées plus complexes à prendre
en charge par le schéma en étoile (ou) en flocon. Ce
schéma est difficile à maintenir en raison de sa
complexité.
Après traitement des données et conception de
l'entrepôt nous avons dans ce data-set deux classes à
prédire (Sc et Lt) pour signifier scientifique et littéraire. En
effet les colonnes de notre Data-Set sont représentées par des
matières, le matricule, le sexe et le label qui sont d'ailleurs les
informations recherchés par les conseillers d'orientation pour pouvoir
effectuer l'orientation scolaire des élèves. D'oùnous
avons :

Figure 3.7 - Structure de la Base d'exemple
(Data Frame) chargéà l'aide de Python
En outre, la labelisation a étéfaite par nous
sur la base de quelques exemples de l'expert qui est le conseiller
d'orientation. Cependant, nous n'avons pas finalement utilisél'attribut
sexe car, cet attribut est peu représentatif dans notre data-set.
Le chargement du data-set s'effectue grâce au langage
Python en utilisant la bibliothèque pandas cette bibliothèque qui
nous a servit comme support à la place d'un logiciel de BI tels que :
Astera générateur d'entrepôt, DataPrep, Microsoft Power BI,
Zoho Ana-lytics, Arkieva, Google Data Studio, Microsoft Excel, pour ne citer
que ceux-ci car sont payant pour la plupart.
3.4. MODÉLISATION DE L'ENTREPÔT DE DONNÉES
CHAPITRE 3. DÉMARCHE MÉTHODOLOGIQUE
3.4.2 Modèle type de l'entrepôt des
données
Le modèle type d'entrepôt des données de
notre système est celui-ci dessous 3.8 :


Mémoire de Master II en Informatique 62 c~NJAMEN M. ZELKIF
2020-2021
Figure 3.8 - Modèle type de
l'entrepôt des données
3.4.3 Structure multidimensionnelle
Les données à analyser doivent refléter
la vision des analystes, c'est-à-dire apparaître sous une forme
facilitant les prises de décision. Cette vision correspond à une
structuration des données selon plusieurs axes d'analyse
représentant des notions diverses telles que le temps, la localisation
géographique, une nomenclature de produits, etc. On parle d'analyse
multidimensionnelle.
La méthode de modélisation dimensionnelle est
basée sur une architecture de type « bus (2)». Une table de
fait est produite à partir des données transactionnelles et de
l'analyse d'un processus afin de répondre aux questions des analystes.
Une table de faits est constituée de mesures ainsi que de clés de
dimension. Ces clés de dimension permettent
la jointure entre la table de faits et les tables dimensions. Les
dimensions sont communes àl'ensemble des services de
l'organisation et représentent des axes d'analyses
stratégiques.

3.5. CLASSIFICATION CHAPITRE 3. DÉMARCHE
MÉTHODOLOGIQUE
Mémoire de Master II en Informatique 63 c~NJAMEN M. ZELKIF
2020-2021
Figure 3.9 - Modèle type de
l'entrepôt des données
|