Extraction des connaissance à partir d'un datamart à l'aide de l'arbre de décision application aux données médicales

( Télécharger le fichier original )
par Richard KANGIAMA LWANGI
Université de Kinshasa RDC - Licence 2011

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

II.3 MANIPULATION DES DONNEES MULTIDIMENSIONNELLES

Pour visualise les données

multidimensionnelles, nous pouvons utiliser la représentation sous forme d'une table de données, qui est la plus courante. Dans une table, nous représentons les différentes combinaisons des valeurs choisies pour constituer les noms de lignes et de colonnes.

Néanmoins, quand le nombre de dimensions est supérieur à deux, l'utilisateur a des problèmes pour visualiser simultanément l'ensemble de l'information. Pour résoudre ce problème, nous devons disposer d'opérations pour manipuler les données et rendre possible la visualisation.

Nous présentons les opérations pour la manipulation des données multidimensionnelles, en les divisant selon leur impact sur la façon de présenter les différentes vues des données analysées.

[34]

II.3.1 OPERATIONS CLASSIQUES

Ces opérations correspondent aux opérations relationnelles de manipulation des données :

La sélection : résulte en un sous-ensemble de données qui respecte certaines conditions d'appartenance.

La projection : résulte en un sous-ensemble des attributs d'une relation, qui sont soit des dimensions, soit des niveaux de granularité. Dans les systèmes décisionnels, les opérations de sélection et de projection sont appelées souvent "slice-and-dice". La jointure : permet d'associer les données de relations différentes.

A. Les opérations ensemblistes :

D'union, d'intersection et de différence sont des opérations qui agissent sur des relations qui ont le même schéma. Par exemple, les opérations agissant sur la structure visent à présenter une vue (face du cube) différente en fonction de leur analyse, citons : La rotation (rotate) : consiste à pivoter ou a effectuer une rotation du cube, de manière à présenter une vue différente des données à analyser.

La permutation (switch) : consiste à inverser des membres d'une dimension, de manière à permuter deux tranches du cube. La division (split) : consiste à présenter chaque tranche du cube en passant d'une représentation tridimensionnelle à une présentation tabulaire.

L'emboitement (nest) : permet d'imbriquer les membres d'une dimension. En utilisant cette opération, nous représentons dans une table bidimensionnelle toutes les données d'un cube quel que soit le nombre de dimensions.

L'enfoncement (push) : consiste à combiner les membres d'une dimension aux mesures du cube et donc de représenter un membre comme une mesure.

L'opération inverse de retrait (pull) : permet de changer le statut de certaines mesures, pour transformer une mesure en membre d'une dimension.

La factualisation (fold) : consiste à transformer une dimension en mesure(s) ; cette opération permet de transformer en mesure l'ensemble des paramètres d'une dimension.

[35]

Le para métrisation (unfold) : permet de transformer une mesure en paramètre dans une nouvelle dimension.

L'opération cube : permet de calculer des sous-totaux et un total final.

B. Opérations agissant sur la granularité :

Les opérations agissant sur la granularité des données analysées, permettent de hiérarchiser la navigation entre les différents niveaux de détail d'une dimension.

Dans la suite nous traitons les deux opérations de ce type :

Le forage vers le haut (drill-up ou roll-up) : permet de représenter les données du cube à un niveau plus haut de granularité en respectant la hiérarchie de la dimension. Nous utilisons une fonction d'agrégation (somme, moyenne,...), qui est paramétrée, pour indiquer la façon de calculer les données du niveau supérieur à partir de celles du niveau inferieur.

Le forage vers le bas (drill-down ou roll-down ou scale-down) : consiste à représenter les données du cube à un niveau de granularité inferieur, donc sous une forme plus détaillée. Ces types d'opérations ont besoin d'informations non représentées dans un cube, pour augmenter ou affiner des données, à partir d'une représentation initiale vers une représentation de granularité différente. Le forage vers le haut à besoin de connaitre la fonction d'agrégation utilisée tandis que le forage vers le bas nécessite de connaitre les données au niveau inferieur.

précédent sommaire suivant

Changeons ce systeme injuste, Soyez votre propre syndic

"Je voudrais vivre pour étudier, non pas étudier pour vivre" Francis Bacon