WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Classification de la population en catégories socio-économiques : méthodologie et application pratique

( Télécharger le fichier original )
par Mustapha HADD
Institut national de statistiques et d'économie appliquée - Ingénieur d'Etat Option : Démographie 1999
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

VI. Présentation du logiciel STATlab utilisé pour cette classification

Différents logiciels statistiques traitent les méthodes de classification automatique que se soit les méthodes hiérarchiques, les méthodes des nuées dynamiques et les méthodes discriminantes. Il est en effet notoire que les méthodes d'agrégations des classes et les algorithmes de classification diffèrent d'un logiciel à un autre. Il faut cependant être prudent lorsqu'on veut comparer les résultats des méthodes de classifications issues de différents logiciels. Cette différenciation s'accentue au niveau de la mesure de la distance entre les individus et aussi en ce qui concerne le type des données admissibles. En effet, certains logiciels sont performants lorsqu'on utilise un tableau de contingence, d'autres en n'utilisant que des données binaires et ainsi de suite. Notre choix s'est basé sur un logiciel fréquemment utilisé pour le traitement des données d'enquêtes.

Il s'agit de "STATlab" le fameux logiciel d'analyse des données. Il comporte un module qui traite les méthodes factorielles et les méthodes de classification. Dans cette présentation, nous allons voir comment peut-on effectuer le recodage des variables sur STATlab, quels sont les types de données admissibles par ce logiciel ? Ensuite nous allons entamer une description des différentes méthodes de classification offertes par ce logiciel.

VI.1. Recodage des variables sur STATlab

Le changement de codage des variables constitue une étape déterminante pour la rentabilité d'une quelconque analyse statistique. Le logiciel STATlab permet d'aboutir à ce but primordial. En effet, il offre deux options pour le changement de codage :

v Le recodage dans la même variable : Cette option consiste à changer le code d'une variable que se soit quantitative ou qualitative en détruisant la variable dite "source", et en la remplaçant par une nouvelle variable qui contient le résultat du codage.

v Le recodage dans des variables différentes : cette option, à l'instar de la première ne détruit pas la variable "source" et permet de créer une variable supplémentaire contenant le nouveau codage.

Dans la réalité on confronte, en général, quatre types de changement de variables :

· Transformation quantitative - quantitative.

· Transformation quantitative - qualitative.

· Transformation qualitative - qualitative.

· Transformation qualitative - quantitative.

Ø La transformation quantitative - quantitative est très importante dans la mesure où on veut éliminer l'effet d'unité en centrant et en réduisant les variables possédant des unités différentes. Cette transformation est accessible dans le logiciel STATlab en utilisant la commande "recodages par formules" comme suit : on retranche de la variable sa moyenne et on la divise par son écart type. La formule de centrage - réduction est :

X

Ø La transformation quantitative - qualitative : elle consiste à transformer une variable quantitative continue en une variable qualitative ayant un nombre limité de modalités. On découpe la variable continue en r intervalles dont l'intersection est l'ensemble vide, ensuite pour chaque intervalle on spécifie un code numérique et un seul. Le logiciel STATlab permet de découper une variable quantitative continue en utilisant deux commandes :

· Recodages par formules : cette commande est utilisée lorsqu'on connaît les classes de découpage. Dans ce cas on indique les bornes de chaque intervalle et le code correspondant.

· Recodages prédéfinis : Dans le cas où on ne connaîtrait pas un découpage précis, STATlab offre le choix entre 3 types de recodages :

1- Découpage par minimisation de la variance qui consiste à chercher des classes dont l'inertie intra-classe est minimale.

2- Découpage par intervalles égaux : on considère la valeur maximale (M) et la valeur minimale (m) de la variable quantitative à découper en k classes. La longueur de chaque classe est égale à .

3- Découpage par effectifs égaux : Si on veut éviter d'avoir des classes vides ou à faible effectif alors ce type de découpage est approprié.

Ø La transformation qualitative - qualitative consiste à transformer une variable qualitative ordinale8(*) en une variable qualitative nominale9(*) ou l'inverse. STATlab permet de mener cette transformation à l'aide de la commande "Recodges par formules" on changeant les anciens codes par les nouveaux codes.

Ø La transformation qualitative - quantitative consiste à transformer une variable qualitative à r modalités en r variables binaires. Le codage s'effectue de la manière suivante : Si l'individu adopte la modalité en lui affecte le code 1 sinon le code 0. STATlab permet facilement d'effectuer cette opération à l'aide de la commande "recodage disjonctif complet".

* 8 Une variable qualitative est dite ordinale si l'ensemble de toutes les modalités est muni d'une structure d'ordre total ( exemple: très satisfait, satisfait, moyennement satisfait, pas du tout satisfait)

* 9 Une variable qualitative est dite nominale si l'ensemble d'arrivée n'est pas muni d'un ordre total ( code géographique, catégorie socioprofessionnelle)

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Je ne pense pas qu'un écrivain puisse avoir de profondes assises s'il n'a pas ressenti avec amertume les injustices de la société ou il vit"   Thomas Lanier dit Tennessie Williams