WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Analyse multidimensionnelle de l'avortement en république du congo

( Télécharger le fichier original )
par Anaclet Géraud NGANGA KOUBEMBA
Institut Sous-régional de Statistique et d'Economie Appliquée (ISSEA) - Elève Ingénieur Statisticien 3è année 2007
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

III.1.2 l'AFC en Bref

L'analyse des correspondances binaires (ACORBI) ou analyse factorielle des correspondances (AFC) permet d'étudier la dépendance de 2 variables qualitatives. Elle est basée sur une décomposition du Chi-Deux de contingence et l'étude de la dépendance est réalisée par des représentations graphiques. C'est une généralisation de l'ACP et s'applique par excellence aux tableaux de contingence (dits aussi tableaux de dépendance ou tableaux croisés) formés d'individus décrits par 2 caractères qualitatifs. La première formalisation mathématique de l'AFC est due à Hirschfeld (1935), et celle de l'ACM à Guttman (1941), ce qui dresse un historique de l'évolution de l'analyse des correspondances anglo-saxone alors qu'en France, l'analyse des correspondances a été proposée par Benzécri (1973)17(*).

NOTA BENE :

- Une AFC sur tableau de contingence se justifie si : (i) on est intéressé par l'analyse des relations entre les catégories de l'une et l'autre variable ; (ii) on dispose au moins de 3 modalités par variable et suffisamment bien remplies (par regroupement au besoin) ;

- On dit que 2 variables sont liées si la connaissance de l'une d'entre elles pour un individu modifie la distribution attendue de l'autre ;

- L'AFC peut être définie comme une double ACP : ACP du tableau des profils-lignes et ACP du tableau des profils-colonnes. La métrique utilisée pour mesurer la proximité entre deux individus n'est plus la métrique usuelle (distance euclidienne), mais la distance du Chi-Deux. Ce faisant, l'AFC peut être considérée comme une ACP avec une métrique spéciale, la métrique du Chi-Deux. Son objectif est de résumer et de décrire les liens entre l'ACP des profils-lignes et l'ACP des profils-colonnes et de construire des graphiques mettant en évidence les proximités entre les profils- lignes, les proximités entre profils-colonnes, et la nature de la liaison entre les lignes et les colonnes du tableau de contingence ;

- La métrique du Chi-Deux possède la propriété d'équivalence distributionnelle, propriété de stabilité de l'AFC : si 2 lignes de la table de contingence sont proportionnelles, on ne modifie pas l'AFC de la table en remplaçant les deux lignes par leur somme. La propriété demeure aussi vraie pour les colonnes ;

- Il existe bien un lien avec le Chi-Deux de Karl Pearson. En règle générale, constater une dépendance c'est bien mais l'expliciter est mieux. L'AFC vise précisément à décomposer cette dépendance selon un ensemble de dimensions indépendantes de même que l'ACP décompose la variance totale selon un ensemble de facteurs non corrélés.

INDICES D'AIDE À L'INTERPRÉTATION

· Inertie et test d'indépendance

L'inertie totale est donnée par la formule suivante : Cela signifie que la valeur de l'inertie totale (qui est aussi la somme des valeurs propres) est un indicateur de la dispersion du nuage et mesure la liaison entre deux variables A et B, et avant toute interprétation, il faut s'assurer que ledans la table de contingence est suffisamment grand et supérieur au point critiquepour que la liaison entre les deux variables qualitatives A et B soit jugée significative. C'est seulement dans une telle circonstance qu'exhiber l'AFC interviendra utilement, pour décrire cette dépendance entre lignes et colonnes du tableau de contingence ; On rappelle que, avec  : effectif observé,   effectif théorique d'indépendance et , k étant l'effectif total de la table de contingence.

· Qualité globale

La qualité globale de la représentation du nuage initial par le sous-espace de dimension q [] est mesurée par le pourcentage d'inertie pris en compte par les q premiers axes factoriels définissant ce sous-espace. Puisque la part du Chi-Deux expliquée par le ième axe factoriel est donnée par , on déduit alors que la proportion d'inertie expliquée par les ième premiers axes factoriels s'écrit : .

· Contribution relative d'un axe à un individu

Cette contribution représente la qualité de la représentation d'un individu par le sous-espace qui ajuste le nuage initial. Elle se mesure par l'indice CO2 donné par :

et désignent respectivement la coordonnée factorielle et la distance entre l'individu i et le centre de gravité G du nuage. Cet indice n'est autre que le cosinus carré de l'angle formé par l'individu i et l'axe factoriel.

Si est proche de 1, l'individu est bien représenté sur cet axe, si au contraire est proche de 0, l'individu i est très mal représenté sur cet axe. On peut généraliser cette notion en passant d'un axe à un sous-espace généré par les q premiers axes factoriels. On appelle contribution relative du sous-espace généré par les q premiers axes factoriels, la quantité :

Si un point est bien représenté sur un sous-espace à q dimensions (c'est-à-dire,), on en déduira qu'il est inutile de chercher à améliorer la représentation de ce point par la prise en compte d'autres axes factoriels.

· Contribution relative d'un individu à un axe

L'AFC présente une particularité du fait que les individus sont affectés de poids différents (fi.) : un individu peut donc avoir plus ou moins d'influence dans le lien entre les variables qualitatives; on dispose pour la mesurer d'un indice appelé contribution relative d'un individu à un axe donné par la relation .

La somme de toutes les contributions vaut 1 et qu'un profil- ligne (resp. profil-colonne) est d'autant plus important dans la construction du ième axe factoriel que sa contribution est élevée.

· Choix du nombre de composantes principales

Des nombreux critères de choix pour q existent dans la littérature. On utilisera essentiellement la règle de la part d'inertie expliquée et la règle du coude de Cattell. On admet que le nombre d'axes factoriels est égal à .

* 17 C'est l'approche française de Benzécri qui est ici exposée.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Un démenti, si pauvre qu'il soit, rassure les sots et déroute les incrédules"   Talleyrand