WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Analyse du statut sérologique au VIH / sida et de ses déterminants chez les femmes enceintes au Cameroun.

( Télécharger le fichier original )
par Harris Bénito KOUBEMBA MONA
Institut sous-régional de statistique et d'économie appliquée (I.S.S.E.A) - Ingénieur d'application de la statistique ( I.A.S) 2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

VI.4.2. Analyse des résidus du modèle

Cette analyse permet de déterminer s'il existe des observations dites à effet de levier28(*), capables d'influencer les résultats obtenus après estimation (ces dernières peuvent se matérialiser au niveau des coefficients par des changements de signes ou des changements de valeurs) et biaiser ainsi les analyses29(*).

Une observation est capable d'influencer l'estimation des coefficients du modèle lorsque la distance de Cook qui lui est associée est supérieure à , n étant le nombre d'observations. Dans le présent cas, seront dong jugées suspectes, les observations dont la distance de Cook sera supérieure à . On en recense 544 pouvant significativement influencer les estimations du modèle. Ces observations n'ont pas de caractère particulier si ce n'est le fait de concerner 92,3 % des femmes enceintes séropositives. La lecture du graphique 10 apporte cependant l'information selon laquelle aucune d'entre elles n'influence significativement l'estimation des observations étant donné que toutes les valeurs sont inférieures à l'unité.

Graphique 10 : Représentation de la distance de Cook en fonction de la probabilité prédite

Source : SSVS 2009, CNLS

VI.4.3. Évaluation du pouvoir discriminant du modèle

La modélisation de la probabilité de réalisation des deux attributs de la variable d'intérêt (séropositivité ou non) à partir de certaines co-variables fournit des probabilités estimées pour chaque observation. L'utilisation de ces dernières permet de se fixer un seuil grâce auquel seront classées les femmes enceintes dans la catégorie qui fait prendre au statut sérologique la valeur 1 si la probabilité estimée est supérieure ou non et dans la catégorie qui fait prendre au statut sérologique la valeur 0 sinon.

La proportion étant un estimateur sans biais de la probabilité dans le cas d'un grand échantillon, le seuil fixé correspond à la proportion de femmes enceintes séropositives sur le total enquêté soit 7,57 %. De ce fait, toutes les femmes enceintes dont les probabilités estimées sont supérieures à ce seuil sont considérées séropositives à travers le modèle :

Les notions de spécificité et de sensibilité30(*) seront utilisées pour juger de la performance du classement effectué sur la base de ce seuil. Le tableau 21 relatif au classement effectué par le modèle au seuil fixé donne les résultats suivants :

Tableau 21 : Résultats du classement des observations

 
 

Statut sérologique estimé

 
 

Négatif

Positif

Total

Statut sérologique observé

Négatif

3672

2458

6130

Positif

206

296

502

Total

3878

2754

6632

Source : SSVS 2009, CNLS

Ce tableau révèle que la sensibilité du modèle est de 58,96 %. La spécificité quant à elle s'établit à 59,9 %. Le modèle prédit donc mieux les femmes enceintes qui ne sont pas séropositives comparativement aux séropositives. Dans l'ensemble, le modèle fournit 59,83 % de bonnes réponses.

La spécificité et la sensibilité variant en fonction du seuil, la courbe ROC peut être utilisée comme indicateur de la capacité du modèle à discriminer. Le graphique 11 montre que la valeur en dessous du ROC est de 64,39 % ce qui atteste de la capacité à discriminer du modèle31(*).

Graphique 11 : Courbe ROC relative à l'estimation

Source : SSVS 2009, CNLS

* 28 Une observation à effet de levier est une observation ne suivant pas le mouvement de la majeure partie des observations.

* 29 En général, le but est d'ajuster le modèle au centre de gravité du nuage des points. Il n'est donc pas souhaité que quelques valeurs extrêmes modifient sensiblement les estimations.

* 30 La sensibilité (respectivement spécificité) se définit comme la probabilité de classer un individu sans la catégorie y=1 (respectivement y=0) étant donné qu'il est effectivement observé comme tel.

* 31 Lorsque l'aire en-dessous du ROC est égale à 0,5 on dit qu'il n y a pas discrimination.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il y a des temps ou l'on doit dispenser son mépris qu'avec économie à cause du grand nombre de nécessiteux"   Chateaubriand