WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Scoring crédit: une application comparative de la régression logistique et des réseaux de neurones

( Télécharger le fichier original )
par Fred NTOUTOUME OBIANG-NDONG
Université Cheikh Anta Diop (UCAD) - Master Methodes Statistiques et Econometriques 2006
  

sommaire suivant

UNIVERSITE CHEIKH ANTA DIOP

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION

CENTRE DE RECHERCHE ET DE FORMATION POUR LE DEVELOPPEMENT ECONOMIQUE ET SOCIAL (CREFDES)

Année Universitaire 2006-2007

Mémoire de fin d'études pour l'obtention du diplôme de :

MASTER II Professionnel de

METHODES STATISTIQUES & ECONOMETRIQUES

Scoring du risque de crédit des PME par la modélisation

statistique et l'intelligence artificielle chez l'UMECUDEFS :

Une application comparative de la Régression Logistique et des Réseaux de Neurones

Présenté par :

Fred NTOUTOUME OBIANG-NDONG

Encadré par :

Octave JOKUNG NGUENA,

Ph. D. en Finance

HDR, 3e cycle en Mathématiques

Professeur à l'Université de Lille, et à l'EDHEC Business School

Fodiyé Bakary DOUCOURE

Ph. D. en Statistiques

Maître en Econométrie

Maître Assistant à l'Université Cheikh Anta Diop de Dakar

REMERCIEMENTS

Mes remerciements vont à l'endroit des personnes suivantes, qui ont de près ou de loin contribué à l'aboutissement de ce travail de recherche :

· DIEU le Tout Puissant ;

· Monsieur et Mme OBIANG-NDONG mes chers parents;

· Monsieur Octave JOKUNG NGUENA, mon Directeur Général ;

· Monsieur Wade, Directeur Général de l'UMECUDEF, associé de Babacar Mbaye ;

· Messieurs Bouna NIANG, Fodiyé Bacary DOUCOURE et Pape NGOME de l'université Cheikh Anta Diop (UCAD) de Dakar ;

· Mes frères et amis parmi lesquels Francis Mba Zue ;

· Mlle Ingrid Liliane Mengue Me Doumbeneny.

TABLE DES MATIERES

REMERCIEMENTS II

TABLE DES MATIERES III

LISTE DES TABLEAUX VI

LISTE DES FIGURES & GRAPHIQUES VIII

RESUME ANALYTIQUE IX

INTRODUCTION 1

PREMIERE PARTIE : CADRE DE REFERENCE 3

CHAPITRE IER : REVUE DE LA LITTÉRATURE 4

I/ Généralités sur le Scoring 4

1.1. Définition, Fondements historiques et théoriques 4

1.2. Les principales techniques de crédit scoring  6

1.3. L'utilisation des scores de risque 9

II/ Généralités sur la régression logistique 10

2.1. Définition de la régression logistique binaire 10

2.2. Principes et propriétés mathématiques de la régression logistique binaire 10

III/ Généralités sur les réseaux de neurone 12

3.1. Définition et historique des réseaux de neurone 12

3.2. Principes et propriétés mathématiques des réseaux de neurones 12

3.3. Mode et règles d'apprentissage des réseaux de neurones 14

3.4. Les principaux réseaux de neurone 15

IV / Enseignements de la revue de littérature 16

4.1- Les limites du Scoring 16

4.2- Les limites de la régression logistique 16

4.3- Les limites des réseaux neuronaux 17

CHAPITRE II : PROBLÉMATIQUE GÉNÉRALE 18

I/ Problématique 18

1.1. Contexte et justification de l'étude 18

1.1.1) Le contexte socio-économique, institutionnel, sectoriel et technologique 18

1.1.2) La justification pour les managers, les décideurs politiques

et les chercheurs 20

1.2. Problème de recherche et résultats attendus 21

II/ Cadre Conceptuel 23

2.1. Définition des concepts 23

2.2. Objectifs de recherche 26

2.3. Hypothèses et indicateurs 26

2.3.1) Hypothèses de recherche et cadre opératoire 26

2.3.2) Outils de collecte, sources d'information et difficultés rencontrées 28

III/ Cadre de l'étude : présentation de l'UMECUDEFS 29

3.1. Historique et Activités 29

3.2. Structure organisationnelle 29

3.3. Caractéristiques de l'activité 30

DEUXIEME PARTIE : METHODOLOGIE ET ANALYSE DES RESULTATS 31

CHAPITRE III : MÉTHODOLOGIE 32

I/ Les préalables au Scoring: Collecte et préparation des données 32

1.1. L'échantillon 32

1.2. Les paramètres analysés 32

1.3. Le traitement des données 32

II/ Le protocole de recherche 33

2.1. Le protocole général 33

2.2. Le protocole de la réduction des variables par l'analyse factorielle 34

2.3. Le protocole d'expérimentation par les réseaux de neurone 35

2.3.1) Le réseau utilisé: Perceptron multicouches (PMC) 35

2.3.2) Les paramètres 35

2.3.3) Apprentissage et généralisation 35

2.4. Le protocole d'expérimentation par la régression logistique 36

2.4.1) Génération des modalités discriminantes 36

2.4.2) Estimation du modèle par le maximum de vraisemblance 36

2.4.3) Test de significativité globale (Evaluation de la calibration du modèle :

le test de Hosmer et Lemeshow) 36

2.4.4) Evaluation du pouvoir discriminant du modèle : sensibilité, spécificité 37

CHAPITRE IV : PRÉSENTATION & ANALYSE DES RESULTATS DES

CLASSEMENTS PREDICTIFS 38

I/ Résultats de l'Analyse Factorielle des Correspondances Principales 38

1.1. Dimensions de la solution et valeurs propres (inerties) 38

1.2. Qualité de représentation (Fator Analisys Communalities) 41

1.3. Les variables explicatives retenues 42

II/ Résultats économétriques de la modélisation par régression logistique 43

2.1. Génération des modalités « Bon payeur » et « mauvais payeur » 43

2.2. Spécification du modèle logit et estimation des paramètres prédictifs 44

2.3. Qualité du modèle (Test de Significativité globale) 47

2.4. Test de Hosmer-Lemeshow (test d'ajustement du modèle) 48

2.5. Qualité de prédiction du modèle (performance de classification) 49

2.6. Discussions sur les déterminants du risque de crédit du modèle Logistique 50

2.6.1) Probabilité de non-remboursement et âge du dirigeant de la PME  50

2.6.2) Probabilité de non-remboursement et Niveau de Revenu

du dirigeant de la PME 51

2.6.3) Probabilité de non-remboursement et Durée d'existence de la PME 52

2.6.4) Probabilité de non-remboursement et Valeur de la garantie proposée 52

2.6.5) Probabilité de non-remboursement et Montant du crédit Octroyé  53

2.6.6) Probabilité de non-remboursement et sélection adverse  53

2.6.7) Probabilité de non-remboursement et Respect des échéances  54

2.7. Simulations sur le modèle logistique 55

III/ Résultats de la modélisation par réseaux de neurones 57

3.1. Identification des données en entrée et en sortie. 57

3.2. La fixation des paramètres du réseau & apprentissage 59

3.3. Les résultats de la modélisation par réseaux de neurones 61

3.4. Le réajustement de la structure du réseau de neurones et les résultats 62

IV/Comparaison des modèles logistique et neuronal 62

4.1. Comparaison des matrices de confusion (pourcentage de classement prédictif) 62

4.2. Choix du modèle de scoring final 63

TROISIEME PARTIE : RECOMMANDATIONS 64

CHAPITRE V : RECOMMANDATIONS 65

I/ Recommandations pour une utilisation du modèle de score 65

1.1. Implémentation informatique 65

1.2. Formation des utilisateurs du modèle de score 65

1.3. Suivi ponctuel par évaluation des utilisateurs 65

1.4. Suivi en continue par tableau de bord 66

II/ Recommandation sur les aspects organisationnels de l'UMECUDEFS 67

CONCLUSION 68

BIBLIOGRAPHIE XI

Pour l'analyse des données XI

Pour le scoring XII

Pour la régression logistique et les réseaux de neurones XII

Webographie XIII

ANNEXES XIV

sommaire suivant