WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Impact des Technologies de l'Information et de la Communication (TIC) sur le tissu productif des biens et services au Maroc

( Télécharger le fichier original )
par Ghynel NGASSI NGAKEGNI
INSEA Rabat - Ingenieur d'Etat en Statistique et Economie (Majeur: Statistique) 2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

I.1. Diagramme de dispersion 

Le nuage de points ou diagramme de dispersion est la représentation graphique dans le plan cartésien de l'ensemble des paires de données. Ces données proviennent d'une série statistique de variables obtenues à partir d'une étude menée sur un échantillon ou sur une population.

Une fois la représentation graphique effectuée, il est facile de soupçonner l'existence d'une certaine relation entre les variables deux à deux (caractères étudiés). Il faut maintenant chercher à exprimer cette relation à l'aide d'une équation mathématique Ce constat pourrait être est confirmé par le tableau des corrélations.

I.2. Estimation des paramètres 

Il existe plusieurs méthodes permettant d'estimer le modèle théorique par le modèle empirique ; il s'agit entre autres de la méthode des moindres carrés et de la méthode de la vraisemblance. La méthode habituellement utilisée est celle des moindre carrés que nous allons également adopter.

Cette méthode essaie de construire une droite de régression empirique qui minimise la somme des carrés des distances verticales entre cette droite et chacun des points observés.

On appelle résidu ou erreur empirique ou écart de prévision, la valeur , soit la différence (l'écart vertical) entre la valeur observée yi de Y et la valeur estimée obtenue à partir de la droite de régression, lorsque x= xi. À travers cette méthode, on recherche minimisant

I.3. Validation du modèle 

I.3.1. Test statistique sur les coefficients du modèle 

La liaison globale entre Y et est-elle significative ?

Modèle :

Test : H0 : = ... = = 0 (Y = + ne dépend pas des X)

H1 : Au moins un j 0 (Y dépend d'au moins un X)

Statistique utilisée :

Décision de rejeter H0 au risque de se tromper :

Rejet de H0 si F ;   étant le Fractile d'une loi de Fisher-Snedecor.

L'apport marginal de est-il significatif ?

Modèle :

Test : H0 : j = 0 (On peut supprimer)

H1 : j 0 (Il faut conserver)

Statistique utilisée :

Décision de rejeter H0 au risque de se tromper :

Rejet de H0 si ; le Fractile d'une loi de Student.

I.3.2. Etude de la colinéarité 

Le problème de multicolinéarité produit une instabilité des coefficients estimés. Elle peut être à la source d'une non significativité de certaines variables qui sont en réalité significatives. En cas de multicolinéarité parfaite, l'estimation des coefficients est même parfois impossible. Il convient dès lors de s'assurer que cette contrainte ne se pose pas dans le cas d'espèce. Pour y arriver, nous mettons en oeuvre un test de détection de la présence de multicolinéarité. Le test retenu est celui de Farrar D.E. et Glauber R.R. (1967). Le principe de ce test est le suivant :

La première étape de ce test consiste à calculer la matrice des coefficients de corrélation entre les variables explicatives.

ï On calcule le déterminant D de la matrice des coefficients de corrélation entre les variables explicatives du modèle.

ï

Test : : D = 1 (les séries sont orthogonales) Vs

: D < 1 (les séries sont dépendantes)

ï Statistique : avec

ï Si lu dans la table à ddl et au seuil á choisi : rejet de : il y a présomption de colinéarité.

ï : on accepte l'hypothèse d'orthogonalité.

On peut également mesurer la multicolinéarité avec d'autres critères comme la tolérance et le VIF.

Mesure de la multi-colinéarité : Tolérance et VIF

ï

Tolérance = 1 - (; Autres X) ; Il est préférable d'observer une tolérance supérieure à 0.33.

ï VIF = Variance Inflation Factor = 1 / Tolérance ; Il est préférable d'observer un VIF inférieur à 3.

ï

est la somme des carrés expliquée par les variables .

F partiel :

ï

On obtient un petit si : est petite ou bien R2 ( ; Autres variables X) est grande.

I.3.3. Coefficient de détermination R2 

Il existe trois mesures possibles pour quantifier l'intensité de la relation entre X et Y: le coefficient de détermination de Y en fonction de X, le coefficient de corrélation entre X et Y, la covariance entre X et Y.

Le coefficient de détermination théorique de Y en fonction de X, noté mesure la proportion de la variation de Y qui est expliquée par la régression ou qui est expliquée par la variable X au niveau de toute la population

Le coefficient de détermination indique si le modèle linéaire défini colle aux données. En pratique est inconnu, car on ne possède pas d'information sur toute la population mais seulement sur un échantillon de taille n, alors on estimera à partir de l'échantillon.

A travers la formule de décomposition suivante :

Cette estimation nous donne :

Cette qualité de l'ajustement et l'appréciation que l'on a du doivent être tempérées par le degré de liberté de l'estimation. En effet, lorsque le degré de liberté est faible, il convient de corriger le a fin de tenir compte du relativement faible nombre d'observations comparé au nombre d'observations de facteurs explicatifs par le calcul d'un  corrigé noté  :

I.3.4. Vérification des hypothèses du modèle 

Avant une régression, plusieurs hypothèses sont en général émises et il convient de vérifier si ces hypothèses sont respectées à la fin de l'étude. Ces hypothèses principalement liées au terme d'erreur sont :

ï

L'erreur est une variable aléatoire d'espérance 0 :

ï

La variance de , dénotée ou , est la même pour toutes les valeurs de X :  ; homoscedasticité  des erreurs (variance constante) ;

ï

Les valeurs desont indépendantes :  ; pas d'autocorrélation des erreurs.

ï

L'erreur est distribuée selon une loi normale : .

I.3.5. Prévision de la variable dépendante connaissant les variables explicatives : Intervalle de prévision de

Modèle :

= future valeur de

= prévision de

Intervalle de prévision de yi au niveau 0.95 :

Formule simplifiée :; nous aurons ainsi une observation i qui sera mal reconstituée par le modèle si n'appartient pas à son propre intervalle de prévision.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Qui vit sans folie n'est pas si sage qu'il croit."   La Rochefoucault