Chap. III : Utilisation d'un modèle de
séries temporelles pour des prévisions : méthode de
Box and Jenkins
I. Présentation théorique du
Modèle
Les séries temporelles constituent une branche de
l'économétrie dont l'objet est l'étude des variables au
cours du temps. Parmi ses principaux objectifs figurent la détermination
de tendances au sein de ces séries ainsi que la stabilité des
valeurs (et de leur variation) au cours du temps.
L'analyse de ces séries touche énormément
de domaines de la vie professionnelle, et plus précisément celui
de l'informatique décisionnelle. L'image que l'on pourrait se faire de
cette analyse ressemblerait à un homme très âgé avec
beaucoup d'expérience et une sagesse assez grande pour tirer des
événements passés des indications sur le futur, une sorte
d'oracle. En informatique, ce serait plutôt une structure fondée
sur les bases de données, fournissant ainsi le volume nécessaire
d'information permettant de dresser une chronique historique des
événements passés. Dessus viendrait se greffer un
protocole d'extraction des données, intégré suivant un
modèle judicieusement adapté à l'analyse que l'on voudrait
faire. Enfin, au sommet de cette pyramide, la réponse à la
question posée au départ, qui sera la prévision.
Contrairement à l'économétrie
traditionnelle, le but de l'analyse des séries temporelles n'est pas de
relier des variables entre elles, mais de s'intéresser à la
« dynamique » d'une variable. Cette dernière est en effet
essentielle pour deux raisons : les avancées de
l'économétrie ont montré qu'on ne peut relier que des
variables qui présentent des propriétés similaires, en
particulier une même stabilité ou instabilité ; les
propriétés mathématiques des modèles permettant
d'estimer le lien entre deux variables dépendent de leur dynamique.
Une série temporelle est donc toute suite
d'observations correspondant à la même variable : il peut s'agir
de données macroéconomiques (le PIB d'un pays, l'inflation, les
exportations...), microéconomiques (les ventes d'une entreprise
donnée, son nombre d'employés, le revenu d'un individu, le nombre
d'enfants d'une femme...), financières (le CAC40, le prix d'une option
d'achat ou de vente, le cours d'une action), météorologiques (la
pluviosité, le nombre de jours de soleil par an...), politiques (le
nombre de votants, de voix reçues par un candidat...),
démographiques (la taille moyenne des habitants, leur âge...). En
pratique, tout ce qui est chiffrable et varie en fonction du temps. La
dimension temporelle est ici importante car il s'agit de l'analyse d'une
chronique historique : des variations d'une même variable au cours du
temps, afin de pouvoir comprendre la dynamique. La périodicité de
la série n'importe en revanche pas : il peut s'agir de mesures
quotidiennes, mensuelles, trimestrielles, annuelles... voire même sans
périodicité.
On représente en général les
séries temporelles sur des graphiques de valeurs (ordonnées) en
fonction du temps (abscisses). Lorsqu'une série est stable autour de sa
moyenne, on parle de série stationnaire. Inversement, on trouve aussi
des séries non stationnaires. Lorsqu'une série croît sur
l'ensemble de l'échantillon et donc possède une moyenne qui n'est
pas constante, on parle de tendance. Enfin lorsqu'on observe des
phénomènes qui se reproduisent à des périodes
régulières, on parle de phénomène saisonnier.
Mathématiquement, une série chronologique est
représentée par un ensemble de variable aléatoire Yt
(parfois écrites Y (t, w)). Soient (?,A,P), un espace probabiliste, et T
un ensemble d'indices, la série chronologique réelle (ou
processus stochastique) est la fonction réelle Y (t,w) définie
sur T×?. Pour chaque t fixé, Y (t, w) est une variable
aléatoire sur (?,A,P). En fixant w, Y(t,w) constitue alors une
réalisation de la fonction aléatoire.
|