5.3.3. Sélection des variables, choix et conception
des modèles et estimation des paramètres
5.3.3.1. Sélection et transformation des
variables pertinentes
D'après les travaux de Lachtermacher et Fuller (1994)
et de Dimopoulos et al., (1996), le choix de données
d'entrée du modèle doit tenir compte de la disponibilité
de ces données, des facteurs déterministes ou de toute
information connue à priori. Toutefois, ce choix doit tenir compte des
autocorrélations, des corrélations croisées et de
l'analyse de causalité (Awadallah, 1999). Dans cette étude, le
choix des variables explicatives pertinentes se fonde sur les données
disponibles et sur les objectifs précédemment définis. Les
variables retenues sont donc la pluie, la température,
l'évapotranspiration et le mois comme variables explicatives d'une part
et les débits aux stations hydrométriques de Bada, Marabadiassa,
Tortiya et Bou comme variables cibles d'autre part. L'objectif majeur d'un
modèle pluie-débit est d'arriver à estimer des
débits qui soient les plus proches possibles des débits
observés que ce soit en simulation qu'en prévision. Ces
modèles doivent donc être capables de simuler et de prévoir
des débits dans des situations très contrastées
c'est-à-dire en période humide et en période sèche.
Le modélisateur doit de ce fait prendre en compte d'une façon
relativement uniforme toutes les classes de débits (Mouelhi, 2002).
Plusieurs auteurs ont utilisé diverses transformations du débit
et ont obtenu de très bons résultats.
La transformation logarithmique du débit a
été utilisée par Ambroise et al., (1995). Ces
auteurs ont pu niveler les valeurs des débits et faire varier les
erreurs du modèle dans un même ordre de grandeur pour toutes les
classes de débits. Une autre possibilité est de diviser les
débits par les pluies correspondantes pour obtenir un paramètre
qui correspond au coefficient d'écoulement. Cette transformation de la
variable cible pose un certain nombre de problèmes. En effet, le
débit et les pluies sont des variables entachées d'un certain
nombre de bruits (incertitudes sur la mesure, courbes de tarage, etc.). En
calculant le rapport de ces deux variables, on contribue à augmenter le
bruit. Cette méthode augmente le risque de biaiser les estimations des
débits en simulation ou en prévision. Une solution
intermédiaire se situant entre la transformation logarithmique et la
solution de prendre directement la variable cible existe. Il s'agit de la
transformation puissance des débits (ou transformation racine
carrée). Chiew et al., (1993), Perrin (2000) et Mouelhi (2003)
ont utilisé cette transformation intermédiaire avec des
résultats très satisfaisants. En modélisation avec les
Réseaux de neurones, cette transformation des variables cibles qui
s'étend aussi aux variables explicatives est la "normalisation
". Elle est nécessaire car pendant l'apprentissage ou le calage, si
les
variables explicatives et les variables à expliquer
sont très différentes, les plus petites valeurs n'ont pas
d'influence sur l'apprentissage. Différentes "normalisation "
utilisées en modélisation avec les Réseaux de neurones,
existent. Dans cette étude on a divisé les données par
leurs valeurs maximales. On retrouve ainsi une "normalisation "
où toutes les valeurs des différentes variables sont comprises
entre 0 et 1. L'équation de cette normalisation peut se
V ànormer
traduire par : V normée = ; avec V
normée , la valeur de la donnée normée ;
V ànormer , une des
Vmax
données à normer ; Vmax , la
valeur maximale des données.
Le tableau VI donne les statistiques des
variables normées aux différentes stations de la zone
d'étude.
Tableau VI : Statistiques des variables
normées aux stations de Bada, Marabadiassa, Tortiya et Bou
|
|
|
Débit
|
|
|
Bada
|
Marabadiassa Tortiya
|
Bou
|
Moyenne
|
0,08
|
0,08
|
0,09
|
0,08
|
|
|
|
Pluie
|
|
Moyenne
|
0,17
|
0,17
|
0,25
|
0,26
|
|
|
|
Température
|
|
Moyenne
|
0,86
|
0,86
|
0,86
|
0,86
|
|
|
|
Evapotranspiration
|
|
Moyenne
|
0,57
|
0,57
|
0,57
|
0,57
|
|