Conclusion et Perspectives
Notre travail se situe dans le cadre de la reconnaissance de
l'écriture manuscrite. Mais il touche aussi à d'autres
thèmes de recherche comme le traitement automatique de langues
naturelles (TAL), la gestion électronique de documents (GED) et
l'enseignement assisté par ordinateur (EAO). Nous nous
intéresserons en, particulier, à la reconnaissance de l'arabe
manuscrit hors-ligne. La difficulté de ce sujet a amené plusieurs
chercheurs à conduire plusieurs travaux pour remédier au
problème de la reconnaissance. Cependant, on est très loin
d'atteindre le niveau de la capacité humaine dans ce domaine.
L'handicap majeur de la reconnaissance pour les approches
existantes est l'opération de la segmentation. Pour remédier
à ce problème nous avons proposé une nouvelle approche qui
effectue une reconnaissance incrémentale des mots. Le système que
nous avons proposé est composé de deux sous systèmes: un
sous système d'apprentissage et un sous système de
reconnaissance. Le système d'apprentissage a la capacité de
nettoyage et de traitement des images, et se charge de la construction de la
matrice de distribution sur une dimension de NxN, et d'enregistrer ces
caractéristiques dans une base de données d'apprentissage. Nous
obtenons donc une base de données qui contient les modèles des
différentes lettres apprises. Le sous système de reconnaissance
à pour objectif la reconnaissance du mot, il se charge du nettoyage
comme celui du sous système d'apprentissage afin d'obtenir des images
non bruitées. L'image nettoyée sera décomposée en
plusieurs trames et chaque trame va à son tour être
comparée avec des modèles de la base de données par la
vraisemblance en utilisant le coefficient de corrélation pour la
comparaison des deux matrices de distribution. Si on a abouti à une
reconnaissance dans ce cas notre système mémorise la lettre
reconnue et identifiera le scripteur pour accélérer la
procédure de vraisemblance et recommence le processus incrémental
afin de reconnaître les autres lettres qui composent le mot.
Nous avons implémenté l'approche que nous avons
proposée en langage Java. Le prototype réalisé respecte
l'architecture que nous avons proposée pour la reconnaissance. Pour
évaluer la performance de notre système en terme de
précision de reconnaissance nous avons mené une étude
expérimentale qui porte sur des mots manuscrits numérisés
arabes. Les résultats obtenus montre que notre système a permis
de reconnaître une bonne partie de l'échantillon du test.
Notre système de reconnaissance des mots manuscrits
arabes a été testé dans une école d'enseignement
des âgées dont le but c'est l'apprentissage de la langue arabe.
Notre système dépend fortement de la qualité d'acquisition
des images parce que la présence de plusieurs bruits dans l'image
parallélise le système dès le départ.
Le travail réalisé nous ouvre plusieurs
perspectives. Nous essayerons d'améliorer la performance de notre
système par l'extension de la reconnaissance (qui s'effectue de droite
à
gauche) par une reconnaissance incrémental de gauche
à droite; ceci nous permettra de s'assurer plus de l'identité du
mot. Nous allons aussi essayer de varier la dimension de la matrice de
distribution et d'évaluer l'effet de cette variation sur la performance
de ce système. Il sera aussi intéressant d'étendre notre
approche de reconnaissance de mots vers la reconnaissance de phrases et de
textes.
|