Système de reconnaissance hors-ligne des mots manuscrits arabe pour multi-scripteurs

( Télécharger le fichier original )
par Riadh BOUSLIMI
FSJEGJ Jendouba - Mastère Recherche : Données, Connaissances et Systèmes Distribués 2006

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Conclusion et Perspectives

Notre travail se situe dans le cadre de la reconnaissance de l'écriture manuscrite. Mais il touche aussi à d'autres thèmes de recherche comme le traitement automatique de langues naturelles (TAL), la gestion électronique de documents (GED) et l'enseignement assisté par ordinateur (EAO). Nous nous intéresserons en, particulier, à la reconnaissance de l'arabe manuscrit hors-ligne. La difficulté de ce sujet a amené plusieurs chercheurs à conduire plusieurs travaux pour remédier au problème de la reconnaissance. Cependant, on est très loin d'atteindre le niveau de la capacité humaine dans ce domaine.

L'handicap majeur de la reconnaissance pour les approches existantes est l'opération de la segmentation. Pour remédier à ce problème nous avons proposé une nouvelle approche qui effectue une reconnaissance incrémentale des mots. Le système que nous avons proposé est composé de deux sous systèmes: un sous système d'apprentissage et un sous système de reconnaissance. Le système d'apprentissage a la capacité de nettoyage et de traitement des images, et se charge de la construction de la matrice de distribution sur une dimension de NxN, et d'enregistrer ces caractéristiques dans une base de données d'apprentissage. Nous obtenons donc une base de données qui contient les modèles des différentes lettres apprises. Le sous système de reconnaissance à pour objectif la reconnaissance du mot, il se charge du nettoyage comme celui du sous système d'apprentissage afin d'obtenir des images non bruitées. L'image nettoyée sera décomposée en plusieurs trames et chaque trame va à son tour être comparée avec des modèles de la base de données par la vraisemblance en utilisant le coefficient de corrélation pour la comparaison des deux matrices de distribution. Si on a abouti à une reconnaissance dans ce cas notre système mémorise la lettre reconnue et identifiera le scripteur pour accélérer la procédure de vraisemblance et recommence le processus incrémental afin de reconnaître les autres lettres qui composent le mot.

Nous avons implémenté l'approche que nous avons proposée en langage Java. Le prototype réalisé respecte l'architecture que nous avons proposée pour la reconnaissance. Pour évaluer la performance de notre système en terme de précision de reconnaissance nous avons mené une étude expérimentale qui porte sur des mots manuscrits numérisés arabes. Les résultats obtenus montre que notre système a permis de reconnaître une bonne partie de l'échantillon du test.

Notre système de reconnaissance des mots manuscrits arabes a été testé dans une école d'enseignement des âgées dont le but c'est l'apprentissage de la langue arabe. Notre système dépend fortement de la qualité d'acquisition des images parce que la présence de plusieurs bruits dans l'image parallélise le système dès le départ.

Le travail réalisé nous ouvre plusieurs perspectives. Nous essayerons d'améliorer la performance de notre système par l'extension de la reconnaissance (qui s'effectue de droite à

gauche) par une reconnaissance incrémental de gauche à droite; ceci nous permettra de s'assurer plus de l'identité du mot. Nous allons aussi essayer de varier la dimension de la matrice de distribution et d'évaluer l'effet de cette variation sur la performance de ce système. Il sera aussi intéressant d'étendre notre approche de reconnaissance de mots vers la reconnaissance de phrases et de textes.

précédent sommaire suivant

"Le doute est le commencement de la sagesse" Aristote