Système de reconnaissance hors-ligne des mots manuscrits arabe pour multi-scripteurs

( Télécharger le fichier original )
par Riadh BOUSLIMI
FSJEGJ Jendouba - Mastère Recherche : Données, Connaissances et Systèmes Distribués 2006

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

6. Conclusion

Nous avons présenté dans ce chapitre, avec une vision introductive, les différents concepts qui touchent à l'analyse des documents ainsi que les approches adoptées pour la reconnaissance de l'écriture manuscrite hors-ligne. Enfin nous avons proposé un tableau comparatif des différents systèmes qui traitent la reconnaissance d'écriture manuscrite arabe.

Dans le prochain chapitre, nous allons décrire notre propre méthode de reconnaissance d'écriture manuscrite arabe hors-ligne tout en passant par les différents appuis théoriques.

Chapitre
2

MÉTHODE
PROPOSÉE

Objectifs du chapitre

Nous proposons dans ce chapitre une méthode de reconnaissance automatique des mots manuscrites multi-scripteurs écrit en langue arabe basée sur une approche analytique sans segmentation. Nous décrivons les limites des méthodes existantes, nous présenterons l'architecture globale du système et nous détaillons ces différentes composantes.

1. Limite des méthodes existantes

1.1. Modèle de Markov Cachés (Hidden Markov Model)

1.1.1. Mise en ouvre des Modèles de Markov Cachés

L'utilisation des HMMs en reconnaissance automatique de l'écriture a permis d'obtenir des résultats intéressants pour certaines applications grâce à leur capacité d'intégration du contexte et d'absorption du bruit. Les différents travaux réalisés reposent pour une grande part sur l'expérience accumulée dans le domaine de la reconnaissance de la parole où les HMMs sont fréquemment utilisés. Comparés à d'autres approches de reconnaissance (structurelle, géométrique, etc.), les HMMs se distinguent par leur capacité de modéliser efficacement différentes sources de connaissance. En effet, d'une part ils offrent une intégration cohérente de différents niveaux de modélisation (morphologique, lexicale et syntaxique).

1.1.2. Expérimentation et limites sur l'écriture arabe

L'application des HMMs à la reconnaissance de l'écriture se ramène généralement à la transformation de la forme en primitives judicieusement choisies, traduisant les formes initiales en un signal unidimensionnel composé d'une suite d'observations destinée à être traitée par un modèle de Markov. Ainsi le problème d'analyse d'images se ramène à un problème d'analyse d'une chaîne d'observations.

Dans le cas des applications HMMs, elles sont relativement limitées pour la reconnaissance de l'écriture arabe, aussi bien imprimée que manuscrit (en-ligne et hors-ligne).

Des modèles généralement unidimensionnels ont servi pour la reconnaissance, sans arriver à la résolution de problème de segmentation des mots arabe ainsi la résolution des problèmes liés aux élongations des ligatures¹ horizontales qu'à la présence des ligatures verticales.

Par ailleurs, l'écriture arabe semi-cursive, aussi bien dans sa forme imprimée que manuscrite, se prête naturellement à une modélisation stochastique², en l'occurrence markovienne, à tous les niveaux de reconnaissance.

En effet, les lettres étant ligaturées à la ligne de base, sont régies par un contexte lexical des mots de la langue, se traduisant par des probabilités d'apparition et de succession dans des mots. Cependant, l'utilisation des HMMs en reconnaissance de l'écriture manuscrite arabe est relativement inadéquate. De différentes architectures, pour la majorité des applications reflètent des problèmes de traitement des graphèmes, des pseudo-mots ou encore à des mots, montrant l'insuffisance des modèles markoviens à décrire l'écriture manuscrite arabe et à résoudre certains problèmes telle que la segmentation.

1 Ligature : incluant plusieurs lettres.

2 Stochastique : aléatoire, régi par le hasard (soutenu) MATHEMATIQUES qui implique la présence d'une variable aléatoire, calcul des probabilités appliqué aux statistiques