6. Conclusion
Nous avons présenté dans ce chapitre, avec une
vision introductive, les différents concepts qui touchent à
l'analyse des documents ainsi que les approches adoptées pour la
reconnaissance de l'écriture manuscrite hors-ligne. Enfin nous avons
proposé un tableau comparatif des différents systèmes qui
traitent la reconnaissance d'écriture manuscrite arabe.
Dans le prochain chapitre, nous allons décrire notre
propre méthode de reconnaissance d'écriture manuscrite arabe
hors-ligne tout en passant par les différents appuis
théoriques.
Chapitre
2
|
MÉTHODE
PROPOSÉE
|
Objectifs du chapitre
Nous proposons dans ce chapitre une méthode de
reconnaissance automatique des mots manuscrites multi-scripteurs écrit
en langue arabe basée sur une approche analytique sans segmentation.
Nous décrivons les limites des méthodes existantes, nous
présenterons l'architecture globale du système et nous
détaillons ces différentes composantes.
1. Limite des méthodes existantes
1.1. Modèle de Markov Cachés (Hidden Markov
Model)
1.1.1. Mise en ouvre des Modèles de Markov
Cachés
L'utilisation des HMMs en reconnaissance automatique de
l'écriture a permis d'obtenir des résultats intéressants
pour certaines applications grâce à leur capacité
d'intégration du contexte et d'absorption du bruit. Les
différents travaux réalisés reposent pour une grande part
sur l'expérience accumulée dans le domaine de la reconnaissance
de la parole où les HMMs sont fréquemment utilisés.
Comparés à d'autres approches de reconnaissance (structurelle,
géométrique, etc.), les HMMs se distinguent par leur
capacité de modéliser efficacement différentes sources de
connaissance. En effet, d'une part ils offrent une intégration
cohérente de différents niveaux de modélisation
(morphologique, lexicale et syntaxique).
1.1.2. Expérimentation et limites sur
l'écriture arabe
L'application des HMMs à la reconnaissance de
l'écriture se ramène généralement à la
transformation de la forme en primitives judicieusement choisies, traduisant
les formes initiales en un signal unidimensionnel composé d'une suite
d'observations destinée à être traitée par un
modèle de Markov. Ainsi le problème d'analyse d'images se
ramène à un problème d'analyse d'une chaîne
d'observations.
Dans le cas des applications HMMs, elles sont relativement
limitées pour la reconnaissance de l'écriture arabe, aussi bien
imprimée que manuscrit (en-ligne et hors-ligne).
Des modèles généralement unidimensionnels
ont servi pour la reconnaissance, sans arriver à la résolution de
problème de segmentation des mots arabe ainsi la résolution des
problèmes liés aux élongations des ligatures1
horizontales qu'à la présence des ligatures verticales.
Par ailleurs, l'écriture arabe semi-cursive, aussi bien
dans sa forme imprimée que manuscrite, se prête naturellement
à une modélisation stochastique2, en l'occurrence
markovienne, à tous les niveaux de reconnaissance.
En effet, les lettres étant ligaturées à
la ligne de base, sont régies par un contexte lexical des mots de la
langue, se traduisant par des probabilités d'apparition et de succession
dans des mots. Cependant, l'utilisation des HMMs en reconnaissance de
l'écriture manuscrite arabe est relativement inadéquate. De
différentes architectures, pour la majorité des applications
reflètent des problèmes de traitement des graphèmes, des
pseudo-mots ou encore à des mots, montrant l'insuffisance des
modèles markoviens à décrire l'écriture manuscrite
arabe et à résoudre certains problèmes telle que la
segmentation.
1 Ligature : incluant plusieurs lettres.
2 Stochastique : aléatoire, régi par le hasard
(soutenu) MATHEMATIQUES qui implique la présence d'une variable
aléatoire, calcul des probabilités appliqué aux
statistiques
|