Caractérisation et extraction informatique de la structure d'un tableau par une méthode implémentant un réseau de neurones

( Télécharger le fichier original )
par Pacifique BISIMWA MUGISHO
Institut Supérieur Pédagogique - Licence en Informatique de Gestion 2011

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

3.2.2. Composition du réseau de neurones choisi

Ainsi que nous l'avons signalé précédemment, la composition de notre réseau de neurones est calquée sur la structure même d'un réseau de neurones biologiques moyennant une certaine simplification à des fins adaptatives.

Donc, à l'instar du système visuel humain, notre réseau de neurones sera organisé en différentes couches tels que la rétine, le gradient et l'aire de sortie.

Dans le système visuel humain, lorsque l'oeil perçoit une image, un signal nerveux est transmis au centre du cerveau. Et, en suivant l'ordre de propagation de ce signal, on constate qu'il devient de plus en plus abstrait à mesure qu'il s'éloigne de la première couche (la rétine). Ainsi, un nombre de neurones élevé sera nécessaire à la première couche qui est au contact direct avec les données physiques tandis que ce ne sera pas le cas pour la dernière couche qui, par voie des faits est éloignée de la réalité.

Dans l'implémentation de notre réseau, nous allons donc suivre la même logique en réduisant le nombre de neurones au fur et à mesure que l'on s'éloigne de la première couche.

a. Le nombre de neurones composant chaque couche

- Nombre de neurones de la rétine :

La rétine étant la couche qui reçoit directement les données physiques de l'image d'entrée, nous allons lui affecter le plus grand nombre de neurones. Ainsi, afin de respecter la résolution, pour une image de dimension 300X300, nous aurons besoin de 300 X 300 = 90 000 neurones, à raison d'un neurone par pixel.

- Nombre de neurones du gradient :

Considérant que, d'une manière isolé, un pixel ne donne pas le maximum d'informations sur une image, nous allons chaque fois regrouper 3X3 pixels afin d'obtenir le minimum d'informations nécessaires concernant la composition d'une image. Le champ récepteur d'un neurone du gradient sera donc constitué de 9 neurones de la rétine ; ce qui fait un total de 291 X 291 = 84 681 neurones nécessaires pour constituer la couche du gradient.

- Nombre de neurones de l'aire de sortie :

Cette couche étant la dernière, et suivant directement celle du gradient, elle aura un champ récepteur constitué de 84 681 neurones du gradient.

b. L'organisation des neurones dans le réseau

i. L'organisation de neurones de la rétine et du gradient

Comme nous l'avons signalé précédemment, chaque neurone du gradient reçoit en entrée la sortie de neuf neurones de la rétine se trouvant dans son champ récepteur. Et chacun des neuf neurones est détenteur d'une information sur le pixel qui se trouvait en face de lui. Cette information est un entier représentant le niveau de gris du pixel de l'image d'entrée.

ii. L'organisation des neurones du gradient et de l'aire de sortie

L'aire de sortie étant la dernière couche du réseau, nous avons un et un seul neurone prenant toutes les sorties des neurones du gradient en entrée et possédant une et une seule sortie.

D'une manière synthétique, la configuration spatiale du réseau se présente comme suit :

Couche de la Rétine

Couche du Gradient

Couche de l'Aire de sortie

Sortie du réseau

(structure du tableau au format *.html ou *.doc)

Signaux d'entrée provenant de l'image du tableau (les 3 composantes RVB)

Fig. 8. Structure spatiale du réseau de neurones 3.3. Méthodologie de reconnaissance

Tel que annoncé au point 4 du chapitre 2, notre méthodologie se repartit en deux grandes étapes qui sont :

- le prétraitement de l'image du document et

- l'extraction des caractéristiques du tableau contenu sur l'image.

précédent sommaire suivant

"Le doute est le commencement de la sagesse" Aristote