WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Agrégats de mots sémantiquement cohérents issus d'un grand graphe de terrain


par Christian Belbèze
Université Toulouse 1 Capitole - Doctorat en informatique 2012
  

précédent sommaire suivant

3.5 : Méthode 4 : Méthode d'enrichissement d'agrégats par gravité 113

Chapitre 3. Les méthodes d'agrégations proposées

TMA. Si tel n'est pas le cas (taille inférieure), l'exécution de la boucle fine permet l'introduction de noeuds rares ou très souvent utilisés dans l'agrégat, sans dépasser la TMA, en respectant donc statistiquement la cohérence sémantique des agrégats.

Une limite de la méthode

Une limite de la méthode est son incapacité à ordonner les noeuds dans un agrégat ou encore à pondérer l'appartenance des noeuds à un agrégat. Les noeuds représentent l'espace sémantique d'un agrégat tout en y étant rattachés. La complexité de ce lien rend difficile toutes pondérations.

De plus, il existe plusieurs combinaisons graphiques qui ne permettent pas à un noeud de rejoindre un agrégat. Sans chercher à les citer toutes, disons simplement qu'une figure identifiable comme un sous-graphe bi-connexe ou un k-clique ne peut pas par, définition, intégrer un noeud seulement connecté à une diade (cf. image 3.6).

Noeud connecté à un seul agrégat mais par un lien unique

Noeuds connectés par un lien unique à plusieurs agrégats

Noeuds connectés par un lien

unique mais retrouvant une
proximité par d'autres noeuds

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Figure 3.12 : Exemple de figures où des noeuds proches d'agrégats ne sont pas intégrés car ne répondant pas à la condition de rigidification.

Cette méthode consiste en une recherche de zone ayant une forte cohérence sémantique. Elle peut être éventuellement complétée par des post-traitements si l'on souhaite que chaque mot puisse être rattaché à un ou plusieurs agrégats. La méthode d'enrichissement d'agrégats par gravité présentée dans le paragraphe 3.5 est un exemple de méthode pouvant être utilisée dans ce but.

3.5 Méthode 4 : Méthode d'enrichissement

d'agrégats par gravité

La méthode d'enrichissement d'agrégats par gravité peut être incluse en tant que phase supplémentaire d'une méthode plus générale. Elle permettrait à une méthode «mono phase » de rejoindre alors la famille des méthodes en plusieurs phases. Dans cette famille, la phase 3

3.5 : Méthode 4 : Méthode d'enrichissement d'agrégats par gravité 114

Chapitre 3. Les méthodes d'agrégations proposées

de l'algorithme RaRe\IS présenté au paragraphe 2.3.2 [Baumes&al-2005-1] est un exemple de méthode d'enrichissement incluse dans une méthode plus générale. Elle pourrait aussi être utilisée en tant que phase d'assemblage dans les méthodes issues de HLS (cf. paragraphe 3.3.2)

Cependant, la méthode que nous avons créée est une solution indépendante de toutes méthodes et peut être implantée sur un graphe quelconque si celui-ci contient des agrégats identifiés ou connus.

3.5.1 Les objectifs d'une méthode d'enrichissement des agrégats.

L'enrichissement a pour but de créer une relation pondérée ou non-pondérée entre un noeud et un ou plusieurs agrégats.

Cependant avant de proposer une méthode d'enrichissement posons-nous la question suivante : un mot peut-il être plus ou moins proche d'un agrégat ?

Les linguistes définissent bien plusieurs zones d'influences autour d'une thématique.

Le champ lexical est défini par Marc Farayet [Fayaret-2011] comme « l'ensemble des mots qui, dans un texte, se rapportent à une même réalité ou à une même idée. Ces mots ont pour point commun d'être synonymes, d'appartenir à la même famille, au même domaine ou encore à renvoyer à la même notion. ».

Le réseau lexical est défini dans le même ouvrage comme : « Le réseau [lexical] qui regroupe l'ensemble des mots qui désignent des idées ou des réalités qui renvoient à un même thème (=le champ lexical) plus tous les mots qui à cause du contexte et de certains aspects de leur signification (du fait des connotations) évoquent aussi ce thème. ». Ainsi le réseau lexical incorpore un champ lexical en l'enrichissant.

Nous trouvons dans le schéma proposé par Marc Farayet deux espaces sémantiques où un réseau lexical incorpore un champ lexical.

Figure 3.13 : Exemple d'espaces sémantiques incorporés l'un dans l'autre « tel que » fourni par Marc Farayet [Fayaret-2011].

précédent sommaire suivant