WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Agrégats de mots sémantiquement cohérents issus d'un grand graphe de terrain

( Télécharger le fichier original )
par Christian Belbèze
Université Toulouse 1 Capitole - Doctorat en informatique 2012
   Télécharger le fichier original

précédent sommaire suivant

4.4 Résultats des regroupements et validation

sémantique

4.4.1 Agrégation par regroupement en cliques sur réseau AOL-17/04/2006 et validation manuelle

Matériel et conditions de test

Pour cette validation nous avons travaillé sur l'échantillon AOL-17/04/2006

Résultats

L'algorithme a créé 108446 cliques de 3 à 9 mots-clés, avec en moyenne 3.75 mots-clés par clique. 18600 mots-clés ne sont dans aucune clique.

En choisissant un système de regroupement favorisant fortement la cohérence du groupe, nous avons créé des groupes possédant une faible distance entre eux. Cette faible distance des agrégats a pour conséquence un grand nombre d'agrégats par rapport au nombre de mots-clés (3,2 cliques par mot-clé agrégé) et un nombre de mots-clés présents dans de très nombreuses cliques (plus de 50 mots-clés appartiennent à plus de 1000 cliques). Un système de regroupement créant plus de groupes qu'il n'existe d'objets individuels n'était pas ce que nous recherchions.

south

jobs

hospital

park

florida

beach

commun

auty

Island

north

Figure 4.11. Clique à neuf éléments.

précédent sommaire suivant