WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Techniques d'extraction de connaissances appliquées aux données du Web

( Télécharger le fichier original )
par Malika CHARRAD
Ecole Nationale des Sciences de l'Informatique, Université de la Manouba, Tunis - Mastère en informatique, Option : Génies Documentiel et Logiciel 2005
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

6.3 Procédure de classification d'une visite

Dans cette section, nous avons pour objectif de classifier un utilisateur du site dans l'une des catégories définies précédemment en fonction de son comportement sur le site. Pour ce faire, nous considérons une de ses visites au site i.e. un ensemble de requêtes effectuées par un couple (IP, User Agent) dont le délai séparant deux requêtes consécutives ne dépasse pas 30 minutes. D'après la méthodologie que nous avons proposée, il faut tout d'abord identifier les requêtes aux pages de contenu de celles effectuées aux pages auxiliaires, ensuite, découvrir le motif de navigation de l'internaute. Selon son motif de navigation, l'internaute sera affecté à l'une des catégories des utilisateurs du site. A titre d'exemple, prenons la visite suivante effectuée par un utilisateur dont l'adresse IP et le User Agent sont les suivants:

2Laboratoire de Recherche Opérationnelle, de Décision et de Contrôle de processus

- 196.203.33.14

- Mozilla/4.0+(compatible ;+MSIE+6.0 ;+Windows+NT+5. 1)

Les requêtes effectuées par cet utilisateur sont présentées dans la figure suivante:

TAB. 6.4: Visite à classifier

D'après les résultats de la classification des pages effectuée à la section 1 de ce chapitre, nous identifions la requête 9412 comme une requête à une page auxiliaire. Les autres requêtes sont effectuées sur des pages de contenu. La variable »Niveau 1» permet d'identifier le motif de navigation en se servant des figures 6.15 et 6.16. Ainsi, le motif de navigation correspondant est »institutions universitaires». De plus, si nous examinons les variables : durée de la visite (1501 secondes, environ 13 minutes), durée moyenne par page (187, 6 secondes) et nombre de requêtes par visite (8 requêtes) dont les valeurs sont assez proches des valeurs moyennes de la première classe (Durée moyenne des visites = 1728, Durée moyenne par page = 233 secondes et nombre moyen de requêtes par visite=5, 5) nous pouvons affecter l'internaute, qui a effectué cette visite, à la classe des universitaires dont l'objectif est la visite des institutions universitaires et le téléchargement des cours.

6.4 Conclusion

La classification des utilisateurs du site se résume en deux étapes : classification de requêtes puis classification des visites. Au niveau de chaque étape, nous avons effectué une classification à deux niveaux en se servant de deux méthodes de classification. Ce travail a aboutit à la découverte de quatre groupes d'utilisateurs du site du CCK à savoir des universitaires ayant pour centre d'intérêt les activités des institutions universitaires et le téléchargement des cours, des chercheurs ayant pour seul centre d'intérêt les activités de recherche des unités et laboratoires de recherche, des visiteurs ayant pour objectif la découverte du site et des agents ou robots web.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"I don't believe we shall ever have a good money again before we take the thing out of the hand of governments. We can't take it violently, out of the hands of governments, all we can do is by some sly roundabout way introduce something that they can't stop ..."   Friedrich Hayek (1899-1992) en 1984