WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Application du processus de fouille de données d'usage du web sur les fichiers logs du site cubba

( Télécharger le fichier original )
par Nabila Merzoug et Hanane Bessa
Centre universitaire de Bordj Bou Arréridj Algérie - Ingénieur en informatique 2009
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

3. Résultats de l'analyse des fichiers Log du CUBBA

La figure suivante illustre un résumé sur les statistiques obtenues du prétraitement des fichiers log du centre universitaire de Bordj Bou Arréridj

Fichiers log

 

requêtes non valides 1,27%

methode<>get 0,50%

robots.txt 1,22%

liste ips des robots web 0,16%

liste useragent robots web 0,10%

mots clés de robots web 3,88%

annonces 34,81%

images 39,26%

aspérateurs web 0,66%

requêtes valide 18,10%

nombre de sessions 744

nombre de visites 1826

FIG 4.9. Statistiques de prétraitement de fichiers log

4. 2 XV013d01" Slé1" MAion

L'implémentation est une partie primordiale dans ce travail. Au cours de cette partie, nous allons décrire brièvement l'ensemble d'outils d'investigation utilisés durant les étapes de prétraitement.

4.1. DELPHI 7:

Pour la réalisation de notre application, nous avons choisi le langage de programmation DELPHI 7, qui est un outil de développement puissant pour une programmation d'application sous WINDOWS.

DELPHI 7 offre plusieurs avantages, on peut citer :

Il apporte une grande souplesse aux développements lorsqu'il un fichier exe.il s'agit d'un vrai exécutable, aucun autre fichier n'est nécessaire pour l'exécution, vous obtenez donc une application plus propre et plus facile à distribuer et à maintenir.

v' L'emploi des tableaux à plusieurs dimensions.

1' DELPHI est doté d'outils de programmation tels que les modèles d'application et des fichiers qui permettent de créer et de tester une application.

v' Lors de la phase de transformation, nous pouvons visualiser les données (réelles), nous pouvons ainsi savoir aussi si le résultat de notes requis correspond à nos attentes.

4.2. Le langage SQL

Pour le nettoyage de données nous avons eu recours au formalisme du langage de manipulation des données SQL, très répandu et de compréhension facile.

SQL (Structured Query Language, en anglais, ou langage structuré de requêtes, en français) est un langage standard et normalisé, destiné à interroger ou à manipuler une base de données relationnelle. SQL se décompose en 3 parties, à savoir :

v' La définition de données: création, suppression, modification de la structure des tables.

v' Les manipulations des bases de données : Sélection, modification, suppression d'enregistrements.

v' La gestion des droits d'accès aux tables : Contrôle des données : droits d'accès, validation des modifications

5. Conclusion

Dans le cadre de ce chapitre, nous avons présentés les différents résultats de la méthodologie de prétraitement des fichiers Logs qui donne de bons résultats expérimentaux (18.10 % de la taille de la base après l'étape de nettoyage). A ce stade, la phase amont du processus se termine. Les données du web sont prêtent bien à La partie suivante qui constituant le coeur du processus, décrit l'application des techniques de la fouille d'usage du web aux fichiers log de CUBBA.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Là où il n'y a pas d'espoir, nous devons l'inventer"   Albert Camus