WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Algorithmes d'apprentissage pour la classification de documents

( Télécharger le fichier original )
par yasmine Hanane zeggane Mokhtar -
Université de Mostaganéme -Algérie- - Licence 2009
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

3. Modélisation par une méthode conceptuelle(UML) :

3.1. Définition d'UML :(Unified Modeling Language ) :

UML est un langage de modélisation unifié (créé en 1994), né de la fusion des trois méthodes de modélisation d'objet :

· OMT : Object Modeling Technique (créé par Jim Rumbaugh).

· BOOCH : Nom tiré de son inventeur (Grady Booch).

· OOSE : Object Oriented Software Engineering.

UML est un langage pour visualiser, spécifier, construire et documenter les abstractions d'un système logiciel.

3.2. Les avantages d'UML

· UML est un langage formel et normalisé : il permet un gain de précision et de stabilité.

· UML est un support de communication performant : il permet grâce à sa représentation graphique, d'exprimer visuellement une solution objet, de faciliter la comparaison et l'évolution de solution.

· Son caractère polyvalent et sa souplesse en font un langage universel.

3.3. Les diagrammes d'UML

Un diagramme UML est une représentation graphique, qui permet de modéliser un aspect bien précis du système, chaque type de diagramme UML possède une structure et des concepts prédéfinis.

Un diagramme donne à l'utilisateur un moyen de visualiser et de manipuler des éléments de modélisation.

Au total UML définit treize types de diagrammes. Mais, nous avons eu besoin d'utiliser seulement cinq diagrammes parmi les treize proposés par ce langage.

Ce choix nous a permis de bien comprendre le fonctionnement de ces quatre diagrammes, et de maîtriser leur usage au sein de notre projet de classification des pages web.

· Diagramme de cas d'utilisation représente les fonctions du système du point de vue des utilisateurs ;

· Diagramme de classes montre une collection d'éléments statiques (classes), leur contenu (attributs, opérations, types) et les relations entre eux (associations). Permet de décrire la structure statique d'un système.

· Les diagrammes de composants permettent de décrire l'architecture physique et statique d'une application en terme de modules : fichiers sources, librairies, exécutables, etc.

· Les diagrammes de séquence sont une représentation temporelle des objets et de leurs interactions.

- Permettre de bien comprendre le fonctionnement du système ; modéliser la vie des objets dans le temps et leur chronologie.

- Représenter les interactions, les communications entre objets.

· Les diagrammes d'états-transitions représentent le comportement d'un classificateur ou d'une méthode en terme d'états ;

Diagramme d'états-transitions sert à représenter des automates d'états finis, sous forme de graphes d'états, reliés par des arcs orientés qui décrivent les transitions.

- Les diagrammes d'état-transitions permettent de décrire les changements d'états d'un objet ou d'un composant, en réponse aux interactions avec d'autres objets/composants ou avec des acteurs.

- Une transition représente le passage instantané d'un état vers un autre.

- Une transition est déclenchée par un événement. En d'autres termes : c'est l'arrivée d'un événement qui conditionne la transition.

Diagramme de cas d'utilisation:

Utilisateur

Afficher / Classer

Ouvrir un fichier

Calculer les vecteurs d'occurrences Choix de l'algorithme

d'apprentissage

KPPV

Rocchio

Comparer le texte à classer avec les textes d'apprentissage

Sacmot

String Source

Vector vecteur

String Sac_mot

Void RemplirVecteur()

Void Charger_Sacmot()

Diagramme de classes utilisées

Class_C

String Texte[]

Boolean TrouveString

(String Str, String fichier)

Int NbreTexte(String rech)

kPPV

VecteurTexte vTexte

kPPV (VecteurTexte vTexte)

decision()

Paramètres

Extends

VecteurTexte

String fich

Vector vecteur

VecteurTexte ( String fich,

Paramètres

Rocchio

VecteurTexte vTexte

Rocchio (VecteurTexte vTexte)

decision()

Paramètres

Ouvrir un fichier

Calculer le vecteur d'occurrences

Choix de l'algorithme d'apprentissage

Comparer le vecteur de fréquence de texte à classer avec les vecteurs de fréquences des textes d'apprentissage C1 (médecine)

Comparer le vecteur de fréquence de texte à classer avec les vecteurs de fréquences des textes d'apprentissage (non médecine)

Calculer le vecteur des similarités

Classer le fichier

Prendre la décision

Diagramme d'états-transitions

Diagramme de séquence de kPPV

Afficher la classe du texte

Afficher le vecteur de similarités

Afficher le vecteur d'occurrences

Afficher le vecteur de fréquences

Décision

Charger le vecteur de similarités

Charger le vecteur de fréquences

Charger le vecteur d'occurrences

Affecter le vecteur de mots clés

Charger le vecteur de mots clés

Ouvrir le fichier

JFilechooser

Sac_mot

VecteurTexte

kPPV

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Entre deux mots il faut choisir le moindre"   Paul Valery