WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp

Home | Publier un mémoire | Une page au hasard

Memoire Online >

Economie et Finance

Une contribution du datamining àƒÂ la segmentation du marché et au ciblage des offres àƒÂ l'aide de la statistique de Bayes

( Télécharger le fichier original )
par samuel Kalombo
UNiversité de Kinshasa - Licence 2011

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

I.3.6 Les variables à descriptions modales

C'est le cas d'une variable Y_h qui peut être décrite par une fonction définie sur le domaine d'observation 0_h dans [0,1].

I.3.7 Les variables taxonomiques ou structurées

Les domaines d'observation des variables de classification peuvent être munis parfois de connaissances supplémentaires appelées connaissances du domaine. Ces connaissances supplémentaires sont définies dans le cas de descriptions univaluées mais peuvent être prises en compte dans un traitement sur des descriptions multivaluées (exemple : dans le calcul de la mesure de ressemblance entre les individus au cours d'un processus de classification automatique).

Il arrive par exemple qu'un expert puisse fournir une structuration des valeurs du domaine d'observation sous la forme d'un arbre ordonné, d'un graphe orienté, etc. Une variable dont le domaine d'observation est représenté par une structure hiérarchique est dite variable taxonomique ou encore structurée.

I.4. Les mesure de ressemblance

Tout système ayant pour but d'analyser ou d'organiser automatiquement un ensemble de données ou de connaissances doit utiliser, sous une forme ou une autre, un opérateur capable d'évaluer précisément les ressemblances ou les dissemblances qui existent entre ces données.

La notion de ressemblance (ou Proximité) a fait l'objet d'importantes recherches dans des domaines extrêmement divers. Pour qualifier cet opérateur, plusieurs notions comme la similarité, la dissimilarité ou la distance peuvent être utilisées.

I.4.1 Définition

Nous appelons similarité ou dissimilarité toute application à valeurs numériques qui permet de mesurer le lien entre les individus d'un même ensemble. Pour une similarité le lien entre deux individus sera d'autant plus fort que sa valeur est grande. Pour une dissimilarité le lien sera d'autant plus fort que sa valeur de dissimilarité est petite

I.4.2 Indice de dissimilarité

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de dissimilarité (ou dissimilarité), s'il vérifie les propriétés suivantes :

1. (propriété de symétrie)

2. (propriété de positivé)

I.4.3 Distance

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit distance, s'il vérifie en plus des deux propriétés 1 et 2 les propriétés d'identité et d'inégalité triangulaire suivantes :

3. (propriété de d'identité)

4. (inégalité triangulaire)

1.4.4 Indice de similarité

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de similarité (ou similarité), s'il vérifie en plus de la propriété de symétrie (1) les deux propriétés suivantes :

5. (propriété de positivité)

6. (propriété de maximisation).

Il convient de noter ici que le passage de l'indice de similarité s à la notion duale d'indice de dissimilarité (que nous noterons d), est trivial. Etant donné smax la similarité d'un individu avec lui-même (smax= 1 dans le cas d'une similarité normalisée), il suffit de poser :

précédent sommaire suivant

Changeons ce systeme injuste, Soyez votre propre syndic

"Soit réservé sans ostentation pour éviter de t'attirer l'incompréhension haineuse des ignorants" Pythagore