WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Une contribution du datamining àƒÂ la segmentation du marché et au ciblage des offres àƒÂ  l'aide de la statistique de Bayes

( Télécharger le fichier original )
par samuel Kalombo
UNiversité de Kinshasa - Licence 2011
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

I.3.6 Les variables à descriptions modales

C'est le cas d'une variable Yh qui peut être décrite par une fonction définie sur le domaine d'observation 0h dans [0,1].

I.3.7 Les variables taxonomiques ou structurées

Les domaines d'observation des variables de classification peuvent être munis parfois de connaissances supplémentaires appelées connaissances du domaine. Ces connaissances supplémentaires sont définies dans le cas de descriptions univaluées mais peuvent être prises en compte dans un traitement sur des descriptions multivaluées (exemple : dans le calcul de la mesure de ressemblance entre les individus au cours d'un processus de classification automatique).

Il arrive par exemple qu'un expert puisse fournir une structuration des valeurs du domaine d'observation sous la forme d'un arbre ordonné, d'un graphe orienté, etc. Une variable dont le domaine d'observation est représenté par une structure hiérarchique est dite variable taxonomique ou encore structurée.

I.4. Les mesure de ressemblance

Tout système ayant pour but d'analyser ou d'organiser automatiquement un ensemble de données ou de connaissances doit utiliser, sous une forme ou une autre, un opérateur capable d'évaluer précisément les ressemblances ou les dissemblances qui existent entre ces données.

La notion de ressemblance (ou Proximité) a fait l'objet d'importantes recherches dans des domaines extrêmement divers. Pour qualifier cet opérateur, plusieurs notions comme la similarité, la dissimilarité ou la distance peuvent être utilisées.

I.4.1 Définition

Nous appelons similarité ou dissimilarité toute application à valeurs numériques qui permet de mesurer le lien entre les individus d'un même ensemble. Pour une similarité le lien entre deux individus sera d'autant plus fort que sa valeur est grande. Pour une dissimilarité le lien sera d'autant plus fort que sa valeur de dissimilarité est petite

I.4.2 Indice de dissimilarité

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de dissimilarité (ou dissimilarité), s'il vérifie les propriétés suivantes :

1. (propriété de symétrie)

2. (propriété de positivé)

I.4.3 Distance

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit distance, s'il vérifie en plus des deux propriétés 1 et 2 les propriétés d'identité et d'inégalité triangulaire suivantes :

3. (propriété de d'identité)

4. (inégalité triangulaire)

1.4.4 Indice de similarité

Un opérateur de ressemblance défini sur l'ensemble d'individus est dit indice de similarité (ou similarité), s'il vérifie en plus de la propriété de symétrie (1) les deux propriétés suivantes :

5. (propriété de positivité)

6. (propriété de maximisation).

Il convient de noter ici que le passage de l'indice de similarité s à la notion duale d'indice de dissimilarité (que nous noterons d), est trivial. Etant donné smax la similarité d'un individu avec lui-même (smax= 1 dans le cas d'une similarité normalisée), il suffit de poser :

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Et il n'est rien de plus beau que l'instant qui précède le voyage, l'instant ou l'horizon de demain vient nous rendre visite et nous dire ses promesses"   Milan Kundera