2.3.4.2 Construction d'un arbre de décision
Le but est de trouver le plus petit arbre qui respecte
l'ensemble d'entraînement. Il ne s'agit pas uniquement de
mémoriser les observations, il faut trouver un arbre qui est capable
d'extrapoler des exemples qu'il n'a pas déjàvu.
L'arbre doit extraire des tendances ou des comportements
à partir des exemples.
1. Il construit les arbres de décision de haut en bas.
2. Il place à la racine l'attribut le plus important,
c'est-à-dire celui qui sépare le mieux les exemples positifs et
négatifs.
3. Par la suite, il y a un nouveau noeud pour chacune des
valeurs possibles de cet attribut.
4. Pour chacun de ces noeuds, on recommence le test avec le
sous-ensemble des exemples d'entraînement qui ont
étéclassés dans ce noeud.
2.3. LES ALGORITHMES DE MACHINE LEARNING CHAPITRE 2. REVUE DE LA
LITTÉRATURE
Mémoire de Master II en Informatique 30 c~NJAMEN M. ZELKIF
2020-2021
2.3.4.3 Avantages des Arbres de Décision
· Non-linéarité · Support des
variables catégoriques
· Facile à interpréter
· Application à la régression
2.3.4.4 Inconvénients des Arbres de
Décision
· Prone au sur-ajustement
· Instable (non robuste)
· Forte variance
Enfin, il est rare que les modèles d'apprentissage
automatique utilisent un seul arbre de décision. Mais ils
agrègent plusieurs pour obtenir ce que l ?on appelle une forêt
d'arbres décisionnels ou forêts aléatoires.
2.3.5 Machines à vecteurs support SVM
Introduit par Vapnik en 1990, les machines à vecteurs
de support sont des techniques d'apprentissage supervisédestinées
à résoudre des problèmes de classification et de
régression.
Ce modèle était toutefois linéaire et
l'on ne connaissait pas encore le moyen d'induire des frontières de
décision non linéaires. En 1992, Boser et Al proposent
d'introduire des noyaux non-linéaires pour étendre le SVM au cas
non-linéaire dans SOLLAH [20].
Elles reposent sur deux notions principales : la notion de
marge maximale et la notion de fonction noyau. Les machines à vecteurs
support sont des algorithmes d'apprentis-sage automatique qui traitent des
problématique de classification et de régression d'après
Wikipédia [25].
Ces algorithmes ont l'avantages d'être simple à
utiliser, flexible et garantissent une soliditéthéorique.
leur but est de classer les données à l'aide
d'une frontière de sorte à maximiser la distance (appelée
marge) entre les données des différentes classes.
2.3. LES ALGORITHMES DE MACHINE LEARNING CHAPITRE 2. REVUE DE LA
LITTÉRATURE
Mémoire de Master II en Informatique 31 c~NJAMEN M.
ZELKIF 2020-2021
Les machines à vecteurs support sont utilisés
dans une variétéd'applications telles que la détection des
anomalie, la vision par ordinateur, la reconnaissance d'images etc.
Le tine-tuning des hyper-paramètres du SVM peut
être optimiséen utilisant la technique Grid-Search. Selon
Wikipédia [25]
|