III.7.2. Types d'agents
Nous avons quatre types fondamentaux des programmes des agents
qui incarnent les principes fondamentaux de tous les agents
intelligents :
v Agents réactifs simples
Le type d'agent le plus simple est l'agent réactif
simple. Ce type d'agent choisit les actions en fonction des perceptions
actuelles, ignorant le reste des perceptions historiques.
v Agents réactifs basés sur les
modèles
La manière la plus effective pour les agents de
manipuler la visibilité partielle est de stocker l'information sur ces
parties du monde qu'ils ne peuvent pas voir. L'agent doit donc maintenir un
certain type d'état interne qui dépend de l'histoire
perçue qui puisse refléter au moins les aspects non observables
de l'état actuel. L'utilisation de l'information de l'état
interne au fur et à mesure que passe le temps exige de codifier deux
types de connaissance dans le programme de l'agent:
Ø La connaissance concernant comment évolue le
monde indépendamment de l'agent;
Ø L'information sur comment les actions de l'agent
affectent le monde.
Cette connaissance sur comment fonctionne le monde, qu'elle
soit implémentée avec un circuit booléen simple ou avec
des théories scientifiques complètes, s'appelle "modèle du
monde". Un agent qui utilise ce modèle est un agent basé sur les
modèles.
v Agents basés sur les objectifs
La connaissance sur l'état actuel du monde n'est pas
toujours suffisante pour décider quoi faire. Par exemple, dans un
croisement de chemins, le taximan peut virer à gauche, virer à
droite ou continuer droit. La décision correcte dépend de
où veut aller le taxi. En d'autres termes, outre la description de
l'état actuel, l'agent a besoin d'une certaine information sur son
objectif qui décrive les situations qui sont
désirables, par exemple, arriver à la destination proposée
par le passager. Le programme de l'agent peut se combiner avec l'information
sur les résultats des actions possibles (la même information
utilisée pour actualiser l'état interne dans le cas de l'agent
réactif) pour choisir les actions qui permettent d'atteindre
l'objectif.
v Agents basés sur l'utilité
Les objectifs seuls en soi ne sont pas suffisants pour
générer un comportement de grande qualité dans la
majorité des environnements. Par exemple, il y a beaucoup de
séquences d'actions qui conduiront le taxi à sa destination (et
par tant à atteindre son objectif), mais certaines sont plus rapides,
plus sures, plus fiables, ou moins coûteuses que d'autres. Les objectifs
seuls fournissent une distinction binaire crue entre les états de
"félicité" et "tristesse", alors qu'une mesure d'efficience plus
générale devrait permettre une comparaison entre
différents états du monde par rapport au niveau exact de
félicité que l'agent atteint quand il arrive à un
état ou autre. Comme le terme "félicité" ne sonne pas plus
scientifique, la terminologie traditionnelle utilise dans ces cas pour indiquer
qu'on préfère un état du monde est qu'un état a
plus d'utilité qu'un autre pour l'agent.
Tous les quatre types précédents peuvent
apprendre. Un agent qui apprend peut être divisé en quatre
composants conceptuels suivants :
Ø L'élément d'apprentissage : qui
fait des améliorations sur base de certaines critiques ;
Ø L'élément d'agissement : qui
choisit les actions (externes) à réaliser ;
Ø La critique : qui réalimente
l'élément d'apprentissage pour qu'il fasse des
améliorations ;
Ø Le générateur de
problèmes : qui suggère des actions qui conduiront l'agent
aux expériences nouvelles et informatiques.
|