Upload
nizar-bechir
View
819
Download
2
Embed Size (px)
Citation preview
1
Intelligence ARTIFICIEL
Apprentissage automatique
Nizar BECHIR
2
Plan
Introduction
Apprentissage automatique
Apprentissage supervisé
Apprentissage non supervisé
Apprentissage par renforcement
Conclusion
3
Apprentissage automatique
L'apprentissage automatique fait reference au developpement,
l'analyse et l'implementation des methodes qui permettent a une
machine (au sens large) d'evoluer et ainsi de remplir des taches
qu'il est difficile ou impossible de remplir par des moyens
algorithmiques plus classiques
4
Herbert Simon :
<< L'apprentissage dénote des changements dans un systeme
qui ... lui permet de faire la mème tache plus efficacement la prochaine fois.
>>
5
qu’est ce que c’est-à-dire « machine apprend » ?
6
Pourquoi l’apprentissage automatique ?
7
Exemple de systemes apprenant
Un robot ayant la capacite de bouger ses membres mais ne sachant initialement rien de la coordination des mouvements permettant la marche,peut apprendre a marcher.
Le robot commencera par effectuer des mouvements aleatoires, puis, en
selectionnant et privilegiant les mouvements lui permettant d'avancer, mettra
peu a peu en place une marche de plus en plus efficace. video
8
2 grands types d'apprentissage :
Apprentissage supervisé
Apprentissage non supervisé
Apprentissage par renforcement
9
◦ Apprentissage supèrvisé
Le but est de generaliser à des entrées inconnues ce qui a
pu etre appris grace aux donnees deja traitees par des
experts
donc, géneralement l’Objectif est de déterminer une
fonction de prediction f selon les données d'apprentissage
10
Selon ces données d'apprentissage qui sont N couples entrée-sortie (xn ; yn ) le système va chercher la fonction adéquate
A quelle fonction correspond cet ensemble de points ?
11
Le principe de ce système est que
« les hypothèses suffisantes les plus simples sont les plus vraisemblables »
12
Quelques exemples classiques de techniques de
classification supervisée :
Les réseaux de neurones, très utilisés dans les années 80-90, sont inspirés à l’origine du fonctionnement du cerveau humain.
Les arbres de décision modélisent la fonction à apprendre par une succession de critères organisés suivant une structure arborescente.
Les « SVM » ou « machines à vecteurs supports » sont les techniques les plus efficaces pour résoudre ce problème à l’heure actuelle.
13
Apprentissage par renforcement
Le système apprenant est agent en interaction avec
un environnement
Le problème est découpé en pas de temps
A chaque pas, l'agent
-perçoit l‘état de l'environnement,
-puis, exécute une action dans l'environnement
14
Le but de l'agent est de trouver un comportement qui maximise le
renforcement (récompense)
15
./Principe de fonctionnement
1.L’agent décide d’effectuer une action en fonction de son état pour interagir avec son environnement.
2.L'environnement renvoie un renforcement sous la forme d’une récompense positive ou négative.
3.L’agent observe les effets de ses actions.4.L’agent déduit de ses observations la qualité de ses
actions.5.L’agent améliore ses actions futures.
16
Dans un problème d'apprentissage par
renforcement, un agent évoluant dans un environnement aléatoire doit cumuler un maximum de récompenses en choisissant au fil du temps la meilleure politique, c'est-à-dire la meilleure réaction possible à ses observations. Une telle situation est modélisée par un processus de décision markovien
17
18
Récomponse
19
Exemple pratique..
20
21
Conclusion
L'apprentissage automatique regroupe les techniques permettant a une machine d'adapter et d'améliorer ses performances par l'expèrience
22
Référence
https://tel.archives-ouvertes.fr/tel-00933937/document
blog.octo.com/apprentissage-par-renforcement-de-la-theorie-a-la-pratique/