43
3I026 - Introduction ` a l’Intelligence Artificielle et Data Science Ludovic Denoyer Christophe Marsala Universit´ e Pierre et Marie Curie – Paris 6 21 janvier 2016

3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Embed Size (px)

Citation preview

Page 1: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

3I026 - Introduction a l’Intelligence Artificielle et DataScience

Ludovic DenoyerChristophe Marsala

Universite Pierre et Marie Curie – Paris 6

21 janvier 2016

Page 2: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Programme du jour

1 L’UE 3I026

2 Le monde de l’IA....

3 Le monde du Big Data....

4 L’IA au service de la data science

Page 3: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Plan du cours

1 L’UE 3I026

2 Le monde de l’IA....

3 Le monde du Big Data....

4 L’IA au service de la data science

Page 4: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IMPORTANT :

Debut des TDs et TMEs : semaine du lundi 25 janvierI TME : 14h - 17h45, salle 307, couloir 14/15I Animation : Gabriella Contardo & Ludmilla Tajtelbom

A noter :

site web de la Licence :http ://www-licence.ufr-info-p6.jussieu.fr/lmd/licence/2014/ue/LI351-2015fev/

Par le site de L.Denoyer : http://www-connex.lip6.fr/~denoyer

les cours seront disponibles sur la page Web

lisez regulierement vos emails [email protected]

allez regulierement sur le forum de l’UE (Site Piazza)

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 4 / 37

Page 5: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Description de l’UE

IntervenantsI Cours :

F Ludovic Denoyer : [email protected] Christophe Marsala : [email protected]

I TME :F Gabriella Contardo + Ludmilla Tajtelbom (PhD)

PrerequisI Connaissance du langage PythonI Ne pas partir en courant en face d’une equation

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 5 / 37

Page 6: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Directives

La presence au cours est obligatoireI il n’y aura aucun rappel de cours en TMEI le cours doit etre lu et travaille avant d’aller en TMEI il y aura (peut etre) des interos portant exclusivement sur le cours

La presence au TME est obligatoire (note de CC)I les CR de TME seront notes - 3 rendus principauxI ils seront a rendre a la fin du TME

Calcul de la note d’UEI examen : 60% de la noteI controle continu : 40% de la note qui se decompose en

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 6 / 37

Page 7: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Petit rappel methodologique...

Nous retenons :I 10 % de ce que nous lisonsI 20 % de ce que nous entendonsI 30 % de ce que nous voyonsI 50 % de ce que nous entendons et voyonsI 70 % de ce que nous pratiquons

En suivant ce cours : prenez des notes !I noter aide a memoriser...

En rentrant chez vous ou le lendemain :I mettez vos notes au propreI refaites les exemples vusI allez sur la page de l’UE pour trouver une copie de ce cours

Avant les seances (TD/TME, cours)I relisez le cours et refaites les exercices

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 7 / 37

Page 8: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Petit rappel methodologique...

Nous retenons :I 10 % de ce que nous lisonsI 20 % de ce que nous entendonsI 30 % de ce que nous voyonsI 50 % de ce que nous entendons et voyonsI 70 % de ce que nous pratiquons

En suivant ce cours : prenez des notes !I noter aide a memoriser...

En rentrant chez vous ou le lendemain :I mettez vos notes au propreI refaites les exemples vusI allez sur la page de l’UE pour trouver une copie de ce cours

Avant les seances (TD/TME, cours)I relisez le cours et refaites les exercices

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 7 / 37

Page 9: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Mode de fonctionnement du cours

Liens avec la recherche :I Departement : Donnees et ApprentissageI Equipes : Machine Learning and Information Access + Learning Fuzzy

and Intelligent SystemI Autres equipes : Base de donnees + Agents Cognitifs et Apprentissage

Liens avec les master :I Master DAC - Donnees et ApprentissageI Master ANDROIDE - AgeNts Distribues, Robotique, Recherche

Operationnelle, Interaction, DEcision

Quel point commun a presque toutes ces differentesequipes/masters ?

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 8 / 37

Page 10: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Plan du cours

1 L’UE 3I026

2 Le monde de l’IA....

3 Le monde du Big Data....

4 L’IA au service de la data science

Page 11: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Intelligence Artificielle

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 10 / 37

Page 12: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Apprentissage Automatique

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 11 / 37

Page 13: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Plusieurs Definitions

Learning is making useful changes in mind - [Marvin Minsky, 1985]

Learning is any change in a system that allows it to perform betterthe second time on repetition of the same task or another task drawnfrom the same population - [Herbert Simon, 1983]

Learning is the organization of experience - [Scott, 1983]

Learning is constructing or modifying representations of what is beingexperienced - [Riszard Michalski, 1986]

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 12 / 37

Page 14: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

l’Apprentissage

Plusieurs definition (ecoles) de l’apprentissage :I Cognitivistes :

F Postulat : Assimilation de l’organisme a un ordinateur, a une machine atraiter des informations

F Apprentissage : L’apprentissage vise a creer un nouveau programme

I Theories ecologiques :F Postulat : Le comportement dynamique traduit l’adaptation du systeme

aux contraintes qui pesent sur luiF Apprentissage : Integrer de nouveaux etats stables

Allez voir les specialistes....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 13 / 37

Page 15: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Apprentissage

C’est quoi la science de l’apprentissage ?

On etudie les apprentissage :I naturelsI artificiels

Des theories

Des modeles

Des Algorithmes

Differentes ecoles :

Les Symbolistes

Les Connexionnistes (rejoint par les statisticiens)I Statistical Machine Learning

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 14 / 37

Page 16: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Ordinateurs intelligents (par apprentissage)

Problematique :

Nous souhaitons avoir des ordinateursI intelligentsI adaptatifsI avec un comportement robuste

Programmer de tels comportement est souvent impossibleI Par exemple : Intelligence artificielle dans les jeux (scripts)

Solution :

Faire un ordinateur capable de se programmer lui-meme

a partir d’exemples (apprentissage classique / par imitation)

a partir de son ”experience” (apprentissage par renforcement)

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 15 / 37

Page 17: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 16 / 37

Page 18: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 17 / 37

Page 19: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 18 / 37

Page 20: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 19 / 37

Page 21: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 20 / 37

Page 22: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 21 / 37

Page 23: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 22 / 37

Page 24: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 23 / 37

Page 25: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 24 / 37

Page 26: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 25 / 37

Page 27: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 26 / 37

Page 28: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Exemple

Exercice

Ecrivez un programme JAVA permettant de ....

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 27 / 37

Page 29: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Plan du cours

1 L’UE 3I026

2 Le monde de l’IA....

3 Le monde du Big Data....

4 L’IA au service de la data science

Page 30: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Contexte

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 29 / 37

Page 31: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Contexte

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 30 / 37

Page 32: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

L’apprentissage et la Data Science

Data driven science : le 4e paradigme (Jim Gray - Prix Turing)

Extrait : ”A l’heure actuelle, la science vit une revolution qui conduit a nouveauparadigme selon lequel ’la science est dans les donnees’, autrement dit laconnaissance emerge du traitement des donnees [...] Le traitement de donneeset la gestion de connaissances representent ainsi le quatrieme pilier de lascience apres la theorie, l’experimentation et la simulation. L’extraction deconnaissances a partir de grands volumes de donnees (en particulier quand lenombre de donnees est bien plus grand que la taille de l’echantillon) ,l’apprentissage statistique, l’agregation de donnees heterogenes, la visualisation etla navigation dans de grands espaces de donnees et de connaissances sont autantd’instruments qui permettent d’observer des phenomenes, de valider deshypotheses, d’elaborer de nouveaux modeles ou de prendre des decisions ensituation critique”

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 31 / 37

Page 33: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Plan du cours

1 L’UE 3I026

2 Le monde de l’IA....

3 Le monde du Big Data....

4 L’IA au service de la data science

Page 34: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IA et Data Science

Voila ce que ca donne (avant)

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 33 / 37

Page 35: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IA et Data Science

Voila ce que ca donne (apres)

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 34 / 37

Page 36: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IA et Data Science

Et ca aussi

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 35 / 37

Page 37: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IA et Data Science

Qu’est-ce que l’IA et la DS partagent

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 36 / 37

Page 38: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IA et Data Science

Qu’est-ce que l’IA et la DS partagent

Un ensemble de modeles (predictifs) de l’apprentissageI SVM, Reseaux de neurones (Deep), Modeles bayesiens, arbres de

decisions (flous), forets, processus gaussiens, bandits, ....

Une ”demarche” (scientifique)I Voir cours 2

Des applications ”classiques”I Analyse de texte, analyse d’images, de paroles, ...

Des formations ! !

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 37 / 37

Page 39: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IA et Data Science

Qu’est-ce que l’IA et la DS ne partagent pas

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 38 / 37

Page 40: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

IA et Data Science

Qu’est-ce que l’IA et la DS ne partagent pas

L’objectif

Les salaires

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 39 / 37

Page 41: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Panorama des domaines

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 40 / 37

Page 42: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Objectifs de l’UE

L’enjeu des data sciences et l’apprentissage automatique

C’est quoi une donnee ?I donnees incompletes, donnees numeriques, donnees qualitativesI CR 0 : Les outils de la data Science

Apprentissage non superviseI ClusteringI Clustering FlouI Visualisation de donneesI CR 1 : Analyse de donnees urbaines (Paris)

Apprentissage supervise (introduction)I Modeles statistiques (reseaux de neurones)I Modeles symboliques (arbres et forets)I CR 2 : Prediction de mobilite (Paris)

Resolution de problemesI Algorithmes de planificationI CR 3 : Planification de mobilite (Paris)

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 41 / 37

Page 43: 3I026 - Introduction à l'Intelligence Artificielle et Data Science*10pt

Quelques livres conseilles sur l’intelligence artificielle

Elements de baseI “Intelligence Artificielle : resolution de problemes par l’homme et la machine”, J.L.

Lauriere, 1987I “Intelligence Artificielle”, P. Winston, 1988I “Principes d’intelligence artificielle”, N. Nilsson, 1988

I “Artificial intelligence, a modern approach”, S. Russel & P. Norvig, 1995

Livres plus generaux (format poche)I “L’intelligence artificielle”, J.-P. Haton & M.-C. Haton, 1993 (Que-sais-je ?)I “Les sciences de l’artificiel”, , H. Simon, 1996 (Folio essais)I “A la recherche de l’intelligence artificielle”, D. Crevier, 1999 (Champs Flamm.)I “La machine de Turing”, A. Turing (& J.-P. Girard), ed. 1999 (Points Sciences)

I “L’intelligence artificielle”, J.-G. Ganascia, 2007 (Le cavalier bleu)

Pour aller plus loin...I “Godel, Escher, Bach : Les Brins d’une Guirlande Eternelle”, D. Hofstadter, 1979I “Metaconnaissance : futur de l’intelligence artificielle”, J. Pitrat, 1990

I “De la machine a l’intelligence artificielle”, J. Pitrat, 1995

Christophe Marsala – Ludovic Denoyer (UPMC) 21 janvier 2016 42 / 37