36
Big Data: alchimie ou science ? Janvier 2015 - GUILLAUME CHEVILLON Professeur of Statistics & Econometrics, ESSEC Business School CoDirecteur ESSEC-CentraleSupélec MSc Data Sciences & Business Pierre Bismuth

Big data: alchimie ou science ?

Embed Size (px)

Citation preview

Page 1: Big data: alchimie ou science ?

Big Data: alchimie ou science ?Janvier 2015 - GUILLAUME CHEVILLON Professeur of Statistics & Econometrics, ESSEC Business SchoolCoDirecteur ESSEC-CentraleSupélec MSc Data Sciences & Business Analytics

Pier

re B

ismut

h

Page 2: Big data: alchimie ou science ?

BIG DATA: QUELLES DONNEES ?PREVOIRAPPORT DES SCIENCES SOCIALESUNE SCIENCE ?

Page 3: Big data: alchimie ou science ?

Big Data is not about the Data!Gary King

Harvard University (2015)

The End of Theory: The Data Deluge Makes the Scientific Method Obsolete

Chris AndersonWired (2008)

Page 4: Big data: alchimie ou science ?

MÉTHODE SCIENTIFIQUE?Anderson: inductionObservationHypothèseTest

Tsan

g Ki

n-W

ah

Page 5: Big data: alchimie ou science ?

MÉTHODE SCIENTIFIQUE?Anderson: inductionObservationHypothèseTest

Popper? falsificationData science: améliorer l’induction

Cross-validationRégularisation

Tsan

g Ki

n-W

ah

Page 6: Big data: alchimie ou science ?

MÉTHODE SCIENTIFIQUE?Anderson: inductionObservationHypothèseTest

Popper? falsificationData science: améliorer l’induction

Cross-validationRégularisation

Hendry (approche LSE) formulationsélectionévaluation“computation”

Tsan

g Ki

n-W

ah

Page 7: Big data: alchimie ou science ?

ANALYTICS

DECRIRE ET CLASSER PAR MESURES ET VISUALISATION

PREVOIR PAR ANALOGIE

PRESCRIRE PAR CRITERES DE DECISION

Dirk Skreber

OUTILS PROBABILITES STATISTIQUES CODING ALGORITHMIQUE OPTIMISATION … Jules de Balincourt

Page 8: Big data: alchimie ou science ?

Big Data, are we making a big mistake ?Tim Harford

Financial Times April 2014

Page 9: Big data: alchimie ou science ?

Erik Kessels

Page 10: Big data: alchimie ou science ?

Big Data, are we making a big mistake ?Tim Harford

Financial Times April 2014

• False positive

Page 11: Big data: alchimie ou science ?

Big Data, are we making a big mistake ?Tim Harford

Financial Times April 2014

• False positive•N = all ?

Page 12: Big data: alchimie ou science ?

Detection influenza epidemics using search engine query dataNature, 2009

Page 13: Big data: alchimie ou science ?

Detection influenza epidemics using search engine query dataNature, 2009

Page 14: Big data: alchimie ou science ?

QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX

non pas N mais NK x Tvoire NN! x T

Andreas Gursky

Page 15: Big data: alchimie ou science ?

QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX

non pas N mais NK x Tvoire NN! x T

DONNÉES NON EXPERIMENTALESLE MODÈLE DEFINIT L’ERREUR

Andreas Gursky

Page 16: Big data: alchimie ou science ?

QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX

non pas N mais NK x Tvoire NN! x T

DONNÉES NON EXPERIMENTALESLE MODÈLE DEFINIT L’ERREUR

NON-STATIONNAIRES/ÉVOLUTIONAndreas Gursky

Page 17: Big data: alchimie ou science ?

QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX

non pas N mais NK x Tvoire NN! x T

DONNÉES NON EXPERIMENTALESLE MODÈLE DEFINIT L’ERREUR

NON-STATIONNAIRES/ÉVOLUTIONORIGINE: ACTIVITÉ HUMAINEAndreas Gursky

Page 18: Big data: alchimie ou science ?

EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST

- HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE

1/ passé et présent observable2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions

Andreas Gursky

Julien Prévieux

Page 19: Big data: alchimie ou science ?

EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST

- HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE

1/ passé et présent observable2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions

- FEEDBACK

Andreas Gursky

ANTICIPATIONS AVENIR &

ACTIONS DES AUTRES

ACTIONS

LE PRESENT OBSERVE

Julien Prévieux

Page 20: Big data: alchimie ou science ?

EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST

- HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE

1/ passé et présent observable2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions

- FEEDBACK- SEULES LES ACTIONS SONT OBSERVABLESA “l’équilibre” les croyances et actions sont alignéesAnalyste observe et comprend les “lois de comportement”

- MALHEUREUSEMENT L’équilibre n’existe pas réellement et fluctueLes actions passées ne sont pas suffisantes pour prévoir le comportement

Andreas Gursky

Julien Prévieux

Page 21: Big data: alchimie ou science ?

MACROECONOMISTES : EXPERIENCE ET REPONSESEXPERIENCE “BIG DATA” HISTORIQUE

KEYNES puis Hicks

Après WW2: US Cowles Commission (L. Klein)- données deviennent disponibles- mettre l’économie en équations- bonnes prévisions à court terme

Tsan

g Ki

n-W

ah

Olafur Eliasson

Page 22: Big data: alchimie ou science ?

MACROECONOMISTES : EXPERIENCE ET REPONSESEXPERIENCE “BIG DATA” HISTORIQUE

KEYNES puis Hicks

Après WW2: US Cowles Commission (L. Klein)- données deviennent disponibles- mettre l’économie en équations- bonnes prévisions à court terme

1950s Courbe de Phillips- rôle pour le gouvernement ?

Tsan

g Ki

n-W

ah

Olafur Eliasson

Page 23: Big data: alchimie ou science ?

MACROECONOMISTES : EXPERIENCE ET REPONSESEXPERIENCE “BIG DATA” HISTORIQUE

KEYNES puis Hicks

Après WW2: US Cowles Commission (L. Klein)- données deviennent disponibles- mettre l’économie en équations- bonnes prévisions à court terme

1950s Courbe de Phillips- rôle pour le gouvernement ?

1970s modèles de Klein et Phillips s'écroulent- stagflation

Tsan

g Ki

n-W

ah

Olafur Eliasson

Page 24: Big data: alchimie ou science ?

EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSE

exemple: modèle Cobwebformation des anticipations ? dynamique ? loi perçue vs loi effective

Tsan

g Ki

n-W

ah

Olafur Eliasson

MACROECONOMISTES : EXPERIENCE ET REPONSES

Page 25: Big data: alchimie ou science ?

EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSE

exemple: modèle Cobwebformation des anticipations ? dynamique ? loi perçue vs loi effective

Muth (1960) puis Lucas: Anticipations rationnelles- lien entre croyances individuelles et comportement agrégé

- évite les hypothèses arbitraires (erreurs systématiques)

- Une manière de comprendre le rôle des interventions: la critique de Lucas (1976)

Tsan

g Ki

n-W

ah

Olafur Eliasson

MACROECONOMISTES : EXPERIENCE ET REPONSES

Page 26: Big data: alchimie ou science ?

EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSE

exemple: modèle Cobwebformation des anticipations ? dynamique ? loi perçue vs loi effective

Muth (1960) puis Lucas: Anticipations rationnelles- lien entre croyances individuelles et comportement agrégé

- évite les hypothèses arbitraires (erreurs systématiques)

- Une manière de comprendre le rôle des interventions: la critique de Lucas (1976)

Concept limité mais généralisable

Tsan

g Ki

n-W

ah

Olafur Eliasson

MACROECONOMISTES : EXPERIENCE ET REPONSES

Page 27: Big data: alchimie ou science ?

EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUES- Eviter les boîtes noires

préférer les petits modèles interprétables

(structurels?)équilibre partiel vs général

Tsan

g Ki

n-W

ah

Olafur Eliasson

MACROECONOMISTES : EXPERIENCE ET REPONSES

Page 28: Big data: alchimie ou science ?

EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUES- Eviter les boîtes noires

préférer les petits modèles interprétables

(structurels?)équilibre partiel vs général

- prévisionsstabilitérobustesse

Tsan

g Ki

n-W

ah

Olafur Eliasson

MACROECONOMISTES : EXPERIENCE ET REPONSES

Page 29: Big data: alchimie ou science ?

EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUESDIFFICULTES STATISTIQUES- coordination des anticipations

prévoir les prévisions d'autruihétérogénéité

Tsan

g Ki

n-W

ah

Olafur Eliasson

MACROECONOMISTES : EXPERIENCE ET REPONSES

Page 30: Big data: alchimie ou science ?

EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUESDIFFICULTES STATISTIQUES- coordination des anticipations

prévoir les prévisions d'autruihétérogénéité

- inférence impossible ?simulations, validation reposent sur

des hypothèseslois fractales

ex: apprentissageou si N −>∞

Tsan

g Ki

n-W

ah

Olafur Eliasson

MACROECONOMISTES : EXPERIENCE ET REPONSES

Page 31: Big data: alchimie ou science ?

How can the current disquiet of our time be properly grasped, made comprehensible, examined, and articulated?

Over the course of the last two centuries the radical changes […] have made fascinating subject matter for artists

The principal question the exhibition will pose is this: How can artists, thinkers […] make sense of the current upheaval?

Okwui Enwezor, Curator of “All the World’s Futures”

2015 Venice Biennale

Page 32: Big data: alchimie ou science ?

PREVOIR EN PRESENCE DE DISRUPTIONDES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...

COMPRENDREcomprendre les croyances (esprit)

besoin d'une vue exhaustive des futurs possibleséviter l'auto-censure

Muy

brid

ge

Page 33: Big data: alchimie ou science ?

PREVOIR EN PRESENCE DE DISRUPTIONDES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...

COMPRENDREcomprendre les croyances (esprit)

besoin d'une vue exhaustive des futurs possibleséviter l'auto-censure

COMPARERprendre en compte les croyances des autresquelle est la mesure pour décider de la similarité et de la proximité

?pour le classement ?

Muy

brid

ge

Page 34: Big data: alchimie ou science ?

PREVOIR EN PRESENCE DE DISRUPTIONDES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...

COMPRENDREcomprendre les croyances (esprit)

besoin d'une vue exhaustive des futurs possibleséviter l'auto-censure

COMPARERprendre en compte les croyances des autresquelle est la mesure pour décider de la similarité et de la proximité

?pour le classement ?

EVALUERquel est le code (angage) pour enregistrer et décrire ? qu'est ce qu'une description précise, exacte ?comment évaluer les prévisions ?

Muy

brid

ge

Page 35: Big data: alchimie ou science ?

ACHAB VS ULYSSE

N.C

Wye

th

Page 36: Big data: alchimie ou science ?

MERCI