44
Intelligence Artificielle, Macroéconomie & Finance Quels outils en période d’incertitude aiguë ? Sylvain BARTHELEMY Directeur Général, TAC ECONOMICS Webinar – Mai 2020

Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Intelligence Artificielle, Macroéconomie & FinanceQuels outils en période d’incertitude aiguë ?

Sylvain BARTHELEMYDirecteur Général, TAC ECONOMICS

Webinar – Mai 2020

Page 2: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

2

TAC ECONOMICS en Bref

▪ Une équipe d’experts en économie et en finance, accompagnant les entreprises dans leurs stratégies à l’international.

▪ Propose des services d’analyse économique et développe des outils d’aide à la décision à partir de méthodes quantitatives traditionnelles et avancées (économétrie, machine learning, intelligence artificielle, outils logiciels…).

▪ Une société rennaise qui existe depuis 25 ans.

▪ Clientèle: banques, grandes entreprises, PME et gestionnaires de fonds.

Page 3: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

IA, Big Data & Data-Science

3

Page 4: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

4

Le mythe de l’intelligence artificielle

Page 5: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

5

Une brève histoire du machine learning et de l’IA

1950

1980

1970

2000

Hebb (1949)Réseaux de neurones et

apprentissage

Rosenblatt (1957)Modèle du perceptron, réseau de

neurones artificiel (RNA)

Minsky & Papert (1969)Remise en cause des RNA

Hopfield (1982)Réseaux récurrents appliqués à la

physique

Werbos, Rumelhart, LeCun (1986)Perceptron multicouches et

rétropropagation

Breiman & Cutler (2001)Random Forest

Hinton & Salakhutdinov (2006)Apprentissage profond/

deep learning

Sutton (1988)Reinforcement Learning

Boser, Guyon et Vapnik (1992)Machines à Vecteurs de Support

Alpha Go (2016)Programme Google de jeu de Go

Holland (1960)Algorithmes Génétiques

Concept de Big Data(Gartner, 2001)

Page 6: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

6

Les grands concepts du « big data » et de l’IA

Réseaux de Neurones

Deep Learning

Big Data

Machine Learning

Smart Data

R

Python

Cassandra

MongoDB

MySQL

AlgorithmesGénétiques

Forêts Aléatoires

Intelligence Artificielle

CloudHadoop

SVM

Arbres Récursif

Spark

MapReduce

NoSQL

Tensor Processing Unit/Google

GPU/NVidia

Xeon Phi/Intel

TensorFlow

Theano

Torch

AWS

Open Source

API

Page 7: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

7

US GDP growth Y/Y, in %

Source: Datastream, TAC ECONOMICS

Retournement du cycle économique ?

?

Page 8: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

8

Indice Shiller PEAu 26 mai 2020

Source: Shiller

Bulle spéculative sur les marchés financiers

Page 9: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

9

CHANGEArgentine -20%

Turquie -15%Brésil -10% Russie -8%

En 2017:

Egypte -44% Ouzbékistan -43%

Congo-Kinshasa -31%

Les crises économiques et financièresdans le monde depuis 2017…

ACTIVITEMoyenne croissance du

PIB des marchés émergents proche de 4.5

Crise Covid-19

Venezuela (-13.2%), Congo-Brazzaville (-4.6%),

Kuwait (-2.5%)… et la Chine fait presque 6%, contre 14% en 2007 !

INFLATIONEn moyenne

proche de 3%

Argentine >30%, Nigéria 17%, Iran 10%,

Turquie 15%, Ukraine 14%Congo-Kinshasa 42% Libye

28%, Egypte 24%Venezuela >1000%

Page 10: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

10

Le syndrome de l’icerberg

Identifications d’Opportunités

Rapports

Signaux de RisquesPrévisions

Analyses Sectorielles

Analyses de Conjoncture

Cout du Capital

MACHINE LEARNING, INTELLIGENCE ARTIFICIELLE & DATAVIZ

ECONOMETRIE & STATISTIQUES

DONNEES TRADITIONNELLES

DONNEES ALTERNATIVES

SYSTEMES INFORMATIQUES,CLOUD & DATA LAKES

DATA SCIENCE & PROGRAMMATION

Page 11: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Mieux anticiper les crises économiques & financières sur les marchés émergents

11

Page 12: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Prévoir les crises économiques et financières (EWS)

▪ De nombreuses études empiriques sur le risque pays et les indicateurs avancés de crises économiques et financières: Krugman (1979), Obstfeld (1994), Cantor and Packer (1996), Eichengreen et al. (1996), Frankel and Rose (1996), Goldstein (1996), Goldstein and Turner (1996), Kaminsky and Reinhart(1999), Komulainen and Lukkarila (2003) , …

▪ Mais malgré les classifications existantes, un très grand nombre de crises économiques et financières ont laissé les observateurs perplexes.

▪ Le manque de relations causales homogènes et des interactions complexes rendent l’identification ex-ante des facteurs de risque extrêmement difficile.

12

Page 13: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Les méthodes traditionnelles

13

Page 14: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

14

Des pays, des indicateurs, des années…des papillons

Plusieurs milliers de « papillons » ont été analysés

sur plus de 100 pays, depuis les années 70

Page 15: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

bra98, per98, tur94, tur01, mex94, idn97,…

rus98, tha97, kor97, ven89, phl84, arg99, pol89, nga87,

egy91…

stable profiles

15

Similarités macroéconomiques et réseaux de neurones

Page 16: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Influence des indicateurs différente selon le groupe

16

Page 17: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

17

Performances des outils de EWS/IA développés

Avec moins d’une vingtaine d’indicateurs

macroéconomiques « bien choisis » et un séquence de

modèles d’IA relativement sophistiquée,

nous arrivons ainsi prévoir près de 90% des crises

économiques et financières, jusqu’à 2 ans à l’avance

Page 18: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

181818

Méthodologie RiskMonitor

Economic Risk

CrisisSignals

Political Risk

Economic Risk Ratings

Political RiskRatings

Group Premium

Country Risk Premium (RRECC), calibrated on JP Morgan’s EMBI

Country Groups

Statistical Calibration on

combinations & threshold effects

Data Mining 5 non-parametric

models

Statistical Normalization

Page 19: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

19

ClientGate

Page 20: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Prévoir les risques de rupturessur les marchés financiers

20

Page 21: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

▪ Réseaux de neurones en finance d’abord comme substitut aux systèmes experts, dans les années 90.

▪ Prévision des cours boursiers dès Kimoto et Yoda (1993), sur le Tokyo Stock Index avec… 5 variables d’entrée ! Mais aussi sur l’or ou le S&P500 (Grudnitskiet Obsburn, 1993, Quang Do 1995).

▪ Mais aussi des prévisions de taux de change, dès le milieu des années 90 (Rawani 1993, Azoff 1994, AvouyiDovi 1995).

▪ Depuis, de très nombreux travaux sur l’utilisation de méthodes de machine learning en finance.

21

Petit retour sur les travaux historique

Page 22: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

22

Les plus gros « hedge funds » du monde

Actifs sous Gestionen mds de $ en 2017

Quantitatif ?

Bridgewater Associates 122.2 (Non)

AQR Capital Management 69.6 Oui

JPMorgan AM 45.0 (Oui)

Renaissance Technologies 42.0 Oui

Two Sigma 38.9 Oui

De Shaw & Co 34.7 Oui

Man Group 33.9 Oui

Millennium Management 33.9 Oui

Och-Ziff Capital Management 33.5 (Oui)

Winton Group 32.0 (Oui)

Page 23: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

23

Computer Vision

Source: dominodatalab

Page 24: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

24

Réseaux de neurones « traditionnels »

Page 25: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Du perceptron au « deep learning »

25

Le Neural Network Zoo du Asimov Institute

Page 26: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

26

…parfois compliqué: distinguer les chiens des muffins

Page 27: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

27

La convolution ou la « révolution du petit chat »…

Page 28: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

▪ Outil de détection des tendances et des ruptures sur plus de 20 marchés internationaux (actions, obligations, spreads corporates).

▪ Signaux sur les tendances, et calibrage automatique des poids des différents actifs dans un portefeuille.

▪ Possibilité d’ajuster les fonctions objectifs sur la base de cibles « combinées ».

▪ Outil mixant à la fois des outils de machine learning « simples », à des outils plus puissants de deep learning appliqués à des échantillons de plus de 200 données macroéconomiques et financières sur des périodes de 40 jours (identification de « patterns »).

▪ Difficulté majeure: bien gérer les échantillons, et l’instabilité des performances historiques.

28

Quantitative Market Alert (QMA)

Page 29: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

29

« Patterns » du QMA et convolution

Page 30: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

30

« Patterns » du QMA et convolution

Page 31: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

31

Performances récente du QMA : les Fair Values en Jan. 2020

Page 32: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

32

Performances et signaux du QMA sur le S&P500

Page 33: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

33

Financial Index « Covid-19 »

https://www.taceconomics.com/covid19/

Page 34: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Text mining, indicateurs de sentiment et identification de thématiques

34

Page 35: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Text mining, topics, sentiments et risque réputationnel

35

Leading Economic

Activity Indices

ESG Corporate

Reputational Risk

Articles on CorporatesAudi, Nissan, Renault, Toyota,

Volkswagen

Articles on CountriesBrazil, Chile,

France, India

TMI

Toolbox

Page 36: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

-100

-80

-60

-40

-20

0

20

40

60

80

100

January 2015 April 2015 July 2015 October 2015

Volkswagen

Risque réputationnel: Volkswagen & the Diesel Gate

36

Source: TAC ECONOMICS

Page 37: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Indicateurs de sentiment et indices boursiers

37Source: TAC ECONOMICS

-10

0

10

20

30

40

50

60

70

0

1000

2000

3000

4000

5000

6000

7000

April 2000 April 2003 April 2006 April 2009 April 2012 April 2015 April 2018

Sentiment for France vs CAC40

CAC40 (lhs)Sentiment for France (rhs, m.a. 90 days)

Page 38: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

38

Sentiment Analysis, Topics & Finance

Page 39: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

39

Sentiment Index « Covid-19 »

https://www.taceconomics.com/covid19/

Page 40: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

Conclusion

40

Page 41: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

41

L’écosystème « big data » en 2019

Page 42: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

42

Conclusion

▪ Plus de données, de meilleurs modèles, plus de puissance de calcul, plus de puissance de stockage. L’économétrie a évolué depuis 30 ans, mais ces nouvelles méthodes, outils et données changent nos métiers bien plus profondément encore.

▪ Presque tous les secteurs et métiers seront touchés par ces évolutions, et pas seulement les professions travaillant dans les données ou les statistiques… même le métier du data-scientist sera en grande partie automatisé (AutoML).

▪ Nos équipes ont développé une expertise avancée sur ces différents domaines, nous permettant d’utiliser plus efficacement les nouvelles données et algorithmes disponibles, afin de répondre à des questions économiques et financières opérationnelles.

Page 43: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

43

STATISTIQUES

Econométrie, VaR, GVaR, Markov

Switching, Sim. Monte Carlo,

scores,…

MACHINE LEARNING, IA

CART, SVM, RF, NN, AG, Deep Learning, LSTM, Autoencoders, CNN…

DATA SCIENCE

R, Python,C++, Matlab,…

large datasets, text mining,

data viz

SYSTEMES INFORMATIQUES

Oracle, MySQL, PostgreSQL, Spark,

Apache/Nginx, Docker, Kubernetes,

cloud AWS/Azure/OVH,

APIs

DONNEES

Times series, données textuelles, big data,

scrapping, « alternative datasets »…

ECONOMIE, FINANCE

Analyses des risques, Early

Warning, analyses pays, régions,

secteurs

Approche360

TAC ECONOMICS, une offre de service à 360°

Page 44: Intelligence Artificielle, Macroéconomie & Finance ECONOMICS … · Big Data Machine Learning Smart Data R Python Cassandra MongoDB MySQL Algorithmes Génétiques Forêts Aléatoires

44

Sylvain BARTHELEMY

[email protected]

www.taceconomics.com

Merci de votre attention