Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
1FBR. ISG. 2020
Advanced data warehouseMastère Professionnel Data science for business
FBR. ISG. 2020
Fahmi Ben Rejab
GÉNÉRALITÉS
Année universitaire 2020/2021
2FBR. ISG. 2020
SOURCE Gestion de projet InformatiqueMastère Pro. DSB
http://fahmi-benrejab.e-monsite.com/
Le cours Entrepôt de données avancés est destiné aux futurs data scientist ou administrateurs des bases
de données , ou tout autre acteur mené à structurer
et/ouanalyser , jouer avec les données volumineuses
3FBR. ISG. 2020
OBJECTIF Gestion de projet InformatiqueMastère Pro. DSB
©2012 Jaspersoft Corporation. Proprietary and Confidential 4
Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première position de son top 25 des meilleurs métiers du monde.
Selon l’étude menée par Glassdoor, le salaire annuel moyen d’un Data Scientist s’élève à 116 840 dollars.
De 45K€ pour un profil junior, jusqu’à 120K €/an,
Le Chief Data Scientist peut gagner jusqu’à 180K €/an.
Les opportunités d’embauche sont nombreuses et largement supérieures à la quantité de profils qualifiés. Fin, janvier Glassdoor dénombrait ainsi 1736 offres d’emploi.
5
« PORTRAIT » D’UN DATA SCIENTIST
FBR. ISG. 2020
Gestion de projet InformatiqueMastère Pro. DSB
6
« PORTRAIT » D’UN DATA SCIENTIST
FBR. ISG. 2020
Gestion de projet InformatiqueMastère Pro. DSB
7FBR. ISG. 2020
il s’agit également d’un poste à haute responsabilité, qui nécessite des prédispositions naturelles et une éducation de haut niveau.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
8
« PORTRAIT » D’UN DATA SCIENTIST
FBR. ISG. 2020
Gestion de projet InformatiqueMastère Pro. DSB
9FBR. ISG. 2020
Multidisciplinaire
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
10FBR. ISG. 2020
Une formation d’analyste
88% des Data Scientists sont diplômés au minimum d’un master
46% d’entre eux sont titulaires d’un doctorat
32% sont issus d’une formation dans le domaine des mathématiques et des statistiques
30% ont étudié les sciences informatiques
16% proviennent d’écoles d’ingénieurs.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
11FBR. ISG. 2020
Le Data Scientist doit avoir des connaissances en statistiques
Avoir au minimum des notions de calculs statistiques.
Ces connaissances lui permettront de déterminer la bonne technique d’approche et d’analyse pour chaque donnée.
Capacité à réaliser des analyses prédictives et statistiques à partir des différentes bases de données,
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
12FBR. ISG. 2020
Le Data Scientist doit maîtriser des outils analytiques
Une connaissance approfondie d’au moins un outil analytique tel que SAS, R,
est en général exigée.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
13FBR. ISG. 2020
Le Data Scientist doit maîtriser Les langages de programmation
Les postes de Data Scientist requièrent la maîtrise d’au moins un langage de programmation.
Le plus couramment employé est Python, mais il peut être remplacé par Java, Perl ou C/C++.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
14FBR. ISG. 2020
Savoir des notions de Machine Learning
Connaitre quelques méthodes de Machine Learning peut être un réel atout pour la création d’un produit dirigée par les données.
Les différentes techniques peuvent être directement implémentées à l’aide des librairies R ou Python, il n’est pas indispensable de savoir comment fonctionnent leurs algorithmes.
L’important est de comprendre leur fonctionnement dans les grandes lignes et de savoir quelle méthode est la plus pertinente selon la situation.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
15FBR. ISG. 2020
La programmation en SQL
Hadoop et les bases de données NoSQL se sont largement imposés dans le domaine du BigData.
La plupart des recruteurs exigent des candidats la maîtrise de la programmation en SQL pour pouvoir formuler et exécuter des requêtes.
Le SQL tend à redevenir le langage prédominant dans le Big Data
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
16FBR. ISG. 2020
La gestion de données non structurées
Savoir gérer des données non structurées. Ces données sont le principal challenge du Big Data.
Savoir traiter les données comportant des imperfections, telles que des valeurs manquantes ou des chaînes de format incohérentes.
Cette compétence est particulièrement importante au sein des entreprises n’étant pas habituées à l’analyse de données.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
17FBR. ISG. 2020
Des compétences en ingénierie logicielle
Permettront notamment de prendre en charge le développement d’un produit dirigé par les données
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
18FBR. ISG. 2020
La curiosité intellectuelle
La curiosité intellectuelle est indispensable
pour détecter les données les plus intéressantes et exploitables au sein d’un gigantesque volume de data.
Pour mener à bien le travail de Data Scientist, il est nécessaire d’être créatif et de poser ses propres questions plutôt que de simplement répondre à celles qui se posent.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
19FBR. ISG. 2020
Le Data Scientist doit avoir le sens de la communication
Communiquer ses découvertes techniques aux autres intervenants,
Son rôle est d’aider les décideurs à prendre les bonnes décisions, en leur fournissant les informations nécessaires.
Comprendre les problèmes des autres équipes
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
20FBR. ISG. 2020
21FBR. ISG. 2020
Etude des données en possession de l’entreprise qui permettront de définir • les données qui seront extraites • La manière de traiter les donnéesen accord avec les exigences de la direction
Récupération et analyse des données pertinentes liées au processus de production de l’entreprise, à la vente ou encore liées aux données client…
Construction d’algorithmes permettant d’améliorer les résultats de recherches et de ciblage,
Élaboration de modèles prédictifs afin d’anticiper l’évolution des données et tendances relatives à l’activité de l’entreprise,
Modélisation des résultats d’analyse des données pour les rendre lisibles et exploitablespar les managers,
Principales missions du data scientist
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
22FBR. ISG. 2020
Recommandations business auprès de la direction générale afin d’améliorer la prise de décision.
Ce travail d’interprétation des données pourra également se faire au travers de la création d’un tableau de bord spécifique et/ou logiciel sur mesure analysant les données traitées. La
création de métriques d’aide à la décision pourra avoir une influence conséquente sur la stratégie de l’entreprise.
Principales missions du data scientist
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB
Thank You