23
1 FBR. ISG. 2020 Advanced data warehouse Mastère Professionnel Data science for business FBR. ISG. 2020 Fahmi Ben Rejab GÉNÉRALITÉS Année universitaire 2020/2021

GÉNÉRALITÉSfahmi-benrejab.e-monsite.com/medias/files/01-generalites... · 2020. 10. 19. · FBR. ISG. 2020 1 Advanced data warehouse Mastère Professionnel Data science for business

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • 1FBR. ISG. 2020

    Advanced data warehouseMastère Professionnel Data science for business

    FBR. ISG. 2020

    Fahmi Ben Rejab

    GÉNÉRALITÉS

    Année universitaire 2020/2021

  • 2FBR. ISG. 2020

    SOURCE Gestion de projet InformatiqueMastère Pro. DSB

    http://fahmi-benrejab.e-monsite.com/

  • Le cours Entrepôt de données avancés est destiné aux futurs data scientist ou administrateurs des bases

    de données , ou tout autre acteur mené à structurer

    et/ouanalyser , jouer avec les données volumineuses

    3FBR. ISG. 2020

    OBJECTIF Gestion de projet InformatiqueMastère Pro. DSB

  • ©2012 Jaspersoft Corporation. Proprietary and Confidential 4

  • Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première position de son top 25 des meilleurs métiers du monde.

    Selon l’étude menée par Glassdoor, le salaire annuel moyen d’un Data Scientist s’élève à 116 840 dollars.

    De 45K€ pour un profil junior, jusqu’à 120K €/an,

    Le Chief Data Scientist peut gagner jusqu’à 180K €/an.

    Les opportunités d’embauche sont nombreuses et largement supérieures à la quantité de profils qualifiés. Fin, janvier Glassdoor dénombrait ainsi 1736 offres d’emploi.

    5

    « PORTRAIT » D’UN DATA SCIENTIST

    FBR. ISG. 2020

    Gestion de projet InformatiqueMastère Pro. DSB

  • 6

    « PORTRAIT » D’UN DATA SCIENTIST

    FBR. ISG. 2020

    Gestion de projet InformatiqueMastère Pro. DSB

  • 7FBR. ISG. 2020

    il s’agit également d’un poste à haute responsabilité, qui nécessite des prédispositions naturelles et une éducation de haut niveau.

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 8

    « PORTRAIT » D’UN DATA SCIENTIST

    FBR. ISG. 2020

    Gestion de projet InformatiqueMastère Pro. DSB

  • 9FBR. ISG. 2020

    Multidisciplinaire

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 10FBR. ISG. 2020

    Une formation d’analyste

    88% des Data Scientists sont diplômés au minimum d’un master

    46% d’entre eux sont titulaires d’un doctorat

    32% sont issus d’une formation dans le domaine des mathématiques et des statistiques

    30% ont étudié les sciences informatiques

    16% proviennent d’écoles d’ingénieurs.

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 11FBR. ISG. 2020

    Le Data Scientist doit avoir des connaissances en statistiques

    Avoir au minimum des notions de calculs statistiques.

    Ces connaissances lui permettront de déterminer la bonne technique d’approche et d’analyse pour chaque donnée.

    Capacité à réaliser des analyses prédictives et statistiques à partir des différentes bases de données,

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 12FBR. ISG. 2020

    Le Data Scientist doit maîtriser des outils analytiques

    Une connaissance approfondie d’au moins un outil analytique tel que SAS, R,

    est en général exigée.

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 13FBR. ISG. 2020

    Le Data Scientist doit maîtriser Les langages de programmation

    Les postes de Data Scientist requièrent la maîtrise d’au moins un langage de programmation.

    Le plus couramment employé est Python, mais il peut être remplacé par Java, Perl ou C/C++.

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 14FBR. ISG. 2020

    Savoir des notions de Machine Learning

    Connaitre quelques méthodes de Machine Learning peut être un réel atout pour la création d’un produit dirigée par les données.

    Les différentes techniques peuvent être directement implémentées à l’aide des librairies R ou Python, il n’est pas indispensable de savoir comment fonctionnent leurs algorithmes.

    L’important est de comprendre leur fonctionnement dans les grandes lignes et de savoir quelle méthode est la plus pertinente selon la situation.

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 15FBR. ISG. 2020

    La programmation en SQL

    Hadoop et les bases de données NoSQL se sont largement imposés dans le domaine du BigData.

    La plupart des recruteurs exigent des candidats la maîtrise de la programmation en SQL pour pouvoir formuler et exécuter des requêtes.

    Le SQL tend à redevenir le langage prédominant dans le Big Data

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 16FBR. ISG. 2020

    La gestion de données non structurées

    Savoir gérer des données non structurées. Ces données sont le principal challenge du Big Data.

    Savoir traiter les données comportant des imperfections, telles que des valeurs manquantes ou des chaînes de format incohérentes.

    Cette compétence est particulièrement importante au sein des entreprises n’étant pas habituées à l’analyse de données.

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 17FBR. ISG. 2020

    Des compétences en ingénierie logicielle

    Permettront notamment de prendre en charge le développement d’un produit dirigé par les données

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 18FBR. ISG. 2020

    La curiosité intellectuelle

    La curiosité intellectuelle est indispensable

    pour détecter les données les plus intéressantes et exploitables au sein d’un gigantesque volume de data.

    Pour mener à bien le travail de Data Scientist, il est nécessaire d’être créatif et de poser ses propres questions plutôt que de simplement répondre à celles qui se posent.

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 19FBR. ISG. 2020

    Le Data Scientist doit avoir le sens de la communication

    Communiquer ses découvertes techniques aux autres intervenants,

    Son rôle est d’aider les décideurs à prendre les bonnes décisions, en leur fournissant les informations nécessaires.

    Comprendre les problèmes des autres équipes

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 20FBR. ISG. 2020

  • 21FBR. ISG. 2020

    Etude des données en possession de l’entreprise qui permettront de définir • les données qui seront extraites • La manière de traiter les donnéesen accord avec les exigences de la direction

    Récupération et analyse des données pertinentes liées au processus de production de l’entreprise, à la vente ou encore liées aux données client…

    Construction d’algorithmes permettant d’améliorer les résultats de recherches et de ciblage,

    Élaboration de modèles prédictifs afin d’anticiper l’évolution des données et tendances relatives à l’activité de l’entreprise,

    Modélisation des résultats d’analyse des données pour les rendre lisibles et exploitablespar les managers,

    Principales missions du data scientist

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • 22FBR. ISG. 2020

    Recommandations business auprès de la direction générale afin d’améliorer la prise de décision.

    Ce travail d’interprétation des données pourra également se faire au travers de la création d’un tableau de bord spécifique et/ou logiciel sur mesure analysant les données traitées. La

    création de métriques d’aide à la décision pourra avoir une influence conséquente sur la stratégie de l’entreprise.

    Principales missions du data scientist

    « PORTRAIT » D’UN DATA SCIENTIST Gestion de projet InformatiqueMastère Pro. DSB

  • Thank You