IBM Cloud Forum
20 novembre 2019New Cap Event Center, Paris
Cloud Forum / @ 2019 IBM Corporation
Exploiter toute la valeur des données -fonder une gouvernance des données maîtrisée et partagée
11H30 – 12H15
2 11/20/2019
Laurène Combette
Avant-vente Gouvernance de la donnée
IBM
3 11/20/2019
Quelques définitions de la Gouvernance de la donnée
• « Data Governance is the exercise of authority and
control (planning, monitoring, and enforcement) over the
management of data assets. » (DAMA International)
• « Data Governance is a collection of practices
and processes which help to ensure the formal
management of data assets within an
organization » (Data university)
• Littéralement: la manière dont la donnée est
gouvernée.
→ La donnée, un actif à part entière de
l’entreprise, elle nécessite une gouvernance
4 11/20/2019
Une démarche continue, globale et transverse à l’entreprise
Organisation
• Rôles & responsabilités: Métiers & IT
• Data management office
• Métiers
• DSI
• Conformité: DPO
• → RACI
• Conduite du changement, Acculturation à la data (ex: charte data)
• → Tous les collaborateurs sont impliqués dans la démarche
Politiques & Processus
• Réglementations• GDPR
• BCBS 239
• Qualité des données
• Protection des données
• Cycle de vie des données
• …
Outils
• Workflows
• Glossaire métier• culture de l’entreprise
• vocabulaire commun
• Catalogue des données• Metadata
• Registre de traitement GDPR
• Gestion de la qualité des données
• MDM
• …
Infuse
IBM Cloud Pak for Data – Plateforme collaborative
App DeveloperData ScientistData Engineer
Enterprise Catalog
✓ Integrate & Refine
✓ Deploy models as scalable web services
Data Steward
Web service
Applications Business processes
Business Analyst
AnalyzeOrganizeCollect & Connect
Watson Services
Make your data ready for an AI and hybrid multi-cloud world
Make data simple andaccessible
Create a business-ready analytics foundation
Build and scale AI with trust and explainability
Operationalize AIthroughout the business
✓ Eliminate data silos
✓ Connect all data
✓ Utilize fit for workloaddata repositories
Virtualize
✓ Automate and governthe data & AI lifecycle
✓ Analyze using open sourceand visual tooling
✓ Explore and visualize
✓ Build analytical models
✓ Operationalize AI
✓ Measure and track AI outcomes✓ Index and enrich assets
Multicloud Services• Logging
• Monitoring
• Metering
• Persistent Storage
• Identity Access Mgmt.
• Docker Registry / Helm
• Kubernetes
• Security
© 2019 IBM Corporation
5
6 11/20/2019
Get Business Ready Data
Data
Architects
ETL
Developers
Data Engineering Data Governance Teams Data Consumers (LOB)
DG Technical Users DG Business Users Data Scientists Business Users
Quality
Developers
Repository
Managers
Quality
Developers
Data
Stewards
LOB
RiskCDO
LOB
Product
Data
Scientists
Data
Analysts
Business
Analysts
Data Architects and Engineers
IBM Cloud Pak for Data
Data Ingestion Data Transformation Data QualityData Governance
Technical UsersData Governance
Business UsersActivate and Exploit The Data
• Search and find relevant data
• Data Preparation
• Consume and analyze the data
• Comment, rate and share
• Business lineage*
• Reference data management*
• Data ownership
• Data stewardship
• Data governance workflow
• Profile data
• Understand data quality
• Classify data
• Build validation rules
• Apply validation rules
• Monitor data quality
• Remediate data quality
• Extract data
• Collect metadata
• Move data
• Ingest data
• Build integration jobs
• Run integration jobs
• Monitor
• Discover metadata assets
• Classify data assets
• Build data glossary
• Create data lineage
• Manage metadata repository
7 11/20/2019
Démonstration - Un exemple de collaboration autour d’un sujet de gouvernance des données
2Le Data Engineer catalogue l’ensemble des données et en particulier la date de naissance dans le SI de l’entreprise, et consolide ces données dans un catalogue partagé.1
Le CDO a défini dans le glossaire métier en collaboration avec les métiers et l’IT une nouvelle règle de qualité: Tous les clients doivent avoir une date de naissance renseignée et valide.
3
Le Data Quality Analyst implémente la règle, active les indicateurs de suivi avec alertes et met en place un processus de remédiation pour atteindre l’objectif fixé par le CDO.
4Le Business Analyst recherche dans le
catalogue les données pertinentes pour construire son reporting. Ce
reporting est basé sur la segmentation démographique des clients et en
particulier leur âge.
5Les métiers reçoivent une notification de mise à disposition du reporting basé sur la segmentation démographique des clients.Ils peuvent visualiser graphiquement la manière dont a été construit ce reporting et consulter sa documentation dans le catalogue.
Métiers
CDO
AnalysteBI
AnalysteQualité
IngénieurDonnée
8 11/20/2019
10 11/20/2019
Le catalogue des données d’entreprise
• Market place de la donnée, moteur de recherche de la donnée
• ContenuMetadata: informations sur les données, leur contexte.
• Pour qui?• Tous les collaborateurs: Métiers (data scientists, business analysts, …), IT, fonctions supports, etc.
• Permet de répondre aux questions suivantes:• Où est localisée la donnée• Que signifie-t’elle?• Qui est le responsable?• Qui la produit?• Qui la consomme?• Qui est autorisé à l’utiliser?• Quelle durée de rétention?• Donnée personnelle? Sensible?• Quel niveau de protection?• Quel niveau de qualité?• …