Upload
synaltic-group
View
120
Download
2
Embed Size (px)
Citation preview
Webinaire 27 octobre 2016Préparez et visualisez vos
Open Data avec Trifacta et Tableau
Victor Coustenoble
Technical regional manager EMEA
@vizanalytics
Malick KonateData Preparation Expert
@MKonate_
Passionnés de data et d’open source
• Société de conseil et de services spécialisée dans la mise en œuvre de projets de Data Management
• Créée en 2004, Synaltic est la fusion des sociétés Synotis et Altic
• Filiale en Suisse , à Lausanne
Fidélité
Expertise
2004
35spécialistes
180projets
Engagement
depuis 2012
Team dédiée Tableau
• Une équipe de data-analystes, spécialistes Tableau
• Jonathan Trajkovic, Zen Master Tableau 2015/2016
Observatoire des associations françaises Outil de simulation basé sur des data OpenFoodFact
Open Data
La Data Preparation, pourquoi ?• Datas de toutes formes et tailles dans les SI,
• Plus d’autonomie pour les data analystes et les data scientists.
53% des entreprises déclarent avoir déjà subi despertes en raison de la mauvaise qualité des données
Si une entreprise a des données de haute qualité, lasatisfaction des clients augmente de 57%.
TDWI - The Data Warehouse Institute
Trifacta
➔ Siège social à San Francisco, bureaux à Boston, Londres, Berlin et Paris
➔ Créé en 2012
➔ >100+ Employés
Focus
➔ 100% dédié au Data Wrangling et à la Préparation de Données
➔ Accélérer la création de valeur et l’utilisation métier du Big Data
➔ Préparation de données Visuelle, Interactive et en Self-Service
11
DATA WRANGLING
Qu’est-ce que le Data Wrangling (Préparation de Données) ?
12
QUESTION ANALYZE INSIGHT
DISCOVER STRUCTURE CLEANSE ENRICH VALIDATE PUBLISH
Le Data Wrangling est le processus de préparation et de traitement de la donnée brute depuis n’importe quel format, afin de la rendre exploitable par l’utilisateur final dans un
processus analytique.
Créer une passerelle entre les données brutes et l’analyse
Discovering Structuring Cleaning Enriching Validating Publishing
ANALYSES & DECISIONNEL
Business System Data Machine Generated Data Third Party Data
IT LOB
de l’effort d’un
projet orienté
« données » réside
dans la
préparation des
données*
80%
PLATEFORME DE TRAITEMENT DES DONNEES
* New York Times – Août 2014 - For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights
Allers-retours de demandes entre IT & Métiers
Comment je peux accéder aux données brutes?
Qu’est-ce que tu veux analyser?
Je ne peux pas te le dire tant que je n’ai pas vu les données, montres moi
les données en premier.
Je ne peux pas te donner accès aux données brutes, tu dois me dire ce que tu
veux.
LOB IT
Discovering Structuring Cleaning Enriching Validating Publishing
Business System Data Machine Generated Data Third Party Data
LOB IT
Donner aux analystes métiers un accès aux données brutes sous le contrôle de l’IT
ANALYSES, VISUALISATION, DECISIONNEL
PLATEFORME DE TRAITEMENT DES DONNEES
Les approches conventionnelles inhibentl’autonomie des utilisateurs
Code manuel Techniques de Workflow et Mapping (ETL)
Cas d’utilisation métiers de Trifacta
Connaissance et Vue 360 Client
Agrégation de Données des
Essais Cliniques
Prévisions des Ventes &
Stocks
Analyse et Agrégation
Risques
Analyse MédiasSociaux
DéveloppementProduit
19
PepsiCo | Des prévisions des ventes plus précise et plus rapidement
20
Opportunité: Améliorer la prévision des ventes
• Avec de très petites marges sur les ventes, le succès de PepsiCo repose sur des prévisions des ventes quasi-parfaites.
• Les analystes doivent constamment comparer les résultats des ventes par rapport aux prévisions de leurs plus grands distributeurs afin de diriger les stocks et les plans de production.
Challenge: Comment peut-on préparer les données plus efficacement et de manière plus précise?
• L’utilisation de Excel et de Access était lente, laborieuse et source d’erreurs. • Chaque analyste devait manuellement créer et mettre à jour 4 à 5 rapports par semaine
– avec un besoin de rationaliser le processus de préparation des données.
Solution:Trifacta apporte à PepsiCo la préparation de données à l’échelle de leur organisation
• L’équipe CPFR de PepsiCo utilise maintenant Trifacta comme une solution centralisée afin de préparer les données pour les prévisions dans Tableau Software.
• La durée du reporting a été réduite de 70% et le temps de création a été réduite jusqu’à 90%.
• PepsiCo est maintenant capable de répondre plus rapidement et sans perte de temps aux tendances du marché et des ventes.
Industry: Consumer Packaged Goods (CPG)
PepsiCo operates as a food and beverage company worldwide
➔ Open Food Facts répertorie les produitsalimentaires du monde entier.
➔ Contributeurs volontaires du mondeentier.
Collecte Traitement Stockage
VISUALISATION
v
IT
LOB
Discovering Structuring Cleaning Enriching Validating Publishing
Démonstration
Open Data
Activités
Media Sociaux
TweetsChat
24
Constat : Plus de 80% du temps est passé à consolider, nettoyer et transformer les données avant analyse.
Bénéfices de Trifacta + Tableau• Accélérer l’accès aux données pour dégager plus rapidement les opportunités
métiers,
• Diminuer les risques métiers liés aux mauvaises données,
• Donner le pouvoir aux personnes avec la connaissance métier des données,
• Libérer l’innovation et optimiser l‘efficacité opérationnelle,
• Accélérer le ROI de projets Big Data,
• Réduire la pression des coûts et des recrutements (problèmes des compétences Big Data dans l’entreprise).
Plus d’Efficacité, Plus d’Innovation
Conclusion
Trifacta Préparation de Données Self-ServiceEditions
26
➔ Basé sur Hadoop
➔ Initiatives Data Lake
➔ Volumes Illimités & Scalability
➔ Support Enterprise
➔ Souscription
➔ Desktop
➔ Petits volumes de données
➔ Support Communautaire
➔ Gratuit
www.trifacta.com/start-wrangling