28
BIG DATA PROFI Webcast

PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

BIG DATAPROFI Webcast

Page 2: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

VORSTELLUNG

BIG DATA

01.09.2014 PROFI Webcast: Big Data2

Stefan Held

Software Architekt

PROFI GS Bochum

Schwerpunkte:

• Business Intelligence & Analytics

• Big Data & Data Warehouse

• CRM

Page 3: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

WIE KOMMT MAN ZU BIG DATA?

BIG DATA

01.09.2014 PROFI Webcast: Big Data3

DB-Admin

DWH

CRM

„Ich

brauche da

mal…“

„Das geht

sowieso

nicht…“

Weitere

Datenquellen

Daten in

Zusammen-

hang bringen

Suche nach

Einfluss-

faktorenMehrere

Daten-Ziele

Entscheidungen

aus Daten

ableiten!

Page 4: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

EINE FRAGE – VIELE ANTWORTEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data4

Big Data = „3V“

Velocity Volume Variety

Gartner

Veracity Value

Page 5: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

EINE FRAGE – VIELE ANTWORTEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data5

Aber…

• Wie wo fängt „groß“ an? GB? TB? PB?

• Wie schnell ist „schnell“ ?

• Wie viele unterschiedliche Arten und Formate?

Es gibt keine eindeutige Definition

Page 6: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

EINE FRAGE – VIELE ANTWORTEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data6

Verknüpfung:

• Silogrenzen überwinden

• Gemeinsamkeiten finden

• Stammdaten abgleichen

Technologie:

• Skalierbarkeit

• Geschwindigkeit

• Analyse

Zusammenarbeit:

• IT + Fachabteilung

• Gemeinsames Verständnis

von Inhalten und Technologie

Page 7: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

EINE FRAGE – VIELE ANTWORTEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data7

„Big Data is more analytics on more data for more people“

“Big data is like teenage sex: everyone talks about it, nobody really knows how to do

it, everyone thinks everyone else is doing it, so everyone claims they are doing it.”

Und… (cum grano salis):

Page 8: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

WARUM?

BIG DATA

01.09.2014 PROFI Webcast: Big Data8

Bauchgefühl oder Zahlen?

• Entscheidungen werden nach Bauchgefühl getroffen?

Aber: Das Bauchgefühl ist subjektiv und schwer zu belegen!

Argumentationsproblem wenn‘s „schiefgeht“

• Entscheidungen werden nach Zahlenlage getroffen!

Aber: Sind die Zahlen vollständig? Zeigen sie die ganze

Wahrheit?

Sonst kann bestens belegter Unsinn herauskommen

Die Herausforderung besteht also darin, Bauchgefühl und Zahlen in

Übereinstimmung zu bringen

Page 9: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

WARUM?

BIG DATA

01.09.2014 PROFI Webcast: Big Data9

Veränderungen schlagen sich zuerst in den Daten nieder, bevor sie für den

Menschen offensichtlich werden.

• Schnellere Reaktion auf Veränderungen der Umgebung

• Früherkennung von Trends und Risiken

Dafür ist ein hinreichend großer, schneller und gut integrierter

Datenbestand erforderlich.

Dafür sind schnelle und umfassende Analysewerkzeuge erforderlich

Dafür ist ein gemeinsames Verständnis von „was suchen wir“ und „wie

suchen wir“ erforderlich.

Page 10: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

WARUM?

BIG DATA

01.09.2014 PROFI Webcast: Big Data10

Reduzierung von manuellem Aufwand

• Die Fragestellungen, auf die Big Data eine Antwort geben kann, existieren

bereits vorher.

• In vielen Fällen werden diese durch aufwändige manuelle

Nachforschungen und Datenabgleiche beantwortet.

• Um Zusammenhänge zu identifizieren, ist manuelle Verarbeitung

akzeptabel, aber für eine produktive Nutzung müssen diese

Zusammenhänge in Systeme hineingebracht werden.

Page 11: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

WORUM GEHT ES ALSO?

BIG DATA

01.09.2014 PROFI Webcast: Big Data11

• Am Ende geht es darum, Entscheidungen aus Daten abzuleiten und Daten

besser zu nutzen.

• Diese Daten müssen so vollständig, so gut integriert und so schnell

verfügbar sein, dass sie für den vorgesehenen Zweck genutzt werden

können!

• Wie BIG das dann ist und welche Technologie dafür notwendig ist, ergibt

sich aus der Aufgabe.

• Oft sind die „klassischen“ Datenbank- und DWH-Technologien dafür nicht

geeignet.

Page 12: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

TECHNOLOGIEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data12

Hadoop

• Oft als Synonym zu Big Data verstanden, ist aber nur eine mögliche

Basistechnologie, sehr weit verbreitet.

• Prinzip der verteilten Datenhaltung und –verarbeitung auf Commodity-HW

• Open Source Projekt (Apache), erhältlich in vielen sehr unterschiedlich

ausgeprägten freien und kommerziellen Produktvarianten und darauf

aufbauenden Gesamtlösungen.

• Besteht aus dem Dateisystem HDFS sowie diversen Tools für

Datenabfrage, Datenpflege und Administration

• Mehr auf Dateigröße als auf Dateianzahl ausgelegt

• Optimiert für Write Once – Read Many

• Basis für HBase als Datenbank

Page 13: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

TECHNOLOGIEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data13

NoSQL-Datenbanken

• Datenbanken ohne feste Schemadefinitionen, keine starren Tabellen,

keine relationale Darstellung

• Dokumentenorientierte Datenbanken, Key-Value-Stores, Graphen- oder

Objekt-DBs

• Verteilte Datenhaltung

• Sehr große Datenmengen mit vielen Schreib- und Lesezugriffen

• Abfrage wird direkt in der Anwendung programmiert, ohne

Zwischenschaltung einer Abfragesprache

Page 14: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

TECHNOLOGIEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data14

Echtzeit-Datenströme

• Verarbeitung von Daten zum Zeitpunkt der Entstehung oder zeitnah

danach

• Große Datenmengen in kurzer Zeit

• Keine bzw. nur kurzfristige Speicherung der Daten bzw. Speicherung einer

Auswahl

• Unmittelbare Reaktion auf gefundene Situationen

• Erkenntnisse nur aus gegenwärtigen Daten gewinnen

Page 15: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

TECHNOLOGIEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data15

In-Memory-Technik

• Verlagerung der Datenhaltung von der Platte in den Hauptspeicher

• Deutlich schnellere Zugriffszeiten

• Als In-Memory-Datenbank oder als Zwischenspeicher/Puffer

• Optimiert als Appliance-Lösung oder als einzelnes Software-Produkt

• Mit oder ohne Durchschreiben auf die Platte

• Leistungsfähigkeit wird durch höheren Preis erkauft

Page 16: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

TECHNOLOGIEN

BIG DATA

01.09.2014 PROFI Webcast: Big Data16

Text Analytics

• Verwendung / Nutzbarmachung unstrukturierter Daten

• Verknüpfung von strukturierten und unstrukturierten Daten

• Natural Language Processing

• Aus Logfiles, Sensordaten etc.

• Aus benutzererstellten Textdokumenten

• Aus Webseiten, Social Media, Informationsdiensten etc.

Page 17: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

LÖSUNGSANSÄTZE

BIG DATA

01.09.2014 PROFI Webcast: Big Data17

Think Big – Start Small

• Thema verführt dazu, sich zu „verlaufen“

• Überschaubares Startprojekt auswählen, aber trotzdem Erweiterung,

Skalierbarkeit, zukünftige Datenquellen und Anwendungsmöglichkeiten im

Auge behalten

Das richtige Startprojekt

• Bau und erste Nutzung der Plattform

• Sichtbare / Messbare Auswirkungen für schnelle Akzeptanz

• Am besten mit direktem Erfolg für die eigenen Kunden

Das Wissen um die Inhalte, Zusammenhänge und Einflussgrößen ist beim

Kunden vorhanden! Es geht darum, es maschinell nutzbar zu machen!

Page 18: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

LÖSUNGSANSÄTZE

BIG DATA

01.09.2014 PROFI Webcast: Big Data18

Beispielanwendung: Logistik Vorhersage der Lieferzeiten verbessern

Nutzung von:

• Verkehrsdaten, Wetterdaten, usw.

• Historische Statistikdaten

• Frachtvolumen, Routen, Daten von Be-/Entladeorten, zeitliche Abhängigkeiten

Berechnungen:

• Zusammenführung der Datenquellen

• Anwendung statistischer Vorhersagemethoden

Verbesserte Vorhersage der Ankunftstermine

Nutzung für:

• Kundeninformation

• Steuerung nachfolgender Vorgänge, Lagerkapazität, etc.

• Dynamische Anpassung von Routen

Start

(pünktl.)

Zwischenstopp

(Hafen überfüllt)

+ 1 Tag

Sturmwarnung

(umfahren)

+ 1 Tag

Ziel

(+ 2 Tage)

Page 19: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

LÖSUNGSANSÄTZE

BIG DATA

01.09.2014 PROFI Webcast: Big Data19

Beispielanwendung: Energieversorgung Mehrwert aus Smart Meter Rollout

Nutzung von:

• Kontinuierliche Zählerstände

• Standortinformationen

• Ereignisvorschau

• Wetter

• Preisentwicklung

Verfügbarkeit Verbrauchs-

entwicklung

Vorhersage

Einkaufs-

Steuerung

Angebote

Verwendung für:

• Genauere Bedarfsvorhersage

• Kundenspezifische Abrechnungsmodelle

• Reaktion auf Über- oder Unterversorgung

• Früherkennung von Störungen

• Smart Home Steuerung

Page 20: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

LÖSUNGSANSÄTZE

BIG DATA

01.09.2014 PROFI Webcast: Big Data20

Beispielanwendung: IT Betrieb Optimierung einer DWH-Lösung

• Aufteilung in eine „heiße“ und eine „kalte“ Zone

• „Heiße“ Zone:

• Analysestrukturen für verdichtete Daten, zeitkritische Auswertung,

komplexe berechnete Kenngrößen

• Begrenzter Zeitrahmen für Historie

• In-Memory

• Sich ändernde Strukturen nach aktuellen Business-Anforderungen

• „Kalte“ Zone:

• Preiswerter Datenspeicher für Detaildaten und komplette Historie

• Nicht-zeitkritische Auswertungsdaten

• Daten, die im klassischen Data Warehouse aus Platzgründen

weggeworfen werden

• Ablage für strukturierte und unstrukturierte Zusatzdaten

Kostenexplosion durch starken Anstieg der Datenmengen vermeiden!

Page 21: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

LÖSUNGSANSÄTZE

BIG DATA

01.09.2014 PROFI Webcast: Big Data21

Beispielanwendung: Predictive / Prescriptive Maintenance

• Nutzung von:

• Sensordaten, Logfiles (Maschine, Umgebung)

• Informationen über aufgetretene Störungen

• Erkennung von Mustern und Anomalien

• Ermittlung von:

• Einflussfaktoren in den historischen Sensordaten auf bereits aufgetretene

Störungen

• Ziel:

• Anwendung der Berechnungsmodelle auf aktuelle Sensordaten zur

Ermittlung der Wahrscheinlichkeit bestimmter Störungen innerhalb eines

Zeitraumes

• Maschinen- und Systemausfälle, Unfälle etc. vermeiden

<data><sensor>1</sensor>

<value>2345.556</value></data><data><sensor>1</sensor>

<value>2345.556</value></data><data><sensor>1</sensor>

<value>2345.556</value></data>

%fail: nnn

Action: xxx

Page 22: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

LÖSUNGSANSÄTZE

BIG DATA

01.09.2014 PROFI Webcast: Big Data22

Beispielanwendung: Handel + Produktion: Social Media Analyse

• Nutzung von:

• Produkt- oder unternehmensbezogene Stimmung im Netz

• Käuferprofile

• Detaillierte Umsatzzahlen, -verteilung, -historie

• Ermittlung von:

• Zusammenhängen zwischen Stimmung und Umsatz

• Aufkommenden Problemen, bevor diese ernst werden

• Ziel:

• Früherkennung von Qualitäts- oder Imageproblemen

• Produktverbesserung durch Kundenfeedback

• Früherkennung von Trends

Twitter, Facebook, Foren etc.

Vertriebshistorie Profile

Produktdaten

Erkenntnisse

Page 23: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

AUF DEM WEG ZUM PROJEKT

BIG DATA

01.09.2014 PROFI Webcast: Big Data23

Häufig anzutreffender Ist-Zustand:

• IT hat nicht genügend Einblick in die Bedürfnisse der Fachabteilungen

• Die Fachabteilung versteht die Möglichkeiten von IT nicht

(und traut sich vielleicht auch nicht mehr, nachzufragen)

• Kommunikation nur über standardisierte Anforderungswege

• Komplexe Fragestellungen werden mit viel Aufwand und geringer Aktualität

per Excel-Datenabgleich beantwortet

• Investitionen in das DWH gehen in die Erhaltung des Ist-Zustandes bzw. das

Mithalten mit dem Daten-Wachstum – ohne Funktionsgewinn

Page 24: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

DER RICHTIGE ANSPRECHPARTNER

BIG DATA

01.09.2014 PROFI Webcast: Big Data24

Big Data: Alle Daten in eine gemeinsame Umgebung bringen!

Alle Beteiligten in eine gemeinsame Umgebung bringen!

Big Data Lösungen entstehen um eine Business-Idee herum!

Mehrere Anwendungen kennen, bevor die Plattform gebaut wird!

Mehrere Ansprechpartner!

Sorgfältige Auswahl des ersten Projektes!

Page 25: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

DIE RICHTIGE ZIELSETZUNG

BIG DATA

01.09.2014 PROFI Webcast: Big Data25

• Anforderungen und Möglichkeiten zusammenbringen

• Neue Erkenntnisse gewinnen, Chancen und Probleme aufdecken

• Bestehende Erkenntnisprozesse optimieren und automatisieren

• Einsparpotenziale der neuen Technologien nutzen

Page 26: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

PRODUKTE

BIG DATA

01.09.2014 PROFI Webcast: Big Data26

TalendMicrosoft

Oracle

Teradata

Page 27: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

PRODUKTE

BIG DATA

01.09.2014 PROFI Webcast: Big Data27

PROFI-Leistungen im Big Data Umfeld:

• Anforderungsanalyse

• Beratung

• Unterstützung bei der Produktauswahl

• Modellierung und Implementierung

• Inbetriebnahme

• Service

Page 28: PROFI Master 2011 · 2015. 9. 21. · BIG DATA 2 01.09.2014 PROFI Webcast: Big Data Stefan Held Software Architekt PROFI GS Bochum ... • Aus Webseiten, Social Media, Informationsdiensten

VIELEN DANK FÜR

IHRE AUFMERKSAMKEITSTEFAN HELDSOFTWARE-ARCHITEKT

TEL: 0234-29845-4534

MOBIL: 0171-8629084

EMAIL: [email protected]

01.09.2014 PROFI Webcast: Big Data28