16
Copyright © 2012, SAS Institute Inc. All rights reserved. BIG DATA & HIGH PERFORMANCE ANALYTICS Dr. Thomas Keil, Program Manager Business Analytics SAS Institute GmbH 7.5.2012

Big Data & High-Performance-Analytics

Embed Size (px)

DESCRIPTION

Dr. Thomas Keil über Big Data und die Möglichkeiten mit SAS, die weit über die klassische Business Intelligence (BI) hinaus gehen.

Citation preview

Page 1: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

BIG DATA & HIGH PERFORMANCE ANALYTICS

Dr. Thomas Keil, Program Manager Business AnalyticsSAS Institute GmbH 7.5.2012

Page 2: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved. Source: IDC Digital Universe Study, sponsored by EMC, May 2010

BIG DATA – FLUCH ODER SEGEN? Das Wachstum der Datenmengen ist rasant und unaufhaltsam. Big Data wird alle Branchen und alle Unternehmen treffen.

Zettabyte ist die Maßeinheit, die nach Terabyte, Petabyte und Exabyte kommt.

Page 3: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

VOLUME

VARIETY

VELOCITY

RELEVANCE

TODAY THE FUTURE

DA

TA

SIZ

EBIG DATA – WORAUF ES ANKOMMT Das Grundproblem der IT

verschärft sich damit: Aus den vielen Daten (Volumen), die sehr unterschiedlich strukturiert sind (Variety) und schnell anwachsen (Velocity) gilt es, die wertvollen, relevanten Daten herauszufiltern.

Page 4: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

Mobile transactions Sensor Data

Pervasive Computing

Quellen: Digitalisierung, Social Media, Sensoren, Maschinen, Smart Grid etc. Es sind Messdaten!

WIE UND WO ENTSTEHT BIG DATA? Die Daten entstehen zum Teil durch massenhafte Nutzung von Social Media, zu einem noch viel größeren Teil allerdings aus Sensoren, die Maschinen, Bewegungen, Produkte etc. überwachen. Sensoren sind so günstig geworden, dass immer mehr gemessen wird.

Page 5: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

INFORMATION MANAGEMENT

STREAM IT, SCORE IT, STORE IT!

DECISIONS / ACTIONS / DATA

RAW RELEVANT DATA

LOW COST STORAGE

ENTERPRISEDATAWAREHOUSE

Der immer größere Datenstrom muss frühzeitig sortiert werden: Manche Daten sollen sofort Ereignisse auslösen, andere Informationen müssen im Vertriebsreporting landen und wieder andere werden für eine spätere Analyse kostengünstig aufgehoben.

Page 6: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

FORECASTING

DATA MINING

TEXT ANALYTICS

OPTIMIZATION

STATISTICS

INFORMATIONMANAGEMENT

Copyright © 2012, SAS Institute Inc. All rights reserved.

BUSINESS INTELLIGENCE. WEITER DENKEN! Klassisches BI stößt hier schnell an Grenzen. Es geht immer mehr um Advanced Analytics mit der wertvolle Muster und Zusammenhänge erkannt werden können. Und das Ganze muss aussage-kräftig visualisiert werden, damit es verständlich bleibt.

Page 7: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

BUSINESS INTELLIGENCE. WEITER DENKEN!

Quelle: September 20, 2011, “Understanding The Business Intelligence Growth Opportunity” Forrester report

Deshalb sind in der Softwarebranche drei Trends zu beobachten, hier durch Pfeile ausgedrückt. Das Erschließen neuer Daten-arten, der Trend vom Batchlauf über Nacht hin zu Realtime – und schließlich der präzise Blick in die Zukunft.

Page 8: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

Flexible Optionen, um mit Big Data umzugehenTECHNOLOGIEN

MARKETING

IN-D

ATA

BA

SE

IN-MEMORY

GR

ID C

OM

PU

TIN

G

EDW

ADW

SALES

FINANCE

SUPPLYCHAIN

RISK

HR

Technologisch erfordern die unterschiedlichen Dimensionen von Big Data auch unterschiedliche Ansätze. SAS bietet eine einzigartiges Spektrum neuer, teils bahnbrechender Innovationen – eingebettet in relevante Geschäftsprozesse.

Page 9: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

SAS Grid Computing Big Data auf viele Rechner verteilen

Dynamische Verteilung und Skalierung der SAS Verarbeitungsprozesse im Serververbund

Vorteile• Skalierbarkeit• Intelligente Lastverteilung• Hochverfügbarkeit und Ausfallsicherheit

Im einfachsten Fall verteilt man größere Datenmengen auf mehr Rechner und leitet die eintreffenden Anfragen auf den nächsten freien Rechner – wie in einem Callcenter.

Page 10: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

SAS In-Database Analytics Analytics zu den Daten bringen

Mit SAS erstellte Scoring-Modelle könnendirekt in die Datenbank übertragen und dort angewandt werden.

Vorteile• Beschleunigte Modellentwicklung• Automatisierte Modellüberführung• Höchste Performance bei der Modellanwendung Datenbank

• Zugriff auf DB-Tabellen (Samples)• Modell-Entwicklung und Training• Manuelles Modell-Deployment

SAS Enterprise Miner und Rapid Predictive ModellerSAS Enterprise Miner und Rapid Predictive Modeller

SAS Model ManagerSAS Model Manager

SAS Modelle

• Rollen- und Workflow unterstütztes Modell Management u. Monitoring

• Automatisiertes Modell-Deployment

Zur Analyse großer Daten-mengen müssen diese normalerweise hin zum Rechenkern gebracht werden. Bei zu großen Datenmengen bringt man aber besser die Analytics zu den Daten und transportiert lediglich die Ergebnisse.

Page 11: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

SAS High Performance

Analytics

Blitzschnelle Analytics im Hauptspeicher

proc hplogistic data=MPPLib.MyTable; class A B C D ; model y = a b c b*d x1-x100; run;

Revolutionäre High-End Analytics-Plattform bestehend aus massiv-parallerer Datenbank, Hardware und dem SAS High Performance Analytics Framework.

Parallelisierung auf der Ebene der Algorithmen.

Vorteile• Massive Beschleunigung der Berechnung komplexer

Modelle im Bereich der Advanced Analytics• Bisher nicht lösbare Probleme werden lösbar

Der entscheidende Durch-bruch in Sachen Performance sind parallelisierte Algorithmen, die alle Möglichkeiten von In-Memory-Technologie ausschöpft.

Page 12: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

SAS Visual Analytics Die Lösung im Überblick

MOBILE BIENVIRONMENT MANAGER

VISUAL ANALYTICS EXPLORER

VISUAL DESIGNER

• Mobile BINative App für iPad (alsbald auch Android)

• Datenvorbereitung• Security• Monitoring

• Ad hoc Analyse• Visualisierung

• Reports für Mobile Endgeräte (zukünftig Web-Berichte)

SAS LASR Analytic Server (SAS In-Memory Server)

www.sas.com/hpa

Damit immer mehr Anwender analytische Methoden anwenden können, muss die Bedienung entsprechender Tools entscheidend vereinfacht werden. Das ist der Ansatz von SAS Visual Analytics: extrem performant, extrem nutzerfreundlich .

Page 13: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

SAS Visual Analytics Visual Analytics Explorer

Interaktive Oberfläche zur Datenvisualisierung und explorativen Analyse

• Hilfestellung bei der Auswahl sinnvoller Grafiktypen (Auto-Charting)

• Dynamisches Anlegen eigener Hierarchien

• Verständliche und einfach zu bedienende Analytik für den Fachbereich

• In-Memory Verarbeitung mit dem SAS LASR Analytic Sever

www.sas.com/hpa

Ohne vertiefte Kenntnisse in Statistik lassen sich mit dem explorativen Ansatz schnell Muster und Zusammenhänge in großen bis gigantischen Datenmengen entdecken. Ohne Umwege über die IT.

Page 14: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

SAS High Performance

Analytics Anwendungsbeispiel

Home Lending Credit Risk Management –

Berechnung eines Modells zur Vorhersage der Kreditausfallwahrscheinlichkeit über den gesamten Kundenbestand

84SECONDS

DA

TAE

XP

LOR

AT

ION

MO

DE

LD

EV

EL

OP

ME

NT

MO

DE

LD

EP

LOY

ME

NT

167 Hours

HIGH-PERFORMANCE ANALYTICS PROCESS

TRADITIONAL ANALYTICS PROCESS

Die ersten Anwender von SAS High-Performance Analytics berichten von Quantensprüngen in der Performance. Was bisher Tage und Stunden gedauert hat, geht nun in Minuten oder Sekunden.

Page 15: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.

FAZIT & ZUSAMMENFASSUNG

IN-D

ATA

BA

SE

GR

ID C

OM

PU

TIN

G

IN-MEMORY

„Big Data“ ist unausweichlich und wird jedes Unternehmen betreffen – früher oder später.

Die Bedeutung von Analytics wächst weiter.

SAS High-Performance Analytics bezeichnet ein ganzes Bündel von Technologien, die passgenau Lösungen für konkrete Anwendungsszenarien liefern.

Das Potenzial dieser neuen Technologien wird Geschäftsprozesse verändern und neue Geschäftsmodelle ermöglichen.

Page 16: Big Data & High-Performance-Analytics

Copyright © 2012, SAS Institute Inc. All rights reserved.Copyright © 2012, SAS Institute Inc. All rights reserved.

Mehr Informationen & Fallbeispiele:

www.sas.de/bigdata

SAS Institute GmbHDr. Thomas [email protected]/415-123