Optimization with Big Data

View
38
Download
1
Category

Documents

Tags:

Preview:

DESCRIPTION

=. Extreme* Mountain Climbing. Optimization with Big Data. * in a billion dimensional space on a foggy day. Peter Richtarik School of Mathematics. BIG DATA. BIG Volume BIG Velocity BIG Variety. BIG Volume BIG Velocity BIG Variety. - PowerPoint PPT Presentation

Citation preview

Peter RichtarikSchool of Mathematics

Optimization with Big Data * in a billion dimensional space on a foggy day

Extreme* Mountain Climbing=

BIG DATA

• digital images & videos• transaction records• government records• health records• defence• internet activity (social media, wikipedia, ...)• scientific measurements (physics, climate models, ...)

BIG Volume BIG Velocity BIG Variety

Sources

BIG Volume BIG Velocity BIG Variety

Western General Hospital(Creutzfeldt-Jakob Disease)

Arup (Truss Topology Design)

Ministry of Defence dstl lab(Algorithms for Data Simplicity)Royal Observatory

(Optimal Planet Growth)

GOD’S Algorithm = Teleportation

If you are not a God...

x0x1

x2 x3

Optimization as Lock Breaking

Setup: Combination maximizing F opens the lock

x = (x1, x2, x3, x4) F(x) = F(x1, x2, x3, x4)

A number representing the

“quality” of a combination

Optimization Problem: Find combination maximizing F

Optimization Algorithm

How to Open a Lock with Billion Interconnected Dials?

F : Rn R# variables/dials = n = 109

x1

x2

Assumption:F = F1 + F2 + ... + Fn

-----------------------Fj depends on the neighbours of xj only

x3

x4

Example:F1 depends on x1, x2, x3 and x4

F2 depends on x1 and x2, ...

xn

Optimization Methods

Computing Architectures• Multicore CPUs• GP GPU accelerators• Clusters / Clouds

• Effectivity• Efficiency• Scalability• Parallelism• Distribution• Asynchronicity• Randomization

Optimization Methods for Big Data

• Randomized Coordinate Descent– P. R. and M. Takac: Parallel coordinate descent

methods for big data optimization, ArXiv:1212.0873 [can solve a problem with 1 billion variables in 2 hours using 24

processors]• Stochastic (Sub) Gradient Descent

– P. R. and M. Takac: Randomized lock-free methods for minimizing partially separable convex functions

[can be applied to optimize an unknown function]• Both of the above

M. Takac, A. Bijral, P. R. and N. Srebro: Mini-batch primal and dual methods for SVMs, ArXiv:1302.xxxx

Theory vs Reality

start

settle for this

holy grail

Parallel Coordinate Descent

TOOLSProbability

Machine LearningMatrix Theory

HPC

Recommended

Statistics & Optimization with Big Data › CaseStudies › Research › Blackcoffer - Academics.pdfStatistics & Optimization with Big Data ... vision technology and evidence based

Documents

Parallel Coordinate Descent Methods for Big Data Optimization · Keywords: Parallel coordinate descent, big data optimization, partial separabilit,y huge-scale optimization, iteration

Documents

Optimization in the ``Big Data'' Regime 2: SVRG & Tradeoffs in Large Scale Learning. · 2017. 5. 2. · Optimization in the “Big Data” Regime 2: SVRG & Tradeoffs in Large Scale

Documents

Fall 2016 IE 598 Big Data Optimization - Niao He - UIUCniaohe.ise.illinois.edu/IE598/IE598_BigDataOpt_lecturenotes_fall2016.pdfIE 598: Big Data Optimization Fall 2016 Lecture 3{4:

Documents

Investment Optimization for Execs at Dell using Big Data

Business

Big Data Analysis and Cross-Layer Optimization for ... · Big Data Analysis and Cross-Layer Optimization for Communication, Caching and Computing (C^3) Networks Zhu Han ECE and CS

Documents

Optimization and Big Data COPYRIGHTED MATERIAL

Documents

BIG-IP WAN Optimization Module Performance · BIG-IP WAN Optimization Module features 7 BIG-IP WOM Sizing Considerations 8 Summary Results 9 BIG-IP configuration for data center to

Documents

Optimization meets Big Data: a surveyds-o.org/images/Workshop_papers/pres/DiPasquale.pdf · Optimization meets Big Data: a survey Ricardo Di Pasquale rdipasquale@uca.edu.ar Javier

Documents

Big Data Analytics: Optimization and Randomization

Documents

Parallel coordinate descent methods for big data optimization...Parallel coordinate descent for big data optimization 435 to our belief that the study of parallel coordinate descent

Documents

Oracle HCM Cloud: Workforce Analytics, Optimization, and Big Data

Technology

Optimization in Machine Learning - 4TU.Federation · Optimization in Machine Learning DanielLBoley UniversityofMinnesota How Convex Optimization plays a big role in Big Data. NSF

Documents

Using Big Data for the Optimization of Internal Supply ... · Using Big Data for the Optimization of Internal Supply Chains of Multinational Companies I. Tikhonov Bauman Moscow State

Documents

Stochastic Optimization for Big Data Analytics: Algorithms and … · 2018-05-25 · Stochastic Optimization for Big Data Analytics: Algorithms and Libraries Tianbao Yangz SDM 2014,

Documents

Big Data Connection. Digital Marketing KPIs, Targeting, Analytics, & Optimization

Marketing

Resource and Performance Optimization of Big Data ...esaule/NSF-PI-CSR-2017...Resource and Performance Optimization of Big Data Scientific Workflows in Distributed Network Environments

Documents

Storage Optimization of Condition Monitoring Big Data of

Documents

Convex Optimization for Data Science1 Convex Optimization for Data Science Gasnikov Alexander gasnikov.av@mipt.ru Lecture 2. Convex optimization and Big Data applications October,

Documents

Big Data Konferenz #3 Bayesian Optimization · Bayesian Optimization Big Data Konferenz #3. ... Bayesian Optimization provides a rigorous framework to find ... Warsaw Zurich Middle

Documents