Big Data, Big Disappointment (@TheDataPub)

Preview:

Citation preview

BigData,BigDisappointmentL10leccionesydefinicionesparanoregarla.

JesúsRamos(@xuxoramos)(c)2015 1

Aboutme…-  IngenierodeSoftwaredenacimiento(ITESM).-  EconometristaFinancieroporazar(Unottingham+UWashington).

-  EstadísticoComputacionalporconvicción(JHU).-  Consultadocon6firmasparalevantarsuscapacidadesanalíticas.

-  AntesProductyAnalyticsManagerenBMV.-  AhoraVPdeAnalyticsenGBM.-  Cofundadorde@TheDataPub.-  Gamerlossábados(PSN:xuxoramos).-  Foodielosdomingos.

“BigDatahasarrived,butbiginsightshavenot”-“Bigdata:arewemakingabigmistake?TimHarford.FinancialTimes.

Yconlos$41bnqueesperanquegastemoslos

cuatesdeylosde

para2018,nosquedaunapregunta…

JesúsRamos(@xuxoramos)(c)2015 3

Porqué?

JesúsRamos(@xuxoramos)(c)2015 4

Enorgsmaduras,porque…

1.  Lesvalenlosfalsospositivos.

2.   Correlaciónsiimplicacausalidad.

3.  Lesvaleelmuestreo.

4.  MachineLearning=Máspotencia!

JesúsRamos(@xuxoramos)(c)2015 5

Yenelrestodenosotros…

NosabemosquéesBigData!

Asíque“definiciones”...

JesúsRamos(@xuxoramos)(c)2015 6

BDesunatrilogíade2partes:

BigDataElgranstorededatos.Losgrandespipelines.

Losprocesosparaadquirir,procesarylimpiar.

/Analytics

Los‘eureka’queganamosalanalizardatosacualquierescala.

JesúsRamos(@xuxoramos)(c)2015 7

“BigDatanecesitaaAnalytics.AnalyticsnonecesitaBigData!”(ounrefridemillonesdepesoshaciendonada)

-CarlaGentry@data_nerd

JesúsRamos(@xuxoramos)(c)2015 8

Lección1

Miruegopeticiónauds…

NohablendeBigDatasinelsufijo‘Analytics’!

JesúsRamos(@xuxoramos)(c)2015 9

Enserio…lesimploro...

JesúsRamos(@xuxoramos)(c)2015 10

NohablendeBigDatasinelsufijo‘Analytics’!

JesúsRamos(@xuxoramos)(c)2015 11

QuéesAnalytics?

DogmaTradicionalMath|Stats|CS

NuevoConceptoMath*Stats*CS

++

=

Reporte

=

DataProduct!JesúsRamos(@xuxoramos)(c)2015 12

Estonoes…?

DataScience

JesúsRamos(@xuxoramos)(c)2015 13

ComputerScience

Predecirlarealidad

Math&Stats

Modelarlarealidad

DomainExperience

Hacerlaspreguntascorrectas

DrewConwaydice…

DataScience

DangerZone!

OpsAnalytics

MachineLearning

CuandolossoftwaredevsleentranalMachineLearningsinvalidaciónestadística.

JesúsRamos(@xuxoramos)(c)2015 14

Definiciónlimitada

ComputerScience Math&Stats

DomainExperience

Hacerlaspreguntascorrectas

Modelarlarealidad

Predecirlarealidad

DataScience

OpsAnalytics

MachineLearning

DangerZone!

Exceptoesto.Estoescierto:/

JesúsRamos(@xuxoramos)(c)2015 15

Lección2:unanuevadefinición

Analytics“Estudiarunconjuntodedatosatravésdesuscantidades,estructura,espacioocambiosparasaberalgonuevoquemejoreaspectosdemivida“.

JesúsRamos(@xuxoramos)(c)2015 16

Mi2º.ruegopeticiónauds…

NohablendeDataScience,sinode‘Analytics’!

JesúsRamos(@xuxoramos)(c)2015 17

Enserio…noesbroma...

JesúsRamos(@xuxoramos)(c)2015 18

NohablendeDataScience,sinode‘Analytics’!

JesúsRamos(@xuxoramos)(c)2015 19

Yporquétantaconfusión?

JesúsRamos(@xuxoramos)(c)2015 20

Lección3:ITVendors

BigData

=

BigBucks!BigIgnorance

+

JesúsRamos(@xuxoramos)(c)2015 21

Lección4:Barrerasentredisciplinas

Math Stats CompSci

SWEng DataViz Business

JesúsRamos(@xuxoramos)(c)2015 22

Lección5:NuestroperfildeIT

Innovadores

Independientes

Estructurados

Sobre-ejercicio

InconsistentesLSoberbiosLInflexibles L

JesúsRamos(@xuxoramos)(c)2015 23

Lección6:LosrolesenelAnálisisdeDatos

DataScienceLead

DataScientist Mathematician/Actuary

DataEngineer

DataViz/Storyteller

BizExpert

JesúsRamos(@xuxoramos)(c)2015 24

Quéestudiacadarol(enMéxico)?

DataScienceLead

(Primaria)

DataScientist

MScCienciaDatos(ITAM/UAnáhuac)

Mathematician/Actuary

BSMatesAplicadas(ITAM/

UNAM)

DataEngineer

IT(UAM/Poli)

DataViz/Storyteller

MAVis&DiseñoInfo(UAM-A)

BizExpert

(LaVida)

JesúsRamos(@xuxoramos)(c)2015 25

CEO

Ops IT Finance Mkting

QuélugarocupaAnalyticsenlasorg?

Enorgsjóvenesyágiles…

AnalyticsestaenelDNAdelaorganización!JesúsRamos(@xuxoramos)(c)2015 26

CEO

Ops IT Finance Mkting

Analytics

QuélugarocupaAnalyticsenlasorg?

EnorgstradicionalesDEBEvivirpegadoalCEO

JesúsRamos(@xuxoramos)(c)2015 27

CEO

Ops IT Finance Mkting

Analytics

QuélugarocupaAnalyticsenlasorg?

Dóndeloencontramosusualmente?Tristemente…L

JesúsRamos(@xuxoramos)(c)2015 28

PorquénodebevivirenIT?

Nohacemoslaspreguntascorrectas

Notenemoselskill

correcto

Notenemoselsponsorcorrecto

JesúsRamos(@xuxoramos)(c)2015 29

Lección7:Sinpreguntascorrectas

Software Proceso

+ =Automation

Nuncapreguntamos:-  Elprocesoestaconectadoaunobjetivodenegocio?-  Estasiendomedido?-  Esunproceso?Osonusosycostumbres?-  Resultadoprobable:procesoincorrecto,peroautomatizadoy

escalado–hacermásrápidoymáseficiencelascosasmal:/JesúsRamos(@xuxoramos)(c)2015 30

Lección8:Sinskillcorrecto

IT&SWDev Ingeniería

CÓMO?

Analytics Estadística

PORQUÉ?

Lapreguntafundamentaldelaingenieríaes‘cómo?’.Lapreguntafundamentaldelaestadísticaes‘porqué?’.Cuandorespondemos‘porqué?’,ganamosconocimiento.

JesúsRamos(@xuxoramos)(c)2015 31

Lección9:Sinsponsorcorrecto

CEO

Ops IT Finance Mkting

Analytics

ElcambioculturalnolollevaIT.Lollevadequiendependeelrevenuestream.

JesúsRamos(@xuxoramos)(c)2015 32

Lección10:EvidenciadeladistanciaentreITynegocio

Encuestade+200profesionalesdedatos.AquellosquevienendeSoftwareDevelopmentmostraroncorrelaciónnegativaconaquellosdenegocio.EsteeselproblemafundamentaldelaIT.CuandoEsanuberojaseaunóvaloestrechodependientepositivaycolorazulrey,AnalyticspodránacerycrecerenIT.

Fuente:encuestadeentradaparameetup@TheDataPubJesúsRamos(@xuxoramos)(c)2015 33

Bigflops:cuandoAnalyticsnaceenIT

Microsoft

Famosacompañíacelular

Google

Google(denuevo)

Walmart

JesúsRamos(@xuxoramos)(c)2015 34

SoyunSWDev.CómomeconviertoenunDA?

•  Prepárateenestadística,mates,optimización(comienza

porálgebralineal.)

•  Lee“ThinkStats”deAllenDowney.

•  Dejadeserproblemautomatoryconvierteteenproblem

solver.

•  Acércateatunegocioyaprendesuidioma.

•  AprendeR.

•  NoleentresalMachineLearningsinbaseestadística

JesúsRamos(@xuxoramos)(c)2015 35

Cómomeempapomás?

@TheDataPub*http://www.meetup.com/thedatapub/

JesúsRamos(@xuxoramos)(c)2015 36

DiscusionesPendientes

•  Analytics+Ética

•  Analytics+GenderBalance

•  Analytics+SoftwareEngineering

•  Analytics–DataCharlatanry

•  Analytics+SistemaEducativoMexicano

JesúsRamos(@xuxoramos)(c)2015 37

“Larealidadnoserevelaaquiensololacontempla,sinoalquesesumergeenellaparatransformarla.”

-OctavioPaz,ElLaberintodelaSoledad

Gracias!Tw:@xuxoramos

LinkedIn:xuxoramosGithub:jsramos

JesúsRamos(@xuxoramos)(c)2015 39

Recommended