40
BIG DATA Bases de datos en el internet de las cosas

Introducción al Big Data - Xabier Tranche - VIII Betabeers Bilbao 27/02/2015

Embed Size (px)

Citation preview

Page 1: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

BIG DATA Bases de datos en el internet de las cosas

Page 2: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Xabi Tranche

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 3 2 7 / 0 2 / 1 5

La profesión que importará dentro de 4 años todavía no se ha inventado. Growth Hacker – Economia + Ingenieria de software 15 años trabajando INET – WEB 2.0 Socio ThinkOnMarketing – estrategia digital & innovación Socio Muaaka – red social musical Promotor StartUp SOCIAL BIG DATA @JavitxuTranche Xabi Tranche Xabi Tranche

Page 3: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

¿Qué es el Big Data?

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 4 2 7 / 0 2 / 1 5

Page 4: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Limitaciones de las bases

de datos relacionales

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 5 2 7 / 0 2 / 1 5

Page 5: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 6

Page 6: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 7

Page 7: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 8

Page 8: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 9

Page 9: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 1 0

Page 10: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Que problemas resuelve

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 1 1

FACEBOOK - Boing

Facebook genera 500 Terabytes de datos al día.

Un Boing 737 genera 240 Terabytes en un vuelo

World Of WarCraft – Stock Change

Cambios en MicroSegundos

Social Media

La información no sigue una estructura a priori

Volumen Velocidad Variedad

2 7 / 0 2 / 1 5

Page 11: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

BIG DATA PARA QUÉ

Nuevos tipos de Apps

NightBits, Crime Reduce

Reducir COSTE /Waste

Open Source /Escalabilidad

Fuentes Dispares

A short text that gives a brief biography of the person shown above.

Adivinar

A short text that gives a brief biography of the person shown above.

2 7 / 0 2 / 1 5 P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 1 2

Page 12: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

• Características BBDD BigData

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 1 3 2 7 / 0 2 / 1 5

Page 13: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 1 4

Page 14: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 1 5

Page 15: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 1 6

Page 16: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 1 7

Page 17: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 1 8

Page 18: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 1 9

Page 19: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 2 0

Page 20: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 2 1

Page 21: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 2 2

Page 22: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 2 3

Page 23: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

• Limitaciones de las bases de datos no relacionales

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 4 2 7 / 0 2 / 1 5

Page 24: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 2 5

Page 25: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 2 6

Page 26: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 2 7

Page 27: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

• Tipos de bases de datos

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 8 2 7 / 0 2 / 1 5

Page 28: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Clave - Valor

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 9

HashMap con clave única

Fácil de escalar. Server 1 del 1 al 1000, Server2 del 1001 al 2000

BigTable, Cassandra, Hadoop, MemCacheDB, Voldemort

El valor es de tipo BLOB MUY EFICIENTES

2 7 / 0 2 / 1 5

Page 29: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Basada en Documentos

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 3 0

ALMACENA UN DOCUMENTO LEGIBLE

Consultas avanzadas

Podemos establecer relaciones

MongoDB, CoachDB

FORMATOS JSON o XML EL SERVIDOR PUEDE MANIPULARLOS

2 7 / 0 2 / 1 5

Page 30: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Basadas en Grafos.

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 3 1

Para medir y almacenar relaciones

NEO4J

Cypher Query Language

ACID

RESTFUL

Representación explícitas de JOIN tradicionales

Las relaciones en si mismas tienen Info REDES SOCIALES

2 7 / 0 2 / 1 5

Page 31: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 3 2

Page 32: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 3 3

Page 33: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Basada en Columnas

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 3 4

ALMACENA UN DOCUMENTO por columna

Cassandra

RAPIDA LECTURA MALA ESCRITURA

2 7 / 0 2 / 1 5

Page 34: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

• Como migrar de Rel a BD

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 3 5 2 7 / 0 2 / 1 5

Page 35: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Que problemas resuelve

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 3 6

Pais - ciudades

Objeto JSON PAIS con multiples atributos ciudad

Pentaho MongoDB

Necesitamos un software de Terceros

Pentaho MongoDB

VIVA JS!

1:N a todos los

documentos

Usar una transformacio

n Manejar

objetos JSON

2 7 / 0 2 / 1 5

Page 36: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 3 7

Page 37: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Consulta y previsualización

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 3 8

Page 38: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Mapeamos los resultados a la colección

P R E S E N T A T I O N T I T L E | C O M P A N Y N A M E 2 7 / 0 2 / 1 5 3 9

Page 39: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Donde albergar

*  MoNgoLab

*  MongoHQ

*  AmazonWS (Hadoop)

*  PARSE

Page 40: Introducción al Big Data - Xabier Tranche  - VIII Betabeers Bilbao 27/02/2015

Donde albergar

*  OPENSHIFT (Red Hat )

*  HDInsight (Microsoft – Hadoop - HIVE)

*  Graphenedb (NEO4J)