Cassandra NoSQL

Embed Size (px)

Citation preview

Cassandra - NoSQL

@arigaltAlejandro RigaltWorld Wide Systemshttp://www.sistemas.com.gt

Que NO es Cassandra?

No es, la hija de Hcuba y Pramo, reyes de Troya de la mitologa griega.

No es, un burgo en el Condado de Cambria, Pensilvania (Estados Unidos).

No es, una nia superviviente de un planeta arrasado por una plaga de la serie de televisin Stargate.

Que SI es Cassandra?

Es una base de datos "NoSQL" que soporta GRANDES cantidades de informacin, desarrollada por Facebook en 2007 para potencializar la bsqueda de su inbox y lo colocaron en googlecode apartir del 2008, pero nunca actualizaron ni arreglaron errores entonces lo pasaron para apache y ahora es mantenida por Apache, http://cassandra.apache.org/ desde entonces el proyecto esta corriendo bastante rpido y con mejor soporte de la comunidad.

Que SI es Cassandra?

Fue inspirado por dynamo, usando DHT que son una clase de sistemas distribuidos descentralizados tipo hash donde pares (clave, valor) son almacenados y cualquier nodo puede recuperar de forma eficiente el valor con una clave(key). Esto permite que las DHTs puedan escalar a cantidades de nodos extremadamente grandes.

Que SI es Cassandra?

En el caso de cassandra el "valor" es una estructura indexada, donde cada columna es una columna adentro de otra llamada supercolunma, (fumada de la buena). Este modelo de datos es muy similar al "BigTables" de Google.

Quien lo esta usando?

Cassandra esta siendo usada por Digg, Facebook, Twitter, Reddit, Rackspace, Cloudkick, Cisco, SimpleGeo, Ooyala, OpenX, y muchas otras grandes compaas. Estamos hablando de cluster de mas de 100 TB de informacin en mas de 150 maquinas.

Tolerante a Fallas

La data es replicada automticamente a mltiples nodos. Que se pueden remplazar sin afectar los tiempos de cadas, y es descentralizado esto quiere decir que cada nodo es idntico al otro.

Que SI es NoSQL

Julio del 2009 se defini el termino para un evento y se refiere a las base de datos que no son relacionales, es mas hay algunos expertos que comentan que el termino correcto seria NoREL. Otra caracterstica es que no las vemos como tablas fijas, si no mas bien algo como estructuras de almacenamiento horizontal, evitando los JOINS porque ya no tienen sentido en este esquema.

Ejemplos de NoSQL existentes:

Propietarios

* BigTable, de Google

* Dynamo, de Amazon

Libres

* Cassandra, de Facebook

* HBase, de Apache

* Project Voldemort, de LinkedIn

Ejemplos de NoSQL existentes:

Propietarios

* BigTable, de Google

* Dynamo, de Amazon

Libres

* Cassandra, de Facebook

* HBase, de Apache

* Project Voldemort, de LinkedIn

GRACIAS

PREGUNTAS?