Apache CassandraEstudiantes: Paula Andrea Ruiz - Sergio Muñoz Lancheros HISTORIA .Apache Cassandra fue inicialmente desarrollada en Facebook para impulsar las búsqueda en la bandeja de entrada por Avinash Lakshman (uno de los autores deAmazon's Dynamo) y Prashant Malik. se transformó en un proyecto de Apache Incubator. El 17 de febrero de 2010 se graduó como un proyecto de alto nivel. En marzo de 2009. Fue lanzada como un proyecto open source de Google code en julio de 2008. . Normalmente no soportan operaciones Join. Categorías clave-valor. es una amplia clase de sistemas de gestión de bases de datos que difieren del modelo clásico del sistema de gestión de bases de datos relacionales (RDBMS) en aspectos importantes. No requieren estructuras como tablas. Bases de datos documentales. Implementaciones BigTable. No garantizan ACID.NoSQL NoSQL. el más destacado es que no usan SQL como el principal lenguaje de consultas. Ventajas Estos sistemas responden a las necesidades de escalabilidad horizontal que tienen cada vez más empresas. Pueden manejar enormes cantidades de datos. No generan cuellos de botella. Se ejecutan en clusters de máquinas baratas. Escalamiento sencillo. . Diferentes DBs NoSQL para diferentes proyectos. Problemas de compatibilidad.desventajas El código abierto puede significar una "mancha" en el soporte para las empresas. Limitaciones de Inteligencia de Negocios. No están lo suficientemente maduros para algunas empresas. La falta de experiencia. . . de código abierto que está escrita en Java.¿QUÉ ES ? Apache Cassandra es una base de datos NoSQL distribuida y basada en un modelo de almacenamiento de «clave-valor». -Consistencia eventual. -Distribuye los datos con la función Hash. . entre otros. -CQL lenguaje de consultas. -Emplea nodos iguales formando anillos. -Soporta múltiples centros de datos. distribuido y preparado para big data.Apache Cassandra -Sistema NoSQL. -Compatible con Hadoop y spark. -Emplea familia columnas (Big table +Dynamo). -Escala horizontalmente (p2p). -Software libre (Apache software Foundation). Características claves . Arquitectura Su arquitectura se basa en el entendimiento de que pueden ocurrir y ocurren fallos del sistema y hardware. Cassandra aborda el problema de los fallos mediante el empleo de un sistema de peer-to-peer distribuidos a través de nodos homogéneos donde los datos se distribuye entre todos los nodos del clúster. . Componentes de Arquitectura Node Data center Cluster Commit log Table SSTable . Modelado de datos Column SuperColumn Column Family KeySpace Cluster . .Modelado de datos . pero estos se pueden emular almacenando las claves de una Columfamily en otras filas de otro columFamily o haciendo uso de índices. Otra diferencia entre Cassandra y el Modelo de datos relacional es que Casandra no normaliza los datos a la hora de generar el modelo.Diferencias no existe la Integridad referencial que existe en el modelo relacional. no hay joins. CQL . por ello a la hora de modelar la base de datos de Cassandra se debe pensar primero en las consultas que se van a realizar y una vez se sepan qué consultas van a hacerse a las bases de datos se realiza el modelo de datos para satisfacer a dichas consultas. ya que trabaja con un mayor rendimiento con datos des-normalizados. slideshare.com/2010/12/31/introduccion-a-apach e-cassandra/ ● http://es.slideshare.net/MARTINILDEFONSOTORRES/apa che-cassandra-27913187 ● http://es.agevaled.net/planetcassandra/cassandra-qu-es -de-0-a-100-con-apache-cassandra Bibliografía .● http://www.