Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Te presentamos la mejor plataforma de Planificación y Presupuestacion BI

Forecasts, Web and excel-like interface, Mobile Apps, Qlikview, SAP and Salesforce Integration...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2016

2 oct. 2013

Tutorial sobre Bases de Datos Orientadas a Columnas


Las Column-Oriented Database Systems cada vez están siendo más imporante dentro de una estrategia Business Intelligence-Data Warehouse orientada a la mejora de los rendimientos en tiempos de consulta. 

Por ello, este white paper es un gran documento que os podéis descargar: Column-Oriented Database Systems Tutorial. Son 161 páginas muy bien aprovechadas

Además, son un complemento muy interesante en la implementación de soluciones Big Data Analiticas, como os mostramos en esta arquitectura:


Hemos podido comprobar que su mejora en rendimiento es evidente. Hemos realizado una serie pruebas entre bases de datos relacionales y orientadas a columnas, con grandes resultados, que os indicamos a continuación en este Perfomance Test, Descargar Documento
 
 

Hemos estado realizando esta comparativa, concretada en el Documento técnico que os podéis descargar pinchando en la imagen superior o en el enlace inferior, que teníamos interés en compatir con vosotros, dado que ultimamente estamos utilizando Bases de Datos orientadas a columnas (Infobright, LucidDB, MonetDB), como complemento de nuestras soluciones analíticas Business Intelligence, consiguiendo grandes mejoras de rendimiento en los cubos.

Las bases de datos columnares están organizadas por columnas en lugar de la fila: es decir, todos los casos de un solo elemento de datos (por ejemplo, Nombre de Persona) se almacenan de modo que se puede acceder como una unidad. 
Esto las hace especialmente eficaces en las consultas analíticas, como la lista de selecciones, que a menudo lee unos pocos elementos de datos, pero necesitamos ver todas las instancias de estos elementos. 

En contraste, en una base de datos relacional convencional los datos se almacenan por filas, por lo que toda la información de un registro (fila) es inmediatamente accesible. Esto tiene sentido para las consultas transaccionales, que suelen referirse a todo el contenido de un registro.

En esta gráfica, mostramos un extracto del resultado de la comparativa:



Si alguno tiene experiencias de su uso no dejéis de compartirlas,