Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Workshop gratuito para aprender Business Intelligence. Plazas limitadas!!

Diseño multidimensional, OLAP, ETL, visualización, open source, Pentaho...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

27 oct. 2013

Todas las presentaciones del Codemotion 2013

Hace unos días se celebró uno de los mejores eventos para desarrolladores, entre los que estaban nuestros amigos de Autentia como patrocinadores. Os dejamos las presentaciones, más que interesantes, como la que os ponemos de ejemplo de David Bonilla:


Recopilado por http://librosweb.es

Weka (Pentaho Data Mining) y Hadoop


Muy buena la serie de entradas que ha publicado Mark Hall, responsable de Weka Pentaho Data Mining. Más que interesantes en donde se explica como manejar grandes 'data sets' en weka, lo que le convierte en un gran complemento en una estrategia Big Data que implique minería de datos
A todos los que os guste el Data Mining (en enlace anterior una selección de articulos relacionados), no dejéis de ver las entradas de Mark anteriores


22 oct. 2013

Evento OpenAnalytics, este jueves 24 por la tarde en Madrid, no te lo pierdas!!

Si estabas buscando un evento en el que se hablara de Big Data, Open Data, Business Intelligence, Periodismo de Datos, Data Mining y con Open Source, este jueves por la tarde en Madrid, de 15:00h a 20:00h en MedialabPrado (Ayuntamiento de Madrid) tienes tu evento. Además es gratuito, pero no olvides registrarte:



                Big Data          Open Data
Business Intelligence                Visualizacion
       Open Source          Periodismo de Datos 
                        Data Mining

21 oct. 2013

Big Data series (3): Zookeeper up&running



Continuamos con nuestra serie sobre Big Data, que ya comenzamos con MongoDB y VoltDB,

Hoy tratamos de Zookeeper

Descargar Zookeeper up and running

Más info sobre Big Data y Analytics

  • Introducción 
  • ¿Qué es? 
  • ¿Para qué sirve? 
  • Instalación 
  • Configuración 
  • Comandos

16 oct. 2013

Regalo de STCard (Scorecards en Pentaho) a todos los inscritos en el curso de Mexico


Una gran noticia para todos nuestros amigos mexicanos. Todos los inscritos en el Curso que se celebra a partir del 28 de Octubre en México DF recibirán gratuitamente, la mejor herramienta de Balance Scorecard sobre Pentaho: STCard


Con STCard se podrán crear en su Organización, robustos Scorecards para el seguimiento del cumplimiento de los objetivos identidificados en sus KPIs (Indicadores Claves de Negocio)

Una de las características de STCard, es la flexibilidad para crear diferentes Scorecards bien sea a nivel de organización o departamental. Los Scorecards de STCard se basan en la filosofía de Norton y Kaplan, con la particularidad de poder tener tantas perspectivas como se consideren necesarias.
Además, está totalmente integrado con Pentaho.


No te pierdas nada en TodoBI

Son varios años informando de Business Intelligence Open Source. Te mostramos una forma sencilla y visual de acceder a todos nuestros contenidos




15 oct. 2013

Pentaho and MongoDB, what a great combination

Some days ago we shared a white paper about how to up and running MongoDB. Now we show some good stuff about how to manage Big Data Analytics using Pentaho and MongoDB



See Webinar The value of MongoDB increases dramatically with Pentaho 5.0. It is now possible to access, blend, visualize and report on MongoDB in combination with any other data source for increased insight and operational analytics.

Here are a few highlights of the value of Pentaho 5.0 for MongoDB developers:
  • Dramatically improve ease-of-use for reporting - Meta data discovery
  • Accelerated query performance for data in MongoDB - Rich support for aggregation pipelines
  • Optimized reporting with no impact on cluster performance - Support for replica sets and tag sets
  • Increased insight by blending MongoDB data with ANY data source - Pentaho big data blending at the source
Pentaho and MongoDB, Inc. engineers worked collaboratively for over a year to tightly integrate and exploit the latest features and capabilities.

14 oct. 2013

Desarrollo en Proyectos Agiles


Estos días pasados se ha celebrado en Bilbao la Conferencia Agile Spain y en ella participaban nuestros amigos de Autentia, en donde @rcanalesmora hizo una de sus grandes presentaciones sobre el tema que aquí os incluímos y recomendamos

 

13 oct. 2013

Medialab Prado acoge la Jornada OpenAnalytics, dedicada al análisis de datos con soluciones abiertas


Jornada de Open Analytics. Análisis de datos con software libre

24.10.2013 15:00h - 19:30h
Lugar: Auditorio (2ª planta/2nd Floor)
En esta jornada diversos expertos explican cómo aplicar las tecnologías de Business Intelligence basadas en software libre a las nuevas tendencias de las redes sociales y el marketing online, de manera que los profesionales del social media, el marketing y las ventas puedan recopilar, procesar y generar indicadores que les ayuden a tomar decisiones más eficientes y a mejorar su estrategia.

Documentos:
La inversión en Big Data entre las previsiones tecnológicas de los gobiernos para los próximos dos años
La analítica de datos generará 4,4 millones de puestos de trabajo a nivel
mundial para 2015 
Marketing Intelligence y Social Intelligence, nuevas tendencias en la inteligencia de
negocio sobre tecnologías abiertas


banner

11 oct. 2013

Big Data series (2): VoltDB_UpRunning.pdf


Continuamos con nuestra serie sobre Big Data, que ya comenzamos con MongoDB,

Hoy tratamos de VoltDB

Descargar VoltB up and running

Más info sobre Big Data y Analytics


Contenido: 
  • Introducción
  • ¿Qué es?
  • Conceptos clave
  • Instalación
  • Ejemplo – Hola Mundo
  • Procedimientos Almacenados 


10 oct. 2013

quevalemicasa.es, para saber si tu casa se ha depreciado o revalorizado

 

Con la web quevalemicasa.es podrás saber rápidamente, en función  del año/trimestre, provincia, importe y superficie de la casa que compraste, si estaba bien valorada en su momento y en que situación se encuentra ahora (por encima o por debajo de su precio de referencia).



Los precios que se usan como referencia son los proporcionados por el Ministerio de Fomento, que recoge la serie histótica de precios.

También están disponibles, análisis más avanzados business intelligence que incluyen tasaciones, ventas (tanto libre como protegida), precios, etc...

1) Análisis completo
2) Cuadro de Mando Geográfico
3) Análisis Avanzado
4) Cuadros de Mando Adhoc 





8 oct. 2013

Big Data series (1): MongoDB-up&running.pdf


Iniciamos una serie de documentos sobre Big Data para su uso posterior en Analytics. Empezamos con MongoDB: 

Descargar MongoDB up and running

Más info sobre Big Data y Analytics 

Temas abordados en el documento:

  • Introducción 
  • ¿Qué es?
  • Ventajas/Desventajas frente a BBDD Relacionales 
  • Características Principales 
  • ¿Por qué usar NoSQL?
  • Estructura
  • Instalación
  • Configuración 
  • Comandos 
  • Comandos más utilizados 
  • Consultas en MongoDB

7 oct. 2013

Resumen del Pentaho Community Event (PCM13) in Sintra

  
Un año más y van seis, estuvimos presentes en el mayor evento de Pentaho que se celebra cada año. En esta ocasión, se celebró en Sintra y estuvo perfectamente organizado por Pedro Alves y su equipo de Webdetails y contó con la masiva asistencia de toda la comunidad de desarrolladores de Pentaho.

Donde mejor podéis seguir las sesiones es desde el blog de Bart, know.bi

 

Cómo es habitual en los pentaho meetings organizados por Pedro Alves ha sido un exito de asitencia y organización y eso no es facil de conseguir por lo que hay que felicitar de entrada a Pedro por la organización. El evento ha sido en una casa en el jardín del castillo da pena en Sintra.

Un lugar espectacular con un castillo asombroso que hemos tenido oportunidad de visitar.


Entrando ya en materia, Pedro ha inagurado el pcm13 con la primera charla, explicando algunas de las novedades en pentaho5, su rol cómo community vp y las similitudes y diferencias entre pentaho5 CE y pentaho 5 EE (que os vamos a decir, que este punto ha sido uno de los más jugosos, no dudéis en preguntarnos, administrador@todobi.com)


Tras el ha hablado Dough Johnson. Visión de  Pentaho que ha hecho una pequeña exposición del pentaho momentum, donde están y hacia donde van.

BIG DATA!!!! Tradicional Analytics  + Big Data Analytics


Después de Ha hablado Jake Cornelius, explicando el roadmap de pentaho.

Para cuando están planificadas pentaho 5.1 y 6.0. Los objetivos para las nuevas versiones y cómo ha evolucionado el equipo de pentaho.


A continuación ha hablado Will Gorman, también de Pentaho. Nos ha explicado un poco la nueva arquitectura de sugar y el refactoring de la PUC que se ha llevado a cabo.


La última exposición de la mañana ha sido Pedro Teixeira, nos ha hecho un pequeño repaso de las nuevas carácterísticas de Pentaho5. De hecho la mayoría de las charlas hasta aqui han ido introduciendo novedades sobre Pentaho5. Que paso a comentar:

     -- Nueva PUC orientada a perspectivas:

     -- Perspectiva de eplorador de repositorio

     -- Perspectiva de creación de contenido

     -- Perspectiva de Administrador



Estas nuevas perspectivas nos ofrecen un entorno limpio para cada una para realizar las diferentes tareas que un usuario acostumbra a hacer con la puc. Tendremos que acostumbrarnos.

-Cómo consecuencia.... ya no hay Consola de administración dado que está integrada con la puc
-Nuevo sistema y arquitectura de plugins y marketplace.
-Ya no se trabarajá con ficheros. Desaparece pentaho-solutions tal y cómo lo conocíamos hasta ahora.
Tras todas estas noticias, y si todavía no nos habíamos despertado ha habido una pausa para el café.

A la vuelta ha sido el turno de mondrian - Saiku.

Ha empezado Nelson Souza presentando su problema para gestionar roles multiples y variados. Es algo que en algunas ocasiones ya nos ha ocurrido, una empresa quiere compartir la información con sus clientes y proveedores de forma securizada y eso implica la generación de múltiplesusuarios y roles en el sistema que aseguren la segmentación de la
información. Nelson ha desarrollado un modelo dinámico para implementarlo con kettle.

Marius Giepz nos ha dado unas cuantas alegrías! Saiku reporting 2.0 está a punto de salir, habrá ad-hoc reporting y crosstabs. Pero sólo para pentaho 5 dado que, con el cambio de arquitectura no va adesarrollar para versiones "obsoletas". Marius ha presentado bastantes
novedades y satisfecho peticiones cómo filtros dinamicos.


Paul Stoelberg ha presentado la evolución desde el año pasado hasta saiku 2.5. Ha repasadoa algunas de las primcipales novedades y ha explicado los objetivos para las nuevas versiones. 2.6 corrigiendo posibles bugs y 3 cómo nueva gran versión.

Luc Bourdreau ha presentado Olap4j. Un proyecto largamente esperado y con una gran acogida una vez consolidado. Olap4j ofrece una api para interactuar con mondrian y se está convirtiendo en un standard. De hecho en stratebi lo usamos para algunos proyectos cómo nuestro STDashboard. 

Olap4j ha conseguido su objetivo de establecerse cómo un estandard tal y cómo demuestran los ports a php o javascript.


Julian Hyde ha presentado Optiq su proyecto para proporcionar una capa de abstracción sobre datos heterogeneos ( Alguien ha dicho big data? ) Optiq es un proyecto en marcha y ya lleva varios años hablando de el. Poco a poco va cogiendo forma.

 


Tras eso nos hemos ido a comer al magnifico castillo da pena en Sintra.

Al la vuelta Pedro Alves y Gonçalo Neto han presentado Sparkl su nuevo gran y excitante proyecto y que no se llama C**!!!!! Ha hecho, cómo de costumbre una presentación muy animada y muy bien conducida. Pasando de una necesidad de negocio ( interactuar con los sistemas operacionalesdesde nuestro cuadro de mandos ) a su solución y framework. Sparkl es unframework para constuir aplicaciones de pentaho ad-hoc basandose en CDE + Kettle. Una gran propuesta!!!!

David Duque y Ricardo Pries nos han persentado su solucíón a un problema comun a todos los desarrolladores de pentaho. Cómo gestionamos nuestro proyecto y cómo gestionamos el desarrollo y el deploy. Es una nueva propuesta para este problema que nos atañe a todos.

Pedro Vale ha presentado CFR  (una nueva contribución de la factoría Webdetails y que comienza por C ) Una vez mas es algo que a todos nos ha hecho falta en algun momento. Un sistema para embeber y gestionararchivos desde nuestro cuadro de mando. Muy interesante.

Thomas Morgner ha presentado las novedades de Pentaho Reporting en la versión 5 de pentaho. Las principales novedades han sido los editores de formulas, y ciertos refactorings, el más destacado los gráficos. Y no... no ha terminado con las crosstabs... aunque ha avanzado con ellas y yaparecen cási al alcance de la mano.

Francesco Corti ha hecho una de las presentaciones más interesantes por inesperada (por la mayoría) útil y, una vez mas, una gran solución para un problema común. Cómo supervisar el uso de nuestro servidor Alfresco.
Francesco Corti quería saber qué documetnos de su repositorio de alfresco eran los más utliziados y por quien. Pero alfresco no tiene capacidades de reporting por lo que decidió conectar Alfresco con Pentaho embebiendo CMIS en ketle. Realmetne interesante!!!!

Massimo Bonometto y Luca Pazzaglia han presentado BTable una tabla que nos permite hacer drill de una forma flexible y dinámica y además nos permite hacerla dentro de un CDE.... Una nueva alternativa más de visualización OLAP. Realmente interesante y útil.

Pero si os habéis quedado con ganas, por que no ver mejor los videos de las ponencias:


Ver los resumenes de los PCM de años anteriores:

- Mainz (Alemania 2008)
- Barcelona (España 2009)
- Lisboa (Portugal 2010)
- Roma (Italia 2011)
- Amsterdam (Holanda 2012)

2 oct. 2013

Tutorial sobre Bases de Datos Orientadas a Columnas


Las Column-Oriented Database Systems cada vez están siendo más imporante dentro de una estrategia Business Intelligence-Data Warehouse orientada a la mejora de los rendimientos en tiempos de consulta. 

Por ello, este white paper es un gran documento que os podéis descargar: Column-Oriented Database Systems Tutorial. Son 161 páginas muy bien aprovechadas

Además, son un complemento muy interesante en la implementación de soluciones Big Data Analiticas, como os mostramos en esta arquitectura:


Hemos podido comprobar que su mejora en rendimiento es evidente. Hemos realizado una serie pruebas entre bases de datos relacionales y orientadas a columnas, con grandes resultados, que os indicamos a continuación en este Perfomance Test, Descargar Documento
 
 

Hemos estado realizando esta comparativa, concretada en el Documento técnico que os podéis descargar pinchando en la imagen superior o en el enlace inferior, que teníamos interés en compatir con vosotros, dado que ultimamente estamos utilizando Bases de Datos orientadas a columnas (Infobright, LucidDB, MonetDB), como complemento de nuestras soluciones analíticas Business Intelligence, consiguiendo grandes mejoras de rendimiento en los cubos.

Las bases de datos columnares están organizadas por columnas en lugar de la fila: es decir, todos los casos de un solo elemento de datos (por ejemplo, Nombre de Persona) se almacenan de modo que se puede acceder como una unidad. 
Esto las hace especialmente eficaces en las consultas analíticas, como la lista de selecciones, que a menudo lee unos pocos elementos de datos, pero necesitamos ver todas las instancias de estos elementos. 

En contraste, en una base de datos relacional convencional los datos se almacenan por filas, por lo que toda la información de un registro (fila) es inmediatamente accesible. Esto tiene sentido para las consultas transaccionales, que suelen referirse a todo el contenido de un registro.

En esta gráfica, mostramos un extracto del resultado de la comparativa:



Si alguno tiene experiencias de su uso no dejéis de compartirlas,

1 oct. 2013

Way to Sintra PCM13, Pentaho Community Meeting

One more year, thanks to Pedro Alves and his amazing team from Webdetails, we´ll be in Sintra (Portugal) next weekend.

PCM13 Sintra Web
Welcome info to PCM13
PCM13 Program

You can check our comments about all the past Pentaho Community Events we attended:

- Mainz (Alemania 2008)
- Barcelona (España 2009)
- Lisboa (Portugal 2010)
- Roma (Italia 2011)
- Amsterdam (Holanda 2012)

Sample created with Pentaho and CTools from Webdetails. Great open source tools!!