Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso gratuito para aprender Business Intelligence. Plazas limitadas!!

Diseño multidimensional, OLAP, ETL, visualización, open source...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

29 sept. 2013

Subete al barco del BI Open Source: Oferta de Empleo

En TodoBI-Stratebi estamos buscando profesionales apasionados por trabajar en las tecnologías que más nos gustan: Business Intelligence Open Source, Big Data, Visualización, Social Intelligence, SmartCities...

Tenemos posiciones abiertas en Madrid y Barcelona. Si ya tienes experiencia profesional con estas tecnologías y te gustan los temas que tratamos en esta web, no dejes de enviarnos tu CV a rrhh@stratebi.com


Improving Performance in Saiku OLAP and Reporting

En los últimos proyectos que estamos acometiendo estamos teniendo problemas de rendimiento derivados del gran volumen de datos gestionados y/o de dimensiones con altísima cardinalidad.

Esto hace que al utilizar saiku o saiku-reporting, por ejemplo. Si queremos filtrar por un miembro de una dimensión con alta cardinalidad, el tiempo que se consume trasmitiendo los datos por la red sea mucho..

Es por eso que hemos estado investigando en Stratebi acerca de métodos de mejorar el rendimiento http y hemos visto que podemos habilitar que tomcat envíe los datos comprimidos  ( referencia: http://tomcat.apache.org/tomcat-7.0-doc/config/http.html ).

De que se trata? pues bien... si enviamos los datos comprimido en vez de enviar 10 o 20 MB por la red enviaremos 1 o 2 ganando el correspondiente tiempo de transferencia.
Cómo se hace? pues bien... en el server.xml del tomcat buscamos la etiqueta connector que está en la linea 69 aprox...
Y le añadimos los tags para habilitar la compresión de los archivos de texto:

compression="on"
 compressionMinSize="2048"
 noCompressionUserAgents="gozilla, traviata"
 compressableMimeType="text/html,text/xml,text/css,
text/javascript, application/x-javascript,
application/javascript, application/json"
 
Que básicamente dice que habilite la compresión, para archivos mayores de 2048 B  (2MB) y que comprima los archivos de texto, xml, css, javascrit y json.
Por lo que mi etiqueta connector queda tal que así:

compression="on"
 compressionMinSize="2048"
 noCompressionUserAgents="gozilla, traviata"
 compressableMimeType="text/html,text/xml,text/css,
text/javascript, application/x-javascript,
application/javascript, application/json"
/>
y aquí tenemos la prueba....

Los test antes de habilitar la compresión:

sin_compresion

La primera ejecución hace la consulta mdx y envía el resultado por la red..... 17'8MB y tarda 38,7 Segundos.

La segunda ejecución la consulta ya está en caché y sólo envía el resultado por la red... 17,8MB y 22,26 Segundos.

Y ahora los resultados una vez habilitado el tag:

comprimido La primera ejecución hace la consulta mdx y envía el resultado por la red..... 1MB y tarda 27,07 Segundos.
La segunda ejecución la consulta ya está en caché y sólo envía el resultado por la red... 1MB y 4,53 Segundos.

Ejecutando la misma consulta hemos pasado de un tiempo de ejecución de 38,7 a 27,07 segundos en la primera consulta y de 22,26 a 4,53 Segundos una vez la consulta ya está en caché de mondrian.

Una ganancia a tener en cuenta... espero que os sea de ayuda.

27 sept. 2013

Champions League Dashboards 2013/2014

Now it´s playing the new season of the Champions League, it´s available all the statistics in the web application created with the best open source Business Intelligence tools (Pentaho, Kettle, Mondrian...). It records data from last six seasons. Play and Fun!! 

Champions League Dashboards

24 sept. 2013

Free online course Data Mining with Weka

Que gran noticia la de este curso online de una de las herramientas que más nos gusta y que, lo cierto es que se usa poco, para el gran potencial que tiene. Nosotros lo estamos empleando para realizar Sentiment Analysis en nuestros sistemas de Social Intelligence.

Ir a Free online course Data Mining with Weka

Temario:
  • Class 1 - Getting started with Weka 
  • Class 2 - Evaluation 
  • Mid-course assessment
  • Class 3 - Simple classifiers
  • Class 4 - More classifiers 
  • Class 5 - Putting it all together

Introducing Pentaho Business Analytics 5.0

Se ha celebrado hoy un webinar más que interesante sobre la nueva version 5.0 de Pentaho y sus funcionalidades, que incluye 250 nuevas funcionalidades

Os dejamos algunos screenshots de lo allí contado. Conforme vayamos probando las versiones, tanto Enterprise, como Community os iremos contando. Estamos en el proceso de actualizar nuestra demo a la nueva version también

Hoy se han tratado los siguientes topics:

  • Architected Data blending 'at-the-source'
  • MongoDB interactive reporting
  • New Pentaho User Console and simplified navigation
  • New REST services for third-party application developers
  • Enterprise-ready data integration enhancements
  • New ecosystem support and adaptive big data layer



22 sept. 2013

La Convergencia entre Business Intelligence y BSC

Gran presentacion de Juan Carlos Aranibar con un buen planteamiento teórico sobre Business Intelligence y Balance Scorecard.
Nosotros hemos intentando unir ambos temas bajo el entorno de Pentaho con STCard

21 sept. 2013

Cool Infographics, ya se puede encargar



Ya se puede encargar un libro que saldrá en Octubre y que pinta muy bien: Cool Infographics.
Ah, no dejéis de echar un vistazo a la web de Randy Krum!!


16 sept. 2013

Visualized, Infographic Conference

Que la visualización, de la mano del Big Data, Open Data, Data Journalism, Open Source, etc... está de moda es evidente. Una buena pruba es esta conferencia más que interesante que se celebra en Nueva York: Visualized

Las 9 verdades para el futuro del Big Data

 

El respetado Seth Grimes hace un esbozo de lo que considera 9 puntos claves a la hora de pensar en el futuro del Big Data:

1. "Correlation is not causation."
2. "All models are wrong, but some are useful."
3. Big data knows (almost) all.
4. "80% of business-relevant information originates in unstructured form, primarily text, (but also video, images, and audio)."
5. "It's not information overload. It's filter failure."
6. "The same meaning can be expressed in many different ways, and the same expression can express many different meanings."
7. "Big data is not about the data! The value in big data [is in] the analytics."
8. "Intuition is as important as ever."
9. The future of big data is synthesis and sensemaking.       

 

13 sept. 2013

Evento OpenAnalytics, Octubre 2013 (Big Data, Open Data, Analytics Open Source)


El  24 de Octubre 2013 surge la iniciativa de un evento, Open Analytics, el cual reuna en una misma tarde las disciplinas de tratamiento de datos con herramientas Open Source, el cual sponsorizamos desde TodoBI. 

En este evento gratuito se buscará mostrar desde la perspectiva del negocio los beneficios de estas herramientas aplicadas al tratamiento de datos: Business Intelligence, Data Mining, Big Data y Open Data


Puedes ver una recopilación de la información más importante y reciente que hemos venido publicando sobre estos temas basados en Open Source: 

- Big Data
- Business Intelligence
- Open Data 
- Data Mining 

  

12 sept. 2013

Se presenta Pentaho 5.0

 
Hoy se ha anunciado la nueva versión de Pentaho 5.0 que en un mes aprox, según nos comentaba Pedro Alves, tendrá también su versión community/open source con buena parte de las funcionalidades.

La nueva versión de Pentaho 5.0 como no podría ser menos, dedica su foco al Big Data, aunque mejora en otros muchos aspectos. 
La buena noticia es que gran parte de esas mejoras las ha ido conduciendo nuestro amigo Matt Casters a través de PDI (Kettle), autentica 'joya de la corona' de Pentaho y una de las herramientas más abiertas, con gran cantidad de conectores. Podemos confirmaros que realizar Business Intelligence con Big Data usando Pentaho es factible y muy completo, como podéis comprobar en las trabajos que hemos venido probando.


 
Blended Big Data at the Source for More Accurate Insights

  • More complete analysis: Big data becomes more valuable when blended with operational and other data sources 
  • Blended at the source for accuracy:  Data governance, reliablity and security are maintained for accurate and reliable blended analytics  
  • Just in time blending for up to date analysis:  Confidently blend all the data you need in near real-time and immediately analyze the results  
Simplified Analytics and User Experience

  • New Pentaho streamlined user interface: Users easily browse files, create new content, access documents, mark favorites and more
  • Re-designed experience for administrators: Administrators become more efficient and implement faster with a seamlessly integrated administator perspective

Enterprise-Ready Big Data Integration

  • Broadest and deepest big data integration: Up-to-date integrations and certifications for popular big data stores
  • New features to manage huge data volumes efficiently: New capabilities like job restart, roll back and load balancing
Simplified Embedded Analytics

  • Simplified integration and extensbility for embedding: New REST services for third-party application developers and an exstensive library of smaples to eliminate start-up time
Industry Leading Operational Reporting for MongoDB

  • Increase data value: Access, blend, visulize and report on MongoDB in combination with any data source
  • Reduce complexity: Simplified reporting for MongoBD with automatic document sampling, drag and drop interface and metadata discovery

11 sept. 2013

Sponsorizamos el Primer Congreso colombiano de Inteligencia de Negocios

 

Dentro de un par de semanas se va a celebrar en Colombia, Bogotá, el primer Congreso colombiano de Inteligencia de Negocios, que cuenta con una agenda de ponentes espectacular, y en la que Stratebi participa como patrocinador del mismo, con la idea de seguir divulgando el uso del Business Intelligence.

Además, estaremos próximamente en Colombia realizando un Workshop en Business Intelligence Open Source, aplicado a Big Data y Redes Sociales.

Este Congreso cuenta con ponentes de primer nivel como son Bill Inmon y Claudia Imhoff



Informacion del Congreso:


La Universidad Pontificia Bolivariana, a través de su Especialización en Inteligencia de Negocios, presenta el Primer Congreso Colombiano de Inteligencia de Negocios. Esta iniciativa busca fortalecer la capacidad de gestión estratégica de información en las organizaciones, así como el desarrollo de relaciones e intercambio de experiencias entre los participantes.

Este evento contará con la participación de reconocidos expertos nacionales e internacionales, quienes presentarán temas de Estrategia, Arquitectura y Bodegas de Datos, Gobernabilidad de Datos, Tendencias y otros temas actuales sobre esta temática tan importante a nivel mundial.



Adicionalmente, se realizarán presentaciones de las distintas propuestas tecnológicas existentes en nuestro país, en donde se tendrá la oportunidad de conocer a los principales proveedores de las mismas.

9 sept. 2013

RedOpenBI llega a los 2.000 miembros, la mayor red de BI Open Source

Buenas noticias, el Business Intelligence Open Source cada vez tiene más seguidores. 

RedOpenBI.com, la red social de los apasionados del Business Intelligence Open Source en español, llega a los 2.000 miembros en donde podrás:

- Estar actualizado con las últimas novedades sobre BI Open Source
- Foro para resolver todas tus dudas técnicas y cuestiones sobre las herramientas.
- Red para hacer contactos con otros apasionados del BI Open Source en español
- Sala de Chat con otros miembros
- Todas tus cuestiones sobre Pentaho, Ctools, Saiku, Talend, etc...

Apuntaté a RedOpenBI si quieres estar a la última

Gracias a los 2.000 miembros de la comunidad !!