Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso gratuito para aprender Business Intelligence. Plazas limitadas!!

Diseño multidimensional, OLAP, ETL, visualización, open source...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

31 ene. 2012

Seminario para aprender a diseñar Cuadros de Mando, este jueves a las 16:00

Este proxímo jueves día 2 de Febrero, a las 16:00h, BI-Spain organiza un webinar sobre 'Como Diseñar y Crear Cuadros de Mando', en el que se contará como plantear los Cuadros de Mando, pensando en el usuario final, su objetivo diseño, etc... haciendo especial hincapié en la creación con soluciones open source.

Para apuntarse gratuitamente al Webinar.

Hace unos meses hicimos otro Webinar de 'Introducción a Pentaho', que revisando las visitas, más de 4.000, parece que fué de gran interés.



Los temas que se tratarán serán los siguientes:

1. Objetivos a la hora de crear Cuadros de Mando
2. Puntos a tener en cuenta

2.1. Tipos de Usuario

2.2 Tipos de Cuadro de Mando

2.3 Tipos de información
3. Errores Comunes

4. Demos y Ejemplos

4.1 Cuadros de Mando Adhoc
4.2 Cuadros de Mando con CDE

4.3 Cuadros de Mando con STDashboard

5. Preguntas.


30 ene. 2012

Pentaho abre el Big Data al Open Source

Una gran noticia, con la que comenzamos la semana, todos los que trabajamos con BI Open Source y Pentaho desde hace años. Como sabéis llevamos un tiempo hablando de la importancia que está adquiriendo el Big Data recientemente (ver entradas recientes).

Hoy se ha anunciado que Pentaho abre a la comunidad Open Source las capacidades Big Data de sus herramientas, tomando la delantera en la disponibilidad gratuita frente al resto de ofertas del mercado.



Pentaho, lo que realmente ha anunciado es que abre al Open Source las funcionalidades Big Data de su motor ETL (Kettle o Pentaho Data Integration), una de las joyas de de Pentaho, y de la que siempre os recomendamos su uso. La licencia de Kettle pasa de LGPL a Apache License V2.0
Realmente nos alegramos de ello, pues en Stratebi, muchas empresas habían preguntado por estas funcionalidades.

Hitos principales del anuncio:

- Disponible la web para todos los aportes de la comunidad open source sobre Pentaho Big Data.
- Lo que nos va a permitir es que con el uso de Kettle, vamos a poder tener capacidades, mediante 'steps' de entrada, salida, manipular los datos y generar informes con los siguientes entornos: Hadoop y almacenamientos NoSQL : Cassandra, Hadoop HDFS, Hadoop MapReduce, Hadapt, HBase, Hive, HPCC Systems y MongoDB.
- Las principales distribuciones de Hadoop están soportadas, incluyendo: Amazon Elastic MapReduce, Apache Hadoop, Cloudera’s Distribution including Apache Hadoop (CDH), Cloudera Enterprise, EMC Greenplum HD, HortonWorks Data Platform powered by Apache Hadoop, yMapR’s M3 Free y M5 Edition.
- Kettle puede ejecutarse tanto dentro como fuera del cluster de Hadoop



Ventajas para usuarios y desarrolladores:

  • Delivers at least a 10x boost in productivity for developers through visual tools that eliminate the need to write code such as Hadoop MapReduce Java programs, Pig scripts, Hive queries, or NoSQL database queries and scripts;
  • Makes big data platforms usable for a huge breadth of developers, whereas previously big data platforms were usable only by the geekiest of geeks with deep developer skills such as the ability write Java MapReduce jobs and Pig scripts;
  • Enables easy visual orchestration of big data tasks such as Hadoop MapReduce jobs, Pentaho MapReduce jobs, Pig scripts, Hive queries, HBase queries, as well as traditional IT tasks such as data mart/warehouse loads and operational data extract-transform-load jobs;
  • Leverages the full capabilities of each big data platform through Pentaho Kettle’s native integration with each one, while enabling easy co-existence and migration between big data platforms and traditional relational databases;
  • Provides a super-easy on-ramp to the full data discovery and visualization capabilities of Pentaho Business Analytics, including reporting, dashboards, interactive data analysis, data mining and predictive analysis.

Significa que ahora se puede usar Kettle para integrar una gran variedad de tecnologías, que van desde archivos, bases de datos relacionales, Big Data y NoSQL. Se puede hacer sin necesidad de escribir ningún código. Ver el ejemplo de Matt Casters, creador de Kettle, que estuvo con nosotros en Madrid, como se programa para Hadoop MapReduce.




Donde descargo y consigo más informacion:

- Wiki-Web de Pentaho Big Data
- About Kettle and Big Data
-
Pentaho Big Data Plugin

- Documentacion

Kettle Plugin Development

Getting started with the Pentaho Data Integration Java API

Step Documentation



26 ene. 2012

La consultoria de negocio se 'mueve' en el mundo analítco



Recientemente, hemos conocido dos noticias interesantes. Las grandes consultas de negocio, provenientes del mundo de la auditoría, se mueven en el mundo analítico.
En concreto, tenemos los ejemplos de Deloitte y Accenture, con sus movimientos respectivos con Daemon Quest y NeoMetrics, buscando acercarse al mundo del análisis y, sobre todo, acercarse a una base de clientes, que hasta ahora se les resistía. O se trata de una forma de 'buscar refugio' por parte de las analíticas?

Noticias de las adquisiciones:

Accenture compra Neometrics
Deloitte compra DaemonQuest

25 ene. 2012

Infografia: Social Business



Nos ha gustado esta infografia via Forbes

Ebook gratuito, La Consultoria con Humor



Ya podéis bajaros el libro de 'La Gacela de Wirayut' para leer en vuestro tablet preferido de forma gratuita, en formato pdf.
A todos los que habéis trabajado, trabajais en el mundo de la consultoría, o habéis tratado con consultores, seguro que hay muchas cosas que os resultan familiares.

Se da un repaso a la inutilidad de muchas reuniones de trabajo, la relación con los jefes, el uso del e-mail y de internet, la hipocresía en muchas empresas.
Un apasionante viaje a las profundidades de las empresas. Lugares en donde pasamos gran parte de nuestra vida sin comprender realmente que hacemos allí. Esperemos que os guste y además gratis!!

¿Te llevas bien con tu jefe o solo disimulas?, ¿Utilizas Internet para temas relacionados con tu trabajo o con tu ocio?, ¿Alguna vez has trabajado en el extranjero sin saber apenas inglés?

Descargar ebook

Indice

0. Introducción. La Gacela de Wirayut
1. De moquetas y despachos
2. Tienes un e-mail
3. Haciendo amigos (seguridad, limpieza, mantenimiento)
4. Que bien.... reunión
5. Trabajar en el extranjero (Como Tarzán en Sarajevo)
6. En tierra extraña (cuando se llega a una empresa ‘cliente’)
7. El Alien ‘ado’
8. Reuniones anuales, Kick-offs
9. ¿Un coffee y hablamos?
10. Internet... no se puede estar sin él
11. Momento Rocky Balboa

24 ene. 2012

Pentaho Audit, Activity Report

One of the shortcomings of the Community Version from Pentaho is the lack of monitoring tools. It is true that there is a good monitoring tool, but they are in the enterprise version.

Anyway, we have enough resources to do so. Only is a question to use it!!
Then we leave an example of a report of user activity to show how. It's a simple report that reads data from PentahoAuditLog. As you can see, is a report that loads the data transformation and shows that info to the users.


Note: The report was done with version 3.8 of the Report Designer so if you test it with older versions may not work.

A new improvement of our colleagues from Stratebi

23 ene. 2012

Las Redes Sociales, a las armas!!



Nos ha gustado este diseño de Aaron Wood visto a través de BBVAtech.

19 ene. 2012

Freedom for the Business Intelligence User, STDashboard

Freedom to analyze my data. Freedom to create my own dashboards. Freedom and independence and immediacy of the results for the end user.

When we talk to a potential user, the same question arises: What if I want a new dashboard, however simple, I have to call you?


After the emergence of Web 2.0, the user is more and more independent and manage their own content. Blogging through a web interface, they got pictures, got off music, they do all sorts of things from the browser. How can we not be able to do a Dashboard? Yes, they Can!


How could be, by definition, in a context that is evolutionary, not going to let end users create their own dashboards? This is by far the greatest weakness that has Pentaho Open Source. And that's one reason why some end users prefer another tool, although more limited in power, Pentaho despite being extraordinarily powerful. That's why in Stratebi we have been developing our STDashboard. The editor dashboard that provides end users the ability to create their own dashboards.

After several months of hard work and much help we have developed a dashboard editor under the following assumptions:
  • A dashboard editor for end users. IN-NEGOTIABLE
    • An end user does not have to write a single line of code. Not a character!
    • An end user does not have to learn how it works. No instruction manual!
      • It should be intuitive enough for 1 minute will learn to handle
      • It should be clear enough and with enough context to help always know where you are and you're doing.
    • An end user should analyze their data easily and interactively.
  • A dashboard editor based on data models already defined.
  • An editor that allows simple but intuitive dashboards that meet the basic functionality required for any control panel:
    • To choose among the most used types of charts
    • To filter the data based on selectors
    • That allows the interplay of information between the different components.
    • Enabling, in short, make my dashboard.
And this is the result:





Note that this is not a dashboard editor with universal purpose, as there are a lot of types of business needs you can managed with more elaborated Dashboards, as an example of Tablero Futbolero, as we wrote in this pdf document 'How to create dashboards' and this post, 'BI, Power to the user'. This editor is designed to meet the needs of all users under specific conditions.

When we talk about the types of users. One type of user can be anyone and it is the user who wants to explore the data in an easy and intuitive way. If they have a meeting and want to prepare to analyze the data you have at your fingertips. Who wants to ask questions and get immediate answers. For that user is the STDashboard.

Want to try?, in Stratebi demo you can, although is not the final version, as we are working on gauges and other features, if you can see how it works, you can try it!!

18 ene. 2012

The Future of BI, segun Forrester



Forrester
se pone el gorro de 'pitoniso' para contarnos como cree que será el futuro del Business Intelligence y las principales tendencias para el 2012:


1. BI Tools Over Standars

Los entornos empresariales actuales son muy cambiantes y la única forma de asegurar el crecimiento y uso con éxito de soluciones Business Intelligence es usar un enfoque abierto y el uso de estándares

2. Multiple BI Tools

Se parte de la idea de que no hay ninguna suite BI, por muy grande y poderosa que sea, cubra todas las necesidades empresariales, por lo que habrá que fijarse primero en las necesidades de la organización y elegir lo que mejore encaje. Ya no se trata de comprar una buena suite BI y que la empresa deba adaptarse a ella, sino al revés.

3. Business User Control

Cada vez más, los usuarios de negocio, intervendrán más en el proceso BI, respecto a los departamentos de IT.

4. End User self-service

Usuarios al poder. Las herramientas deben ser sencillas y flexibles para que los propios usuarios las manejen sin problemas.

5. Mobile is Essential

Esta todo dicho. Ya no es imaginable tener una solución BI y que no pueda ser accedida desde un iPad, por ejemplo.

6. Cloud Business Intelligence

Si no quieres tener en 'tu casa' el 'hierro' además del software, puedes subirlo a la nube.

7. BI specific DBMS

Se acabó la dictadura de las Bases de Datos relacionales..... ahora, al igual que con el software. Primero son las necesidades de negocio y se buscará la mejor base de datos que se adapte.

8. Big Data

Podría añadir algo más, pero es tal la profusión de información actual en la red, incluido en TodoBI, que se sobreentiende que será un tema caliente.

9. Data Exploration

Como cada vez va a ver más datos y usuarios que exploren datos, se necesitarán herramientas que permitan explorar de la información de una forma más natural e intuitiva

10. Information Workspace

Ya no se habla de datos, sino de información, por lo que también tendremos que tener disponibles acceso a correos, entornos colabortivos, redes sociales, compartir información, búsquedas, etc...


17 ene. 2012

Lo que los datos nos enseñan, es Ronaldo tan bueno?


Pulsar para ver más grande

Un pequeño ejemplo de la utilidad de los datos y las gráficas a la hora de conocer mejor la realidad y tomar decisiones. Revisando el Tablero Futbolero, la aplicación Business Intelligence creada con tecnología open source, vemos un ejemplo elocuente.

Todos sabemos que Ronaldo y Messi, suelen ser los máximos goleadores de la Liga con mucha diferencia. Pero si observamos el ranking de remates, vemos que, sobre todo Ronaldo, dispara a puerta con muchisima frecuencia, más del doble que el tercero, que es Falcao.

Si vemos el ratio de goles marcados, en función de los remates, vemos que la efectividad de Ronaldo y Messi baja en gran manera y destacan, entre los goleadores, Higuaín y Soldado como los más efectivos..... la pregunta es,
quienes son mejores delanteros?


Pulsar para ver más grande

16 ene. 2012

Formula Editor in STPivot

One of the features, we´ve added to old jpivot is Formula Editor you can find in new STPivot:

This feature allow users to add/edit calculated members or named sets, that are added to the query in the form of “withmember ...”. This entities list, also known as formulas, appears below the cube navigator in left panel. In the picture you can see the Formula Editor dialog, along with red marks indicating where are the buttons to open it.

If the formula is a calculated member, users can indicate its dimension to have a consistent name proposal (that he can also change). But if it is a named set, no dimension will be necessary.

The expression editor is similar to the MDX Query editor, only a bit simpler, including the cube navigator and formula selector features.

Calculated members may have multiple properties, such as FORMAT_STRING and SOLVE_ORDER for instance; so users can add them directly in the expression editor, or optionally use the dynamic list of property+value at the bottom.

Hope this helps to everyone using old jpivot. Remember that in new versions of Pentaho you receive this kind of message when accesing Mondrian OLAP cubes (if you are tired of it, you can use STPivot):

Nuevo PDI (Kettle) Marketplace

Matt Casters, nos da unos avances de del PDI Marketplace, para facilitar la incorporación de plugins a Kettle,

13 ene. 2012

Ciencia y Tecnologia, que nos depara el futuro?


Pulsar para ver grande

Gran Infografía, elaborada por siliconangle.com, que nos da una visión de como será la tecnología los próximos años. Un ejercicio de prospectiva que no está nada mal.

Que es Big Data



Como comentábamos recientemente, no para de hablarse de Big Data-, os dejamos con una entrada de Radar O'Reilly que explica de forma resumida las principales características y tecnologías, en las que estamos poniendo mucho foco en TodoBI (ver entradas) y en Stratebi,


Big data is data that exceeds the processing capacity of conventional database systems.
The data is too big, moves too fast, or doesn't fit the strictures of your database architectures. To gain value from this data, you must choose an alternative way to process it.

The hot IT buzzword of 2012, big data has become viable as cost-effective approaches have emerged to tame the volume, velocity and variability of massive data. Within this data lie valuable patterns and information, previously hidden because of the amount of work required to extract them. To leading corporations, such as Walmart or Google, this power has been in reach for some time, but at fantastic cost. Today's commodity hardware, cloud architectures and open source software bring big data processing into the reach of the less well-resourced. Big data processing is eminently feasible for even the small garage startups, who can cheaply rent server time in the cloud.

Seguir leyendo el artículo en radar o'reilly

11 ene. 2012

5 nuevas compañías en el manejo de datos a seguir




Platfora: Manejando Big Data de forma sencilla

DataStax: Una de las mejores formas de trabajar con Cassandra

Visual.ly: Big Data debe visualizarse y las infografías nos encantan

Domo: Potenciando la experiencia de usuario. Los que llevéis tiempo en esto del BI, veréis que os recordará a Corda, que compraron

Metamarkets: Directo al grando, una forma rápida y elegante de visualizar Big Data


Visto en Data Science Central

Previsiones BI para 2012



Cada vez que comienza un año surgen muchas predicciones para el nuevo año. Os traemos las proporcionadas por
enterpriseapptoday, en donde nos gusta ver que el BI Open Source seguirá pisando fuerte:

1. Luchar por el derecho a tener Business Intelligence
, lo que también se ha llamado 'democratización del BI'. Es decir, que cada vez más usuarios de diferentes áreas y necesidades usaran BI.

2. Descentralización, las decisiones deben ser tomadas, independientemente de cuando y dónde estemos ubicados. El acceso por Internet y los dispositivos móviles ayudarán en esta tarea.

3. Big Data se hace realmente grande
, mucho hemos hablado ya de la importancia que ha cobrado en este año que acaba el Big Data. Durante el 2012 va a pasar de ser una nueva moda a una realidad realmente necesaria en el contexto actual.

4. La nube,
aunque lleva sonando desde hace años, parece que poco a poco se va consolidando, con la llegada del Big Data, aunque aún le queda algo de trecho como comenta Boris Evelson.

5. Excel-ent,
ya no se trata solo de poder exportar a excel sino de poder integrar con herramientas colaborativas, etc...

6. El auge del BI Open Source,
que os podemos decir que no hayamos contado ya en este portal. El BI Open Source ha venido para quedarse y ya empieza a ser extraña la compañía que no tiene o no se plantea el uso de BI Open Source.

7. Multiplicidad de soluciones, el linea con lo anterior, al no depender de los altos costes de un proveedor, las compañías pueden utilizar varias soluciones innovadoras de bajo coste que cubran cada una de sus necesidades.

Ver en detalle

10 ene. 2012

New STPivot version available



Good news, starting 2012, we have a new version of STPivot (Jpivot with steroids). Hope, it would be useful for many BI Open Source deployments. New functionalities include:
  • Rearranged user interface
  • Ajaxified user interactions
  • Easier Chart manipulation
  • Quick and easy stats (sum, avg, max, min)
  • Enhanced MDX Query editor
  • Formula editor dialog
  • Save function

Now, we include several pdf documents (Introducing STPivot, STPivot Installation Guide, STPivot Tutorial - First Steps, STPivot Tutorial - XMLA Mode, STPivot Tutorial - Clickable Members) and sample code.

You can see the new features and and support STPivot Team from stpivot webpage.


9 ene. 2012

CTools installer for windows, useful for Pentaho

The CTools is an Open Source toolkit developed by Webdetails, and now we present a windows installer for ctoolls, thanks to effort of our colleagues of stratebi

You can download too, STPivot, an improved alternative for old Jpivot and try STDashboard and STCard in our demo section


The CTools are:
To install most of these projects Pedro Alves created the CToolsInstaller a bash script to automate the installation of most ctolls (CDA, CDE, CDF, CDE) and Saiku . Script that is fine but for people who are sometimes forced to work in environments that are not unix / linux it is cumbersome. There are guides that explain how to use it in Windows-but not just convinced me.

And as I implemented a version of CToolsInstaller for PentahoLauncher it did not cost me much extract that piece of code and create my CToolsInstaller for windows.


If you want you can download it from here: ctoolsinstaller.zip
If you want the eclipse project with the source code you can download from here: ctoolsinstallereclipseproject.zip

Notes:
CDF, CDA, CCC, CDE are developments made ​​by Webdetails .
Saiku is a development by Analytical-labs - MeteoriteBI
The server downloads Jenkins performed with Analytical-labs
Demos and Docs from Stratebi

5 ene. 2012

Una pequeña introduccion al Business Intelligence

Una interesante entrada y aproximación para principiantes en el mundo del Business Intelligence que nos hace Houston Neal,

What is a Data Warehouse?

A data warehouse stores… data. But its technology is much more sophisticated than its name. A data warehouse allows you to consolidate data from several sources (i.e. other software systems) and then perform queries and analyses.

Let’s say, for example, you want to determine the profitability of a new product line in Q3 of 2011. You would need to pull manufacturing cost information from your enterprise resource planning (ERP) software, distribution and transportation costs from your supply chain management system, and finally, marketing campaign costs from your marketing software system. You would then need to compare this with revenue data from your accounting system. All this data would be extracted from these operational systems and then aggregated and organized in a data warehouse. Users would then run queries from the data warehouse, or more accurately, from data marts which are considered to be the access layer.

Example of a Data Warehouse

A data warehouse is organized in a way that is optimized for complex analysis of data from multiple systems, whereas the underlying operational systems are optimized to handle a high volume of transactions specific to their function.

Seguir leyendo....