Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso gratuito para aprender Business Intelligence. Plazas limitadas!!

Diseño multidimensional, OLAP, ETL, visualización, open source...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

20 dic. 2005

Siete sencillos pasos para conseguir una implementación BI en tiempo real, exitosa.

Las soluciones de Business Intelligence y Data Marts en tiempo real, ya han dejado de ser una quimera del pasado, y gracias al desarrollo del software y la reducción de precios de los componentes de hardware, empiezan a ser una muy buena posibilidad.

Sin embargo, antes de lanzarse a la 'piscina' de construir un Data Mart en tiempo real, tenemos que considerar una serie de factores de riesgo:

- Se tiene que conseguir unos niveles medios-altos de rendimiento del Data Mart en tiempo real, mientras se esta refrescando o realizando transformaciones.
- Tiene que haber una justificación del coste incurrido versus beneficios potenciales. El famoso ROI.
- Hay que valorar el impacto en el rendimiento de modificaciones en los datos fuente.
- Hay que tener habilidad y experiencia para realizar todos los procesos ETl en tiempo real.


En cualquier caso, para conseguir un sistema Business Intelligence en tiempo real, siempre será útil seguir estos pasos:

1) Mucho cuidado al definir 'tiempo real'.
Reamente, el tiempo real en análisis de información no existe. Siempre existe un pequeño retardo entre la recogida de la información, almacenamiento y transformación. De lo que se trata es de establecer un umbral mínimo consensuado por todos.

2) Saber interpretar: Debe ser tiempo real, debería ser y podría ser.
Es decir, en la práctica sólo se podrá conseguir un sistema con acceso en tiempo real a los datos para una porción de los mismos, los más prioritarios. Por ello, es muy importante definir las prioridades.

3) No construyas un puente, cuando podrías ir en barco.
Muchos sistemas intentan replicar los datos de los sistemas fuente, para desde ahí, acceder a los datos. En muchas ocasiones, puede ser más sencillo, lanzar queries directamente sobre el sistema origen y obtener la información. En la práctica, muchas consultas son bastante simples.

4) Una imagen vale más que mil palabras.
No cabe duda, que para analizar información en tiempo real, que se puede consultar muchas veces a lo largo del día, será más manejable un gráfico que una tabla. Mirar ejemplo:


Comparacion de una tabla y una imagen


5) Proporcionar la información correcta.
Muchos sistemas, en su ansia de conseguir respuestas en tiempo real, se olvidan de lo más importante: los datos. Y, muchas veces, la información (rápidamente obtenida), no sirve de mucho.

6) No se puede satisfacer a todo el mundo, todo el tiempo.
Hay que asumirlo. Si hay un usuario accediendo al sistema realizando queries complejas de Data Mining y otro realiza consultas ad-hoc no standarizadas, no habrá forma de optimizar el sistema. mejor construirlos por separado.

7) Definir al inicio claramente si queremos inteligencia analítica o inteligencia operacional.
Acceder a datos tranasaccionales en tiempo real, nos dará una información muy útil y muy rápida, pero quizás nos tengamos que olvidar de rankings, acumualdos, medias móviles, etc...

Fuente: Trinus
Tags: Destacado, Teoria

1 comentarios:

Tito Maury dijo...

I have a
etl spain site/blog. It pretty much covers Siete sencillos pasos para conseguir una implementación BI en tiempo real, exitosa. related stuff.
Come and check it out if you get time :-)