Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Te presentamos la mejor plataforma de Planificación y Presupuestacion BI

Forecasts, Web and excel-like interface, Mobile Apps, Qlikview, SAP and Salesforce Integration...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2016

19 jun. 2012

Caso de Estudio Business Intelligence: Bicing

Estamos realizando un pequeño caso de estudio. El objetivo es explorar y comparar diferentes opciones de visualización y cómo, visualizando un mismo set de datos se puede aportar más o menos información más o menos relevante. El Estudio ha sido realizado por nuestros compañeros Juanjo y Xavi. Un buen ejemplo de uso práctico del Business Intelligence.
Para ello nos vamos a basar en los datos de diferentes servicios de bicicletas públicas  que proporciona http://www.citybik.es/ y que hemos recopilado. Recogemos datos de diferentes ciudades pero para un primer estudio nos centraremos en el servicio del Bicing de Barcelona.

Tenemos un proceso ETL que carga los datos y que compone un datamart con las siguientes perspectivas de análisis y métricas a analizar:

  • Estación: Ubicación  de la estación 
  • Tiempo : El estado de las estaciones en los distintos momentos de tiempo
  • Anclajes disponibles: Número de anclajes libres para que los usuarios depositen su bicicleta
  • Bicicletas disponibles: Número de anclajes ocupados o bicicletas disponibles para que los usuarios las utilicen.
Ciertamente es un set de datos reducido y en parte esa es la gracia de este ejercicio. Extraerle el máximo de información a este set de datos reducido.
Cual va a ser el primer enfoque? Pues el claro y evidente:

Evolución de las bicicletas disponibles a lo largo del tiempo.

Pero al lo largo del tiempo ¿Que quiere decir?, la comparación de la media de bicicletas disponibles en diferentes días o la evolución durante un día? Cómo siempre: Lo quiero todo

Que nos permite ver esta vista? (puedes pulsar en la imagen superior para acceder)
  • Que los domingos la gente coge la bicicleta progresivamente a lo largo del día y poco a poco desde las 8 de la mañana los más madrugadores hasta la 1 del mediodía su uso se intensifica.

  • Pero los días de diario la gente coge la bici para ir a trabajar, o al menos eso parece. Fijaros en la "pronunciada" bajada de bicicletas disponibles desde las 7:30 hasta las 9:00 que empieza a recuperarse.... y por la tarde para volver escalonadamente. 

  • Si hacemos zoom en la gráfica que nos interesa: 


De hecho, si nos fijamos en una de las peores estaciones notamos un marcado acento en esta posibilidad:




Pero hay más puntos de vista interesantes:
  • Comparativas de uso entre días
    • Comparativas de uso de los diferentes días de la semana
    • Comparativas de uso entre 2 días análogos (Domingo vs Domingo por ejemplo)
  • Donde se usa más el bicing, en el centro o en la periferia.
    • Se usa la bici para ir al centro y/o para volver a casa?
    • Que zonas tienen más actividad? Laborales, ocio o comerciales?
  • Si se usa para ir a trabajar.... Que tipos de trabajo tienen esos usuarios? Van a zonas de oficinas o zonas de tiendas o zonas "industriales"?
Cómo veis hay mucha información que extraer. Si queréis ver los Cuadros de Mando Online, podéis acceder desde estos enlaces y de forma completa en nuestra Demo:

 





1 comentarios:

Toni Santos dijo...

Lo malo es que la inteligencia se queda en las herramientas.
Los responsables de Bicing deben conocer, o al menos tienen las herramientas, cual es la demanda por zonas.
Lo malo es que no hacen ningún caso y mientras unas zonas están siempre llenas de bicicletas, sistemáticamente otras siempre están vacías.
A parte de Inteligencia en los sistemas, hace falta inteligencia en los responsables.