Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Te presentamos la mejor plataforma de Planificación y Presupuestacion BI

Forecasts, Web and excel-like interface, Mobile Apps, Qlikview, SAP and Salesforce Integration...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2016

12 nov. 2010

Google BI Open Source ?

Logo Google Refine

Desde hace tiempo venimos comentando que Google no quiere dejar ningún 'palo suelto' en su estrategia acaparadora. Y, como no, parece que Google se acerca el mundo analítico, del Business Intelligence, etc... y la buena noticia es que se acerca a través del mundo Open Source, que se deriva de la compra que hicieron hace un tiempo de Metaweb. Esta herramienta va muy en la linea de la política de fuentes abiertas por parte de Administraciones Públicas y Medios de Comunicación del que ya hemos hablado varias veces. aquí, aquí y aquí.

Esto tiene un nombre: Google Refine

Realmente se trata de una herramienta para la limpieza y organización de datos no estructurados, algo mucho más común de lo que uno podría pensarse en nuestras organizaciones.
Además, estos datos de partida podrán ser modificados a otros formatos y mejorados con la inclusión de nueva información proveniente de diferentes bases de datos.

La aplicación se ejecuta en el desktop, aunque (como todas las herramientas de Google) se acceda a través de un browser.
Se trata de una herramienta que ya puede irse empezando a usar en entornos empresariales, que conforme vaya mejorando el interfaz irá siendo más potente.

A continuación, os ponemos unos videos que muestran lo siguiente:

1. Introducción (identificando problemas de valores con cero, diferencias en valores, aplicar ciertas reglas para agrupar valores similares, etc...)





2. Transformación de datos (separar filas, identificar campos en negrita, extraer valores a otras columnas...)





3. Data Augmentation (Llamar a web services para añadir geolocalización a las direcciones, hacer joins con datos de fuentes externas, etc...)



The project is open source and its code and downloads are available here. Changes from version 1.1 to 2.0 are listed here.

0 comentarios: