Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Te presentamos la mejor plataforma de Planificación y Presupuestacion BI

Forecasts, Web and excel-like interface, Mobile Apps, Qlikview, SAP and Salesforce Integration...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2016

31 ago. 2010

Incluyendo Flash en Eclipse BIRT




Como sabéis los que seguís esta web, una de las herramientas que más usamos y más nos gusta en Eclipse Birt, ver posts, (por cierto, en breve actualizaremos el documento y scripts, para la correcta integración entre BIRT y Pentaho).

Ultimamente han incluido algunas novedades interesantes, pero nos vamos a crentrar en la inclusión de librerias gráficas flash, lo que va a redundar en una mejora considerable del aspecto visual de nuestros informes.

Chart Scripting Examples:



Para acceder a toda la información:

Vanilla promete

vanillalogo

Ya quedan unas pocas semanas para la nueva versión de Vanilla, la numero 3, (la solución BI Open Source) de origen francés (BPM-Conseil), y lo cierto es que promete.

Ya os hablamos de ella hace un tiempo.

Ahora os vamos a contar sobre las nuevas funcionalidades que se esperan:

Vanilla_3

1. Multithread
2. ECM (basado en Lucene)
3. FreeDashboard
4. Vanilla Apps
5. Mejora de funcionalidades en OLAP viwer, etc..
6. Vanilla Disconnected
7. FreeWebReport
8. BI Document Integration
9. Free Metadata Open Standard

Mas informacion con las novedades detalladas


27 ago. 2010

4.0.1 de Kettle reciente

Está calentito y recién colgado en Sourceforge la nueva versión estable de Kettle.... pronto informaremos de algunas novedades y tips interesantes...

http://sourceforge.net/projects/pentaho/files/

Ver todas las mejoras: Mas de 70 cambios y bugs

26 ago. 2010

Comparativa de Algortimos de herramientas Data Mining



El Data Mining, consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.

Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos.

Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
Ver info en Wikipedia.

Desde TodoBI, hemos llevado a cabo un estudio y creado un documento de diferentes herramientas de data mining, algunas open source como weka, otras gratuitas como k-nime o Rapidminer (que también dispone de versión de pago) y otras sobradamente conocidas de pago como SPSS Clementine (llamada PASW desde su adquisición por IBM en enero).

Descargar Comparativa

Comparativa_DM

Dada la gran cantidad de información disponible para casi todas las herramientas seleccionadas, se ha optado por realizar la comparativa solamente de los distintos algoritmos de datamining que integran, dejando a un lado las opciones de pretratamiento, post-procesado y visualización disponibles. Posiblemente ampliemos el documento realizado con esta información más adelante.

A la vista de los resultados obtenidos nos hemos decantado por Weka, ya que además de ser gratuita y de tener el más amplio abanico de algoritmos, se integra perfectamente con pdi (antes kettle), por lo que será sencillo incorporarlo a nuestras soluciones integrales de Bussiness Intelligence.

Pentaho en iphone e Ipad

Como buena parte de soluciones BI...

iphone ipad

via: iphone, ipad

25 ago. 2010

Soluciones BI combinadas: Pentaho + Qlikview

PCI

Como nos gusta decir desde aquí, más importante que las herramientas, en Business Intelligence, son las necesidades de los usuarios y de las empresas.

Por ello, os contamos el caso de la empresa Power Costs, que ha optado en su estrategia Business Intellgence por una combinación de ambas soluciones y tecnologías, pues una sigue un enfoque DW y otra usa logica asociativa; lo que se traduce en una combinación muy completa y económica, capaz de competir con los grandes fabricantes de soluciones Business Intelligence, como SAP (Business Objects), IBM (Cognos), Microsoft BI products y la suite de Oracle.

Respecto a las ventajas de una y otras, en cuanto a Pentaho, aquí tenéis un enlace con una recopilación de todo lo necesario para empezar a usar Pentaho.
Los puntos fuertes de Qlikview es que su interfaz permite crear Cuadros de Mando rapidamente lo cual encaja para pilotos y puesta en funcionamiento rápidas, pero por contra, al usar lógica asociativa, no se crea un modelo DW realmente orientado al análisis, lo que hace que no ofrezca de forma eficiente grandes informes y listados para exportar a diferentes formatos, planificar, enviar por mail, etc... tampoco incluye un motor OLAP, para análisis avanzados, ni módulo de Data Mining... opciones que si incluye Pentaho (que hace unos años cuando empezó era más limitado, pero que está teniendo un crecimiento muy importante ultimamente), sobre todo por el ahorro de licencias, usándose integrado en muchas ocasiones con Portales Open Source como Liferay o Gestores Documentales como Alfresco.

Mejoras en La Azada

Tras nuestro reciente post sobre: Edicion de Catalogos en Mondrian usando XSD, el creador de La Azada, nos escribe para comentarnos acerca de la nueva funcionalidad incluida:

"Inspiración, he leído el articulo y seguidamente he añadido la característica 'Eclipse XML Editors and Tools' a 'La_Azada' para que soporte la edición de esquemas. También adjunto una copia de mondrian.xsd en el directorio de la herramienta.
Una buena idea.
Felix."

Pues nos alegramos

9 ago. 2010

Proyectos internos en los que han empezado a trabajar los desarrolladores de Pentaho

...parece que algo se mueve... esperemos que de sus frutos:

(también puedes ver la sesión grabada con la información)

Projects:

Angelo and Aaron (phyto) - GWT Action Sequence Editor pentaho-asd.pdf - Slides

Sean - PDI Open Office Calc Step CalcInputStep.pdf - Slides OpenOfficeCalcInput_patch.txt - subversion patch file

Mat - Platform Password Change via User Console/ Forgot Password mat.pdf - Slides

Mike - GWT 2.0 / Platform Android App MikeD.pdf - Slides

Rob - CDF Twitter Example Dashboard BI_Social_Media_Mashup.pdf - Slides

Curtis - PDI Drools Step Drools Step.pdf - Slides

Nick - XUL Base Step Dialog for Kettle XulStepPres.pdf - Slides

Will - Pentaho I18N Message Bundle Tool pentaho-i18n-tool.pdf - Slides

Como manejar los parametros de la dimension tiempo en Pentaho Reporting 3.7

Una de las cuestiones con las que más nos encontramos... parece que con una buena solución:

Acceder al enlace. Hasta ahora, no seguía un procedimiento muy ortodoxo, pero parece que ahora será más sencillo.

Info sobre BI Open Source

Dos noticias que nos han llamado la atención de BI-Spain:

- SAP, se posiciona ante el BI Open Source (interesante notica, pues antes lo ignoraba)
- Usando Pentaho en Mexico.

4 ago. 2010

Edicion de Catalogos en Mondrian usando XSD

Schema Mondrian

Mondrian es un servidor OLAP que permite realizar consultas dimensionales (MDX) a una base de datos relacional, y existen múltiples aplicaciones clientes (tanto web, como de escritorio) que permiten acceder a sus servicios. Para que mondrian sea capaz de interpretar las consultas MDX y traducirlas a SQL, para consultar la base de datos relacional y luego dar respuesta, necesita necesita la definición de un modelo lógico dimensional, y su correspondencia con el modelo de datos físico. El archivo donde se define este modelo se conoce como catálogo mondrian.xml, debido que se compone de un conjunto de definiciones de cubos y dimensiones (entre otros elementos) en formato XML.

En los fuentes de Mondrian se puede encontrar un archivo DTD que describe cómo se forma cada tag XML que acepta Mondrian, sin embargo para confeccionar el catálogo debe tenerse en cuenta además el orden en que aparecen los tag y el número de ocurrencias, por solo citar algunos ejemplos de restricciones que no aparecen explícitas en el DTD y sí en la documentación de Mondrian.

A partir de este DTD y revisando la documentación disponible, ha sido posible elaborar una definición de esquema XML o XSD, que facilita la edición y creación de catálogos mondrian.xml cuando se usa junto a un editor XML apropiado. Aunque existen muy buenos editores XML privativos (como el Oxygen XML Editor), es posible obtener resultados similares utilizando Eclipse y algunos plugins para la edición de XMLs con XSD.

Descargar zip con archivos y documentacion

Ver videos: 1, 2, 3 y 4

3 ago. 2010

VectorWise, la Base de Datos orientada a columnas de Ingres

Ingres VectorWise

Ingres, junto con la empresa holandesa cwi (creadores de la DB Open Source MonetDB, que es la que inspira VectorWise), presentan VectorWise (base de datos orientada a columnas), de la que podéis ver más información aquí y aquí.

Con esta tecnología se obtienen unos tiempos de respuesta y performance para el análisis muy altos, lo que es una gran alternativa en Business Intelligence.

Para conocer más os recomendamos el siguiente webcast del próximo 12 de Agosto, realizado junto a Pentaho:

Mas informacion:

Ingres VectorWise
Download the Technical White Paper
Download the Business White Paper
Watch the Demo
Download Ingres VectorWise Free Trial
Download Ingres VectorWise Enterprise
Download Ingres VectorWise DBA Tools
Download Ingres JDBC Driver
Download Ingres VectorWise Documentation