Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso gratuito para aprender Business Intelligence. Plazas limitadas!!

Diseño multidimensional, OLAP, ETL, visualización, open source...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

31 may. 2005

Colaboraciones en Todo BI: Jose María Arce

Tenemos la suerte de iniciar la serie de colaboraciones en Todo Bi con Jose María Arce Argos, gran experto en sistemas Business Intelligence.

Almacenamientos del Data Warehouse (1)


José María Arce Argos
Gerente Área Business Intelligence
Servicios de Integración
Bull España S.A.
jose-maria.arce@bull.es

No cabe duda de que el examen final del Data Warehouse o del Data Mart viene a través del uso de los usuarios finales, y que ellos utilizan unas herramientas de explotación más o menos sofisticadas, las cuales van evolucionando a una velocidad, en ocasiones, de vértigo. Pero tampoco es menos cierto de que las tripas del sistema siguen aportando un alto porcentaje éxito del DW, siendo su diseño un ejercicio de habilidad y en ocasiones algo más que habilidad, convirtiéndose en todo un arte, el arte de saber plasmar las posibles necesidades del negocio de nuestras organizaciones en un perfecto modelos de datos.

Al igual que en los sistemas transaccionales, denominados ya clásicos, donde la base de datos constituye el éxito de la aplicación, en los sistemas de información, hoy Data Warehouse, pasa absolutamente lo mismo. Podemos tener una aplicación de inventarios realizada en Visual Basic, nos podrá gustar más o menos su interface, podrá ir más deprisa o más despacio e incluso podremos rehacer las aplicaciones en otro lenguaje más adecuado o sofisticado, pero si tenemos una buena base de datos nos ahorraremos muchos disgustos.



Tras varios años analizando, diseñando e implementando varias decenas de Data Warehouse, he de reconocer que no es oro todo lo que reluce. Todos hablan de Data Warehouse, de las maravillas de sus aplicaciones y de sus soluciones. Pero tras ver sus sistemas y en algunas ocasiones todo parecido con un Data Warehouse , como dicen en la películas, es simple coincidencia.

No voy a aburrir al lector de estas líneas con lo de siempre, con las teorías del DW, intentado explicar exactamente como abordar un Data Warehouse, pues existen multitud de libros. Toda persona que quiera aprender, de verdad, debería leer los “tech Topic” escritos por W.H.Inmon, que sin lugar a dudas es uno de los pioneros de este nuevo concepto informático.

A pesar de esto, creo interesante reflexionar hoy sobre los almacenamientos entidad relación (E/R), las estrellas del DW, etc. Espero y deseo que nos sirva a todos para esclarecer algunos tópicos u opiniones vertidas de una forma más o menos interesada.

Me asombra leer este tipo de comparaciones carentes, inicialmente, de fundamento. Una estrella puede estar implementada sobre un modelo de datos relacional, entonces para que comparar una cosa con la otra. Supongamos que no disponemos de un gestor de datos multidemensional ¿dónde vamos a implementar nuestra estrella?. Y si estuviéramos hablando de multidimensionales, se suele aplicar en nefasto termino de “cubo”, pero un cubo puede dar cobertura a varias estrellas. Por lo tanto, entiendo que el termino exacto de estrella corresponde a su representación visual, con algo de imaginación, sobre un conjunto de tablas en un gestor, aunque pueda residir en más lugares o tipos de almacenamiento.
Hablar de E/R sin apellidos no tiene mucho sentido. Deberíamos reseñar que podemos tener bajo una base de datos relacional multitud de estructuras normalizadas atendiendo a las diversos tipos de formas normales (métrica) o no. Según nuestro criterio entre estas posibles estructuras también se encuentran las estrellas, los copos de nieves, etc. (continúa...)

MOLAP, ROLAP, HOLAP no es solo jerga.



Vamos a suponer que hemos realizado un análisis detallado de las necesidades de la empresa, se ha hablado con todos los interlocutores y usuarios, hemos identificado las necesidades de reporing y acceso, y finalmente, tenemos claro el modelo (que variables, formulas, dimensiones..) vamos a incluir.
Es en este momento cuando nos planteamos la pregunta clave: ¿Qué método de almcenamiento vamos a utilizar? Podemos tener todos los datos en nuestro sistema transaccional, que permite montarlo más rápido, pero puede ser menos eficiente. O podemos precalcular la información para que ésta se obtenga de forma rápida y exacta. Es una decisión muy importante, porque puede implicar mayor coste de mantenimiento y de licencias.

Es aquí donde conviene aclarar estos acrónimos:

OLAP es online analytical processing. Se trata de una forma de almacenar la información en una Base de Datos que permita realizar de forma más efectiva las queries. Es una definición abreviada, claro esta, la realidad es más compleja.

MOLAP: Multidimensional OLAP. Tanto los datos fuente como los datos agregados o precalculados residen en el mismo formato multidimensional. Optimiza las queries, pero requiere más espacio de disco y diferente software. El primer punto esta dejando ser un problema: el espacio de disco cada vez es más barato.

ROLAP: Relational OLAP. Tanto los datos precalculados y agregados como los datos fuente residen en la misma base de datos relacional. Si el DataWarehouse es muy grande o se necesita rapidez por parte de los usuarios puede ser un problema.

HOLAP: Hybrid OLAP: Es una combinación de los dos anteriores. Los datos agregados y precalculados se almacenan en estructuras multidimensionales y los de menor nievel de detalle en el relacional. Requiere un buen trabajo de análisis para identificar cada tipo de dato.

Mas información: Designing OLAP Solutions

Tags: Teoria

30 may. 2005

¿Va a comprar Oracle a Siebel?

. . .

Lo que empezaron siendo rumores, fueron tomando cuerpo poco a poco y tras la publicación del posible interés de Oracle por hacerse con Siebel en la web TheDeal.com, empezaron a saltar todas las alarmas.

Algunas cosas parecían dar la razón a los rumores: los últimos resultados de Siebel no han sido tan buenos como se esperaban, han despedido a su director ya que los accionistas demandaban cambios y, además, Oracle, una vez solucionado el tema de PeopleSoft, con su famosa agresividad no vería mal seguir saliendo de compras.

Mas indicios: una vez que el rumor fue cogiendo cuerpo, las acciones de Siebel subieron rapidamente (casi un 5%).

De momento las cosas se han calmado, pero los accionistas de Siebel, querrán obtener resultados claros en breve, un año, y si las cosas no mejoran podríamos asistir a la consolidación de los fabricantes en un grupo muy pequeño: Oracle, SAP, IBM, Microsoft... y ver desaparecer a los fabricantes especializados 'best of breed'.

Para saber más: Oracle rumored to be interested in Siebel

29 may. 2005

Gartner le pone 'peros' a Salesforce.com



Lo que viene a decir Gartner, después de analizar la implantación de la herramienta (un CRM sobre Internet), que últimamente está teniendo un gran desarrollo, es que no es muy adecuada para las grandes empresas. Estamos hablando de aquellas de más de 500 empleados.
Las razones hay que encontrarlas en la complejidad propia de estas grandes coorporaciones que necesitan realizar gran cantidad de desarrollos a medida y modificaciones del producto original.
Según ellos, a los tres años, el producto podria llegar a costar el doble que otras herramientas más tradicionales.
El fuerte de Salesforce.com está en las pequeñas empresas, que se pueden aprovechar de todas las ventajas de rápida implementación utilizando sus templates: seguimientos de ventas, contactos, oportunidades, forecasts, etc...

Gartner avisa: Salesforce.com es una buena herramienta para algunos compradores, pero no para todos. Y, es importante que se sepa.
De todos modos, en mi opinión, mejor que 'ponerse la venda antes de la herida', quizás fuera útil hacer un buen análisis y evitar las customizaciones y desarrollos a medida, que muchas veces lastran el éxito de un proyecto, independientemente de la herramienta.

Fuente: TechWeb News

Tags: Salesforce, CRM

27 may. 2005

¿Consultoria y Servicios Profesionales es lo mismo?



He leido un comentario muy interesante de Brad Feld, en donde intenta abordar esta cuestión. A primera vista podríamos pensar que se trata sólo de un debate semántico, pero realmente yo estoy de acuerdo con Brad en que hay que dejar clara la diferencia entre ámbos conceptos.
De este modo podremos evitar situaciones delicadas o conflictivas con nuestros clientes.

Los Servicios Profesionales, los podríamos identificar como aquellas personas que se dedican a implantar, mantener y dar soporte de un producto.
La Consultoría, tiene unos bordes más difusos, se trata de asesorar, ayudar y definir estrategias que ayuden a las empresas.

Cuando más clara se ve la diferencia es cuando en la misma empresa conviven Servicios Profesionales y Consultores. Debe estar claro, porque corremos el riesgo de que se solapen las funciones, con el consiguiente perjuicio que puede causar.
Creo que la distinción es importante por dos razones. Primero, los clientes pueden entender mejor donde están en términos del proceso de la solución (la consultoria parece estar anticipando la solución, mientras que los servicios profesionales parece que intervienen una vez que se haya elegido una solución). En segundo lugar, los clientes tienen una expectativa y una claridad mejores en lo que están comprando.

Resumiendo, no debemos confundirnos: ni consultores, ni clientes, ni servicios profesionales de cuales son nuestras funciones. Nos evitaremos unas cuantas reuniones de seguimiento tensas y algunos dolores de cabeza.

Tags: Proyectos

Lideres y Gurús del BI-DataWarehouse

Que conste que no me gusta mucho la expresión 'Gurú'. Pero como esta generalmente aceptada y a falta de algún sinónimo más adecuado, la utilizaré para referirme a esas personas que han marcado y siguen marcando un hito en el campo del Business Intelligence.
De sus cabezas han salido la mayor parte de ideas que posteriormente se han aplicado en la práctica por empresas y fabricantes. Por eso, creo que es buena idea mencionarlos, para seguirles la pista por todo lo que se les ocurra:

Ralph Kimball, Dimensional Data Warehouse Guru. Ralph Kimball Associates Autor de "The Data Warehouse Toolkit"

Patricia Seybold. Founder, CEO, y autora de Patricia Seybold Group, Inc. Autora de "Customers.com"

Bill Inmon. The "Father of Data Warehousing"

Nigel Pendse. Lead Author The OLAP Report. Experto en OLAP

Fundador Peppers and Rogers Group / Marketing 1to1, Inc. Acuñó la frase "one to one marketing".

Fundadora Peppers and Rogers Group / Marketing 1to1, Inc. Co-autora de cinco libros sobre CRM y One-To-One.

Douglas Hackney . Presidente de Enterprise Group Ltd. Experto en Data Marts.

Ginger Cooper . Fundadora y presidenta de CRM Association . SFA/CRM industry observer.

Claudia Imhoff. Presidenta de Intelligent Solutions, Inc. Autora de "Corporate Information Factory".

Kurt Thearling, Ph.D. CRM Consultant. Co-Autor de "Building Data Mining Applications for CRM."

Fuente:
Datawarehousing Online

Tags: Destacado, Teoria

26 may. 2005

QlikTech da un gran paso con QlikView 7

Qliktech que se esta convirtiendo en un de los más dinámicos competidores en el mercado del Business Analysis y Reporting ha lanzado una nueva versión de su producto estrella: QlikView 7.

Realmente en esta nueva versión se pone de manifiesto toda la potencia de la herramienta que permite acceder a gran cantidad de datos desestructurados en tiempo real. Además, manteniendo su principal seña de identidad: desarrollo e implementación en muy poco tiempo (menor coste), los usuarios lo aprenden a manejar en minutos, y pueden ser creativos con sus consultas.

En mi opinión, deberiamos seguir muy de cerca esta empresa y sus productos. Los usuarios la adoran y ésto es un valor comercial innegable.

Imagen del producto:



Para saber más: QlikTech Releases QlikView 7

Time Warner pierde los datos de 600.000 empleados



En Time Warner estaban realizando una rutinaria tarea de traslado de backups de un lugar de otro, pero en el último traslado se produjo la pérdida de estas cintas que contenían la inforamción de más de 600.000 empleados.
La noticia se ha sabido con más de un mes de retraso y la empresa dice que estan haciendo todo lo posible por recuperar la mayor parte de la información y que no se ha extraviado nada de información relativa a los clientes, algo, que de haber sucedido les habría puesto en un grave aprieto.

Respecto a las causas de la pérdida, comunican que no hay evidencias de que se hayan sustraido malintencionadamente, pero nunca se puede saber. El tipo de información eran nombres, datos de afiliación, organigramas, dependencias, etc...
Este tipo de situación, en lugar de decrecer, cada vez suceden más; y es previsible que no solo las leyes de cada gobierno, sino las aseguradoras, presionen a las empresas para que tomen mejores medidas de precaución.

Podríamos extraer una conclusión: "Si quieres construir un buen DataWarehouse, lo primero es no perder los datos"

Fuente: Computerworld

Tags: Economia

25 may. 2005

El nuevo equipo de Oracle Ibérica



Oracle Ibérica, al igual que el resto de subsidiarias del mundo entero está acometiendo su proceso de fusión organizativa (la tecnológica ya se comentó en otro post) con PeopleSoft.
Sin embargo, a diferencia de la mayoría de los países en los que se ha mantenido como máximo responsable de la empresa resultante al gestor de Oracle, en España se ha nombrado como director al antiguo responsable de PeopleSoft.

Esta curiosa situación, en la que los responsables de la compañía adquirida toman el mando, quiere solventarse mostrando la imagen de un equipo fuerte y consolidado. Para ello, han aprovechado unos anuncios en prensa solicitando nuevos empleados para mostrar una fotografía que demustre estas sinergias.
En dicha foto, pueden verse a los actuales responsables provenientes de PeopleSoft (Miguel Milano y Paco Armesto), sonriendo animadamente con los directivos que se mantienen de la época anterior (Ricardo Martínez, Antonio Mesa, Luis Fernando González, Felix del Barrio...)

El nuevo slogan de Oracle Ibérica es La estamos armando!!!
¿Conseguirán realmente armar este complicado puzzle?

En el interesante blog de Javier Delgado, tambien se comenta esta cuestión.

Tags: Oracle

Una definición de Data Warehousing



Existen muchas definiciones de Data Warehousing. Aquí va a alguna de las que más me gusta.
Mi definición favorita de un Data Warehouse es una versión levemente modificada de la definición de Ralph Kimball :

Un Data Warehouse es una copia de los datos de la transacción estructurados específicamente para preguntar y divulgar.
Ralph indica que un Data Warehouse es "una copia de los datos de la transacción estructurados específicamente para la pregunta y el análisis". Dos precisiones que tengo con la definición de Ralph son:
1) los datos no transaccionales se almacenan a veces en un Data Warehouse, aunque el 95-99% de los datos es sin embargo generalmente datos de la transacción.
2) Prefiero decir "pregunta y divulgación" más bien que "pregunta y análisis" porque la salida principal de sistemas de un Data Warehouse son listados tabulares (preguntas) con el formato mínimo o informes "formales" altamente ajustados a formato. Las preguntas y los informes generados de la información almacenada en un Data Warehouse puede o no utilizarse para el análisis.

La forma de los datos almacenados no tiene nada hacer con si algo es un Data Warehouse o no.
Un Data Warehouse se puede normalizar o desnormalizar. Puede ser una base de datos relacional, base de datos multidimensional, fichero "plano", base de datos jerárquica, base de datos por objetos, etc.

El Data Warehouse no está exclusivamente dedicado al uso de los "decision-makers" o utilizado en el proceso de la toma de decisión.
Por supuesto si usted desea definir a cada usuario como un 'decision-maker' y todas las actividades como procesos de toma de decisión, entonces mi aserción es falsa. Pero en mi experiencia, muchas de las aplicaciones de los Data Warehouses están para cosas mucho más mundanas y puntuales. De hecho, creo que la mayor parte de Data Warehouses se usan para ver el efecto en los datos de decisiones tomandas previamente por otros.

Comentarios recogidos de: The Data Warehousing Information Center

Tags: Teoria

24 may. 2005

Colaboraciones en Todo BI



En Todo BI queremos abrir las puertas a todas las colaboraciones que nos hagais llegar.
Creemos firmemente en el valor de los Weblogs como medio de compartir, aprender y difundir información útil.

Temas:
Como reza el título del Blog "El recurso en Español sobre Business Intelligence, DataWarehouse, CRM, Cuadros de mando y mucho más.."
Nos podeis contar pruebas de herramientas (lo que os gusta, lo que no), trucos, noticias del sector, rumores, articulos teóricos, nuevos productos, experiencias de proyectos.... y todo lo que creais que puede tener cabida en Todo BI.

Procedimiento:
Debereis mandar un mail con el articulo o comentario a
administrador@todobi.com, y el equipo de Todo BI los revisará. Una vez verificados, se les dará el formato correcto para el blog (si nos enviais imágenes, graficos, etc..) mucho mejor; a continuación, pasará a ser publicado con la mayor brevedad posible.
El articulo hará referencia al autor, y a la información que nos proporcioneis: blog/web, correo electronico, profesión, etc.. de modo que vuestras colaboraciones puedan ser referenciables.

Licencia:
En Todo BI hemos adquirido una licencia Creative Commons, de modo que todo lo publicado quede protegido. De esta forma la información publicada no podrá ser utilizada por otros sin mencionar la fuente y el autor, ni ser utilizada para usos comerciales sin consentimiento.

Algunos colaboradores:

- Lic. Ricardo Sánchez Montoya.
Profesor de Cátedra del Departamento Académico de Mercadotecnia del ITESM Campus Monterrey rsm@itesm.mx

- José María Arce Argos.
Gerente Área Business Intelligence, Bull España S.A
E-Mail: jose-maria.arce@bull.es

- Luis de TikiTak.

- Oscar Manzano de A Bit of an apple.

- Antonio Miranda. Gerente Comercial Business Intelligence.

Las 8 reglas de oro de un CRM exitoso



"El Customer relationship management (CRM), es la piedra angular que va a determinar si una empresa tendrá éxito en el siglo XXI".
Se puede estar de acuerdo o no con esta aseveración. Si digo que quien la pronuncia es Gartner, la prestigiosa empresa de análisis e investigación de mercados, convendremos en que es importante prestarle atención.

El CRM se define como la estrategia empresarial que maximiza los beneficios, los ingresos y la satisfacción del cliente. Ahí es nada. Esto se debería estudiar en primero de carrera de empresariales. ¿No os parece?

Pero no es tan fácil. Para conseguirlo, se necesita:
- Organizarse según segmentos de clientes.
- Fomentar comportamientos que satisfagan a los clientes.
- Implementar procesos que tengan al cliente como centro.

Para que el CRM sea exitoso, Gartner identifica 8 reglas de oro:

1. Vision: Crear una imagen de como será nuestra empresa teniendo al cliente como punto central. De este modo podremos definir una marca, que se comunique y se posicione en el mercado de forma correcta.

2. Estrategia: Habrá que desarrollar una estrategia que convierta la base de clientes en un activo para la empresa. Se determinarán objetivos y el modo de interactuar con los clientes.

3. Experiencias de clientes con valor: Asegurarnos de que las interacciones con los clientes proporcionan valor y son consistentes con la posición en el mercado que se desea.

4. Cambio Organizacional: Hay que sincronizarse. Todos: empresa, proveedores, partners... y pensar en el cliente como principal referencia.

5. Procesos: Manejar de forma eficiente no sólo los procesos directamente relacionados con el cliente (interacción, quejas, soporte, promociones...) sino los procesos de análisis y planificación con la información que de ellos tenemos.

6. Información: Hay que recoger la información correcta y llevarla al sitio correcto. Parece sencillo,¿no?

7. La tecnología: Muchos le dan toda la importancia a ésto. Aquí sólo es un punto. Hay que manejar los datos, análisis, el front-end de usuario, la arquitectura, hardware...

8. Metricas: Hay que medir. Todo. Tanto interna, como externamente si el CRM esta yendo bien o está siendo un fracaso.

Fuente: IT Papers: 8 golden rules

Tags: CRM, Teoria, Proyectos




23 may. 2005

Greenplum, los pioneros en el uso de Open Source Databases para BI


GreenPlum, ha lanzado la versión Beta de la Base de Datos Open Source, DeepGreen, que te puedes bajar de forma gratuita.

La quieren convertir en la Base de Datos OpenSource mas usada para Business Intelligence y Data Warehouse. La compañía esta formada por antiguos trabajadores de Exodus, Oracle , Teradata y Tandem, por lo que es probable que sepan lo que se traen entre manos. GreenPlum es el resultado de la fusión en 2003 de Metapa y Didera.

Los responsables de la compañía esgrimen que las soluciones actuales de BI y DW son muy costosas, con tecnología propietaria, que consumen muchos recursos y requieren de mantenimiento constante. No les falta nada de razón. ¿Qué es lo que pretenden? Trasladar la comodidad, rapidez y bajo coste de herramientas como google y yahoo al área del DataWarehouse. No deja de ser un gran planteamiento, pero no es fácil de conseguir.

Algunas de las principales características del producto son:

• Easy-To-Install Packaging

• Cross Platform Support

• Bulk Data Loader

• Open Connectivity to Business Intelligence Tools

Detección de fraude. ¿Qué mejor que usar Data Analysis?



Uno de los asuntos más temidos por parte de las empresas es detectar los fraudes. Conforme la sociedad y la tecnología se va desarrollando, y se genera mucha mas información, 'son más los agujeros por los que los 'delicuentes' pueden colarse y aprovecharse de nuestras carencias.
Por ello, es importante que esta sobreabundancia de datos y de información no se convierta en un lastre, sino en un punto de apoyo para detectar estas irregularidades.
En la actualidad disponemos de una gran cantidad de información en soporte electrónico, existen gran cantidad de procesos estandarizados mediante el uso de la informática y las herramientas de análisis y reporting son cada vez más potentes. ¿Por qué no utilizarlos para luchar contra el fraude?

Estos son algunos ejemplos de Data Analysis para detectar el fraude:

- Se pueden realizar consultas en donde identifiquemos que valores están por encima de los datos habituales de su 'target' equivalente. Ej) Quién esta comprando mucho más de lo habitual.
- Si ya se sospecha de un determinado fraude, establecer filtros que rápidamente nos identifiquen esos registros 'sospechosos'. Ej) Sociedades con direcciones ficticias, duplicadas, ausentes...
- Análisis más sofisticados que nos permitan interrelacionar transacciones diversas, de modo que lleguemos a identificar situaciones fraudulentas. Ej) Movimientos en cadena entre proveedores y clientes aparentemente sin relación.

Esto no deja de ser el comienzo y un primer paso, pero por algo se empieza.

Para saber más: E&Y. A key to fraud detections.

Tags: Economia


22 may. 2005

¿Quién es el lider en visualización avanzada?

Responder a esta pregunta no es sencillo del todo. Parece que Terry Kim , se decanta claramente por ProClarity, aunque quizás deberíamos poner su comentario en tela de juicio, ya que su compañía, http://www.rainmakerworks.com, es reseller de dicho producto.
Aún así, no deja de ser cierto que Proclarity tiene visualización de arboles de decisión, cuatro cuadrantes de análisis, mapas de rendimiento, muchos tipos diferentes de 'dashboards' y una gama amplísima de cualquier tipo de gráfico.



Sin embargo, como bien apunta Chad Symens, no se puede hacer una aseveración tan reduccionista. Es necesario tener en cuenta el tipo de solución que estamos buscando, para elegir la mejor herramienta.
Si hablamos estrictamente de GIS, nos centraremos en ESRI, MapObjects, MSFT MapPoint, y otros vendedores más pequeños.
Si buscamos dashboards, o herramientas de reporting y análisis, iremos a Cognos, Business Objects e Information Builders (Que están en el cuadrante líder según Gartner).
Dependiendo de cómo estén almacenados los datos. Si es en cubos (Cognos o Proclarity). SI es relacional, Business Objects. En ámbos casos, se puede considerar Information Builders y Actuate.

20 may. 2005

OLAP y GIS (por ejemplo, Analysis Services y MapPoint)

¿Te has preguntado alguna vez como puedes pasar los datos de tus cubos de Analysis Services a un mapa, que nos presente los datos de una agradable forma visual?
Pues existe un add-in, que no es excesivamente publicitado que hace ésto por nosotros: OLAP AddIn for Microsoft MapPoint .

La forma en la que trabaja es la siguiente: tiene un wizard que construye MDX queries, se envian al cubo, y MapPoint construye el mapa con los resultados. Nos permite elegir las variables y entorno geográfico a aplicar.
Todo esto está en relación con el nivel de la dimensión geografía que hallamos elegido.

A continuación, se muestra el resultado de una consulta realizada a través del wizard: cuanto más grande es el círculo, mayor es el dato (en este caso las ventas). Los dos colores mostrados en cada círculo representan dos años diferentes.




Tags: GIS, Microsoft

Los usuarios se dividen ante el 'Proyecto Fusion' de Oracle



Oracle ha establecido un 'roadmap' (hoja de ruta), mediante el cual los productos de las compañías fusionadas (Oracle, PeopleSOft y JDEdwards), formarán un único ente con una tecnología común.
Las fechas aún nos parecen lejanas, pero en este tipo de productos es muy importante tener claro como de segura y estable puede ser una herramienta en el futuro.
Por ello, los grupos de usuarios actuales de cada una de las herramientas varían desde la preocupación de algunos, hasta las buenas expectativas de otros. Algunos se plantean pasarse a la competencia (SAP, por ejemplo), mientras que otros están seguros, que el producto resultante será mejor que el de los tres por separado.
El proyecto Fusión se basa en el llamado 'Best of breed', como si dijéramos 'lo mejor de cada casa'; y pretende integrar JDE Manufacturing, PeopleSoft HRM en una Base de Datos Oracle.

Para saber más: Users Divided Over Oracle Middleware Initiative

Tags: Oracle

19 may. 2005

2005 promete ser un buen año para los vendedores de BI



Parece que el año 2004 ha sido uno de los mejores en los últimos tiempos para los vendedores de software Business Intelligence. De esos datos y de sus previsiones, se desprende que 2005 puede ser un año todavía mejor. Vayamos por partes:

Business Objects ha presentado unos datos de $925.6 million para el 2004 que es un 65% más que en el 2003.
SAS obtuvo $1.5 billion en el conjunto del año, lo que supone un 15 % de incremento sobre el 2003.
Pero no son los únicos: MicroStrategy sorprendió a Wall Street declarando un 39% de incremento en las ventas para el último quarter. Ascential Software e Informatica informaron de crecimientos del 21% y del 7% respectivamente para los ingresos del cuarto trimestr, respecto al mismo periodo del 2003. Y, finalmente, las ventas de Hyperion's crecieron un 13% en este mismo último trimestre.
Además de todo ésto. Forrester Research , ha realizado un estudio entre más de 1300 decision makers (CIO´s y otros) en donde dicen que piensan elevar sus gastos en IT y se muestran optimistas respecto a la evolución del año 2005.

En definitiva, el incremento de regulaciones por las nuevas normas contables y la cantidad de información a manejar, entre otros factores, hace que muchos consideren una de sus prioridades invertir en productos BI.

Tags: BO, SAS, Microstrategy, Ascential, Informatica, Hyperion, Estudios

¿Se puede conectar Oracle Bi Beans con Microsoft XMLA Povider?



Y la respuesta es.... si!! ¿Cómo? Oracle siempre ha sido bastante hostil al stadard XMLA. Por lo tanto es muy interesante ver como interactua Oracle con las MDX queries.
Es interesante ver como podemos acceder a datos dentro del componente Bi bean a través de una MDX query.

Aunque si de verdad, quereis enteraros del procedimiento acudir a: http://www.rittman.net/archives/001190.html

18 may. 2005

Herramienta Data Model gratuita



Esta herramienta puede ayudar mucho a los DBA´s y a los desarrolladores. Tanto si tienes que hacer reingenieria inversa, como manejar modelos con un gran número de tablas, esta herramienta te será muy útil.

DBDesigner 4 es un sistema de diseño visual de base de datos que integra el diseño, modelado, creación y mantenimiento en un sólo entorno. Combina características profesionales y un interfaz muy claro y simple para ofrecer la manera más eficiente de manejar bases de datos.
Para que os situeis, es similar a herramientas como Oracle's Designer, IBM's Rational Rose, Computer Associates's ERwin and theKompany's DataArchitect, pero es Open Source, con lo que podemos trabajar de forma gratuita con él.

Características:

- Soporta multiples tipos de bases de datos.
- Agradable aspecto visual para el diseño.
- Un modo de query muy sencillo mediante clicks sobre los objetos.
- Reingenieria inversa.
- Exportar una imagen del modelo, para compartirla o publicarla.
- Disponible en Linux y MS Windows.
- Muchas características de diseño son muy intuitivas.

SAS amplia horizontes.



Tradicionalmente SAS Institute Inc, había tenido una profunda tradicón en sus herramientas de Data Mining y de análisis predicitivo. Sin embargo, recientemente han aprovecha su reunión de usuarios para presentar la renovada Suite SAS 9, que hace hincapié en muchos más componentes del área Business Intelligence.

La nueva Suite SAS 9, incluye más de 125 nuevas mejoras, pero lo que es más interesante es que pone realmente el foco en el área de OLAP, proporcionando un nuevo OLAP Server y un nuevo OLAP client.
El porqué SAS se lanza ahora a un mercado ya bastante maduro como es OLAP, parece una incógnita, aunque ellos comentan que es 'ahora' el momento, una vez pasada la burbuja de las dotcom.
En la nueva suite SAS 9 cabe destacar también, la integración con el ArcGIS server de ESRI.

Con esta nueva estrategía, SAS, se pone a la par en la carrera por ganar cuota de mercado de empresas como Cognos y Business Objetcs.
Será interesante ver en el futuro como se desarrolla esta carrera.

Tags: SAS, ESRI

17 may. 2005

Las claves de la Calidad de los Datos en BI



El tema de la calidad de los datos siempre es considerado como algo importante, pero nadie sabe a ciencia cierta como reducir al mínimo esa gran cantidad de datos erróneos, obsoletos, etc...
Se habla de mantener un umbral o nivel bajo de errores para poder considerar que los datos tienen suficiente calidad para denominarlos como apropiados.
Este límite o umbral no deja de ser bastante subjetivo, para que nos vamos a engañar.

Para conseguir una exitosa estrategia en la calidad de los datos se necesita prestar atención a ciertos aspectos que podemos considerar como críticos:( via
Claudia Imhoff):


  • Analizar e identificar los datos: es el punto de partida clave para el éxito. Se trata de ver cómo de completos son los datos y como de ajustados y exactos a la realidad de la compañía.
  • Calidad de los datos: se trata de ver las técnicas que manejamos para identificar los datos erróneos, cuanta información errónea existe y las causas de esas deficiencias.
  • Integración de los datos: Básicamente es recoger toda la información de fuentes diversas e integrarlas en un único lugar común. El problema surge cuando vemos que existe mucha información duplicada en diferentes lugares o con nombre parecidos. Se hace preciso standarizar todo el proceso.
  • Enriquecer los datos: Aquí se trata de añadir información de fuera de los actuales sistemas operacionales (de terceros, competencia, estudios de mercado, no tabulados, etc..)
  • Monitorización de los datos: Realizar una correcta gestión de la calidad de los datos requiere un gran esfuerzo operativo y económico. Por ello, es necesario establecer un sistema que nos identificque las mejoras, nos establezca alertas y audite los resultados.

Desde aquí podeis ver un excelente web seminar de Claudia sobre Data Integration:

Tags: Teoria

OLAP en PocketPC


Seguro que muchos de los que habeis tenido que hacer una demo en los clientes. Después de contarles que vuestro producto funciona en todos los entornos, incluidas las PDA´s, os hubiera gustado hacerles una buena demostración para dejarles con la boca abierta.
Sin embargo, ésto casi nuca se hace. Debido fundamentalmente a limitaciones del interface, de rendimiento, visualización, manejo, desarrollo de prototipos, etc..
Es una pequeña desilusión no poder mostrar todo el potencial de los entrornos OLAP.

Sin embargo, un pequeño ejemplo que contradice ésto es PocketAnalytix (producto de European Management Systems) , que funciona muy bien contra cubos de Microsoft Analysis Services. Además se acaba de sacar una versión .net. Y, a diferencia de otros productos, tenemos una amplia ionformación técnica que podemos consultar en el website.

Pocket Analytics, puede ser descargado desde aquí: http://www.euroman.co.uk/pcktindex.html

Tags: Microsoft

15 may. 2005

Google busca un BI (Business Intelligence) Reporting Engineer



No tiene mala pinta el trabajo. Estaría localizado en Mountain Valley (en California !!).
Se trata de encontrar a alguien que lidere todo el esfuerzo para crear el Reporting Corporativo. Además se encargará de identificar las herramientas Business Intelligence que darán soporte a los usuarios.
Como rasgos generales piden que la persona en cuestión esté acostumbrada a trabajar en entornos dinámicos (claro, es google) y con vocación de servicio. Hasta aquí lo correcto.

Las expecificaciones exactas son las siguientes. Os la pongo en inglés, para que no haya equivocos. Que aunque en California, con el español te puedes defender perfectamente, seguro que a Larry Page y Sergey Brin les gusta que supieras inglés.

Experience and Attributes Desired:

- BS/MS in Computer Science or equivalent.
- 3-5 years of experience in MicroStrategy development.
- Proven experience in a high service level environment.
- Ability to adapt quickly in a rapidly changing environment.
- Strong interpersonal, communication and client facing skills.
- Ability to work closely with users.
- Experience coaching business users in report development.
- Experience with Netezza a strong plus.
- Experience with Java is required.
- Past experience in a large-scale, custom-developed, e-commerce environment with high availability.


Contacto: Hay que mandar un mail a esta dirección con vuestro CV en word o HTML a craigslistjobs@google.com.
En el subject poner: BI (Business Intelligence) Reporting Engineer - Mountain View.

Buena suerte.

13 may. 2005

Oracle y PeopleSoft. ¿Qué pasa con el CRM?



Desde que se anunció la adquisición de PeopleSoft- JDEdwards, por parte de Oracle, mucho se ha hablado de las implicaciones que en el mercado de las aplicaciones financieras (ERP), podría tener este hecho.
Sin embargo, desde el punto de vista del CRM se ha hablado menos.
De la adquisición se pueden derivar dos situaciones:
De una parte, gracias a la base de clientes CRM de PeopleSoft, Oracle puede pasar a convertirse en un claro competidor en este terreno, que hasta ahora se le resistía y que estaba claramente en manos de Siebel y SAP.
Pero por otra parte, muchos antiguos usuarios de PeopleSoft y JDEdwards que nunca han visto con buenos ojos a Oracle, podrían cambiar de producto y que caer en alguna de las agresivas ofertas comerciales que están realizando Siebel, SAP, Salesforce.com y otros vendedores CRM.

Por tanto, habrá que esperar para ver como se libra la batalla en este mercado, del que se ha hablado menos que del de ERP.

Para Saber más: Oracle and PeopleSoft: The CRM Angle

Tags: Oracle, CRM

11 may. 2005

Buscando una plataforma DW gratuita



¿Alguien cree posible montar toda una plataforma DW de forma gratuita?. No me refiero sólo a una parte, sino a todo el conjunto.
En estos momentos, montar un entorno DataWarehouse no es nada barato. El coste de las licencias es enorme, tanto para las herramientas ETL, la base de datos, las herramientas de análisis y reporting, etc...

Lo que hay que plantearse es si esta pregunta que hago es realísta o no. Parece ser que no vamos desencaminados, por que por ejemplo, Business Objects anunció que Crystal Reports Enterprise 10 esta totalmente certificada con Red Hat Linux, y algo parecido han hecho IBM e Hyperion.

El objetivo, por tanto es poder montar un entorno con DW con software gratuito que de respuesta a:
1) Sistema Operativo
2) Base de Datos
3) ETL (extract, transform and load)
4) reporting, OLAP y business intelligence software

Ya se están empezando a dar algunos pasos alrededor de MySQL, el proyecto Mondrian, JPivot, DataSift, Octopus and CloverETL.....
Ya iremos comentando más en detalle la apasionante búsqueda del DW gratuito.

Para saber más: ReportDude
Tags: Destacado

10 may. 2005

Mendocino, donde se juntan SAP y Microsoft

¿Qué es lo que, por mucho que digan los detractores de Microsoft, tienen como clara ventaja competitiva? Esto es din duda el 'Easy to use' (facil de usar) entorno de usuario de sus aplicaciones. Eso mismo es de lo que carecen muchos de sus competidores.
Uno de ellos, ha decidido aparacar de momento las diferencias, pensando en que hay otros rivales más directos, (Oracle) y aliarse para lanzar un nuevo producto, que combine las potencialidades de ámbas. Sinergia le llaman a eso.



Mendocino es un condado de California.

SAP y Microsoft consideran que Mendocino mejorará la eficacia de los trabajadores de la información que utiliza Microsoft Office como su principal entorno de trabajo (es decir, casi todos), y ayudará a los trabajadores a evitar malgastar tiempo y esfuerzo buscando información corporativa importante, de modo que puedan ser más operativos y no sea necesario aprender diferentes aplicaciones y metodologías según sea el fabricante.
Según los términos de este acuerdo, (comerciales, ya que no han dicho nada de los financieros), ambas compañías venderán el producto, de modo que la compañía alemana venderá Microsoft Office y Microsoft venderá licencias de la plataforma de proceso de negocio de SAP (ERP).
El nuevo producto podrá ser utilizado por "clientes selectos" en el cuarto trimestre de 2005, y el grupo Siemens VDO será uno de los primeros en hacer uso de él.

Debo reconocer como será Mendocino. Se parecerá a excell, a powe point....
Es una apuesta clara en contra de IBM y Oracle. Veremos como responden, aunque en mi opinión, un nuevo interfaz de usuario no se genera de la noche a la mañana.

Para saber más: http://dssresources.com/news/739.php

Tags: Microsoft, SAP

9 may. 2005

Consejos de Ralph Kimball

Hacer foco en los procesos, no en en los departamentos de la compañía.

Una de las mayores mentiras que existen en la construcción de Data Marts, es considerarlos unidos a un departamento. Y crear un Data Mart de Ventas, Data Mart de Marketing, Data Mart Financiero... cuando, en realidad, si analizamos un poco sus indicadores vemos que son comunes: ventas, margenes, costes. Lo mismo ocurre con las dimensiones: productos, areas de negocio, distribuidores...
Por tanto, lo mejor es considerar los procesos de negocio, así evitamos duplicar datos. Esto siempre es lo más eficiente para un Data Warehouse. Reducimos costes y tiempo de implementación.

Obviamente, pueden existitr intereses de proyecto que hacen decantarse por Data Mart departamentales: sponsors del proyecto, tecnología usada, alcance y presupuesto del mismo... pero desde el punto de vista técnico no dejará de ser un error.
Finalmente, para identificar correctamente estos procesos de negocio será necesario realizar amplias sesiones de entrevstas con los usuarios finales, que serán los que nos den esa información.

Información de Ralph Kimball


Tags: Teoria

8 may. 2005

Premios 2005 de Intelligent Enterprise



El prestigioso portal especializado en Business Intelliegence, DW, etc..: Intelligent Enterprise ha elegido, por séptimo año consecutivo quienes son a su juicio los mejores productos para cada una de las doce categorías seleccionadas.
No deja de ser una decisión de los editores, aunque bien apoyada en su conocimiento del sector y en las conversaciones con directivos, vendedores y clientes. Por lo que yo la tomaría muy en serio. Seguro, que existen muchos productos que no os suenasn mucho. Son soluciones novedosas o especializadas. Es un buen momento para tomar contacto con ellas.

Para cada una de las categorías eligen quien es el mejor, pero también dejan la puerta abierta a otros, que podríamos llmar 'finalistas' o 'a tener en cuenta':



Categorías:

Information Strategy
Winner: IBM
A seguir: Amber Point, EMC, Microsoft, Stellent

Enterprise Applications
Winner: SAP
A seguir: E.piphany, Oracle, Siebel Systems, Silvon

Application Integration
Winner: Tibco
A seguir: Ascential, BEA systems, Cape Clear, Sonic

Business Intelligence
Winner: Business Objects
A seguir: Information Builders, Microstrategy, Qliktech, ProClarity

Performance Management
Winner: Cognos
A seguir: ArcPlan, Applix, Hyperion, OutllokSoft

Business Execution
Winner: Filenet
A seguir: Action, IDS Scheer, Metasstor, Savvion

Customer Intelligence
Winner: NCR/Teradata
A seguir: Netezza, SpotFire, SPSS, Unica

Information Management
Winner: Metamatrix
A seguir: Informatica, Kalido, Pervasive, Embarcadero

Application Management
Winner: Mercury
A seguir: BMC, Cast, Compuiter Associates, Popkin

The Vanguard
Winner: Fair Isaac
A seguir: Celequest, Guardium, Ilog, Kxen

On-Demand Leadership
Winner: Salesforce.com
A seguir: Omniture, RightNow Technologies, Nsite, Grand Central Communications

Unstructured Intelligence
Winner: SAS
A seguir: Adobe, Autonomy, Mark Logic, Verity

Tags: Destacado

7 may. 2005

Consecuencias de la adquisición de Ascential por IBM

. .

Hace un tiempo las herramientas de carga (ETL), tenían mucha menos visibilidad que en la actualidad. No dejaban de ser herramientas de back-end, mucho menos llamativas que las elegantes herramientas de análisis, reporting, web portal, dashboards, Balance Scorecard, etc...
Sin embargo, cada vez van tomando más importancia estas herramientas. Buena prueba de ello, es la reciente adquisicón de Ascential por IBM.

Antes de la adquisición, Ascential se había situado como uno de los grandes jugadores en el mercado de las ETL, en dura competencia con Informatica. A diferencia de ésta estaba claramente especializada en ETL, y no quería saber nada de OLAP, BI, etc... Tenía una buena red de grandes partners: Teradata, PeopleSoft, Business Objects...
La aparición de IBM, puede hacer que se replanteen algunos de éstos acuerdos. El de Teradata es el más evidente. Teradata no tiene una herramienta ETL propia y, aunque trabaja mucho con Ascential podría cambiar. Business Objects esta desarrollando su propia herramienta ETL y de PeopleSoft que voy a decir, ahora que ha caido en manos de Oracle.

A todo ésto hay que añadir que otras empresas como Cognos y SAS (esta muy relacionada tradicionalmente con IBM) tienen sus propias herramientas ETL y que los fabricantes de Bases de Datos tienen sus propias y 'recomendadas herramientas' (Oracle, Warehouse Builder y Microsoft, Data Transformation Services).
Será interesante ver si Ascential se diluye en la nebulosa de IBM o mantiene su propia vida más allá de la adquisición. Por que a fin de cuentas, el producto era bueno y estaba ampliamente extendido.

Para saber más:
With Ascential Acquisition, IBM Becomes Data Integration Powerhouse
Examining the Aftershocks of IBM's Ascential Acquisition

Tags: IBM, ETL

4 may. 2005

Primer error en un proyecto DW: Confiar 'demasiado' en los consultores



En muchas compañías, es habitual emplear a expertos exteriores para que ayuden en un proyecto importante de DW o Business Intelligence en ejecuciónn, tal como una migración del Datawarehouse o del sistema transaccional. Esto se hace a menudo porque tales proyectos son relativamente a "corto plazo," durando 1-2 años, y emplear contratistas exteriores evita el costo a largo plazo de un empleado a tiempo completo. También ayuda a conseguir un proyecto exitoso traer consultores que son expertos en su materia, entrenados, que pueden conseguir que el proyecto avance rápidamente, y producir así resultados en un tiempo-marco lo más corto que sea posible. Esto siempre será más rápido que entrenando al personal existente de la empresa. Además, los trabajadores existentes tienen típicamente responsabilidades existentes que deban manejar mientras que el proyecto está en curso.
¿Suena bastante bien hasta ahora, eh?


El problema viene, no porque contratemos a consultores externos; ya que eso se puede considerar como útil. El problema viene cuando el negocio desarrolla demasiada confianza en los consultores o los contratistas y no deja la maestría necesaria "en casa." Se debe recordar que cerca de 20% del coste de un proyecto de DW es sólo en la puesta en práctica inicial, y que el resto del coste viene de su gerencia en curso sobre la vida del proyecto.

Es vital importante que los encargados de DW comiencen, desde el principio del proyecto, a tomar la propiedad del producto final. Incluso si el desarrollo entero es de outsourcing como contrato a "precio fijo".
Si no se hace, se terminará por pagar los nuevos chalets de vacaciones de los consultores durante los siguientes años, en vez de cosechar para la propia empresa las recompensas del proyecto de DW.


Tags: Proyectos, Consultores

El mercado del Data Storage crecerá un 35% en 2005

Según Info-Tech Research Group, (www.infotech.com/san), el almacenamiento de datos es la prioridad número uno para las empresas de tamaño medio-grande en cuanto a sus previsiones de inversión en el 2005.
Storage area networks (SANs) , es el principal área de crecimiento.

Existen varias razones desde el punto de vista de negocio:

  • E-Business/E-Commerce: Las aplicaciones web y el uso masivo de tecnologias como el e-business conducen a una centralización de los procesos y almacenamiento. Y es aquí donde los SAN´s pueden proporcionar una mayor velocidad y eficiencia.
  • SAN´s se adapta mejor a los nuevos requerimientos y disposiciones en cuanto a seguridad y normativas.
  • Proporcionan la solución adecuada para la continuidad del negocio y la recuperación de fallos (el famoso Recovery Disaster)

En esta imagen tomada del estudio de Infotech se ve como estan ubicados los productos de las principales compañías según su adecuación a los clientes medianos y grandes:



Las conclusiones del estudio se pueden resumir en las siguientes:

  • Se va a producir una fuerte adopción de esta tecnología en el mid-market, tendencia que se irá acrecentando en el futuro.
  • 2005 seá el año de los IP SAN´s
  • La disponibilidad y la recuperación se considerarán factores críticos.
  • SAN´s serán críticos en las labores de consolidación y reducción de costes y servidores de las empresas.

Aquí podemos acceder a los grandes jugadores en el mercado de los SAN´s.

3 may. 2005

MySQL se acerca a Business Objects

________
Era cuestión de tiempo, que la base de datos 'open source', MySQL, cada vez más extendida y utlizada. empiece a ser considerada por las grandes empresas de Business Intelligence.
Business Objects integrará tecnologías de base de datos de MySQL en su solución para inteligencia de negocio BusinessObjects XI tras la firma de un acuerdo estratégico entre ambas compañías.
Este anuncio se puede considerar sólo como el comienzo de una colaboración más estrecha entre ámbas compañías, de modo que a partir de ahora veremos como los interfaces son cada vez más simlares y la integración de sus metadatos será más evidente.
A mí personalmente, me parece una buena noticia. Se consigue introducir nuevos jugadores en el campo Data Warehouse y eso siempre es positivo para los clientes y los desarrolladores.

La firma del este acuerdo supone que Business Objects integrará las tecnologías de MySQL en BusinessObjects XI para su uso en las plataformas Linux y UNIX, así como la inclusión de MySQL en la lista de bases de datos soportadas por Crystal Reports y BusinessObjects Data Integrator. El acuerdo incluye también la participación de ambas compañías en cada uno de los respectivos programas de partners de la otra.

Para saber más: Business Objects To Integrate With MySQL Open Source Database

Tags: MySql, BO

1 may. 2005

10 predicciones en IT para el 2005



Todos sabemos que hacer predicciones además de presuntuoso es muy arriesgado. En cualquier caso, como el tema vale la pena, os propongo estas diez predicciones de Nari Kannan:

1. Bastantes grandes compañias se fusionarán (o se adquirirán), con lo que los clientes tendrán menos interlocutores.

2. Surgirán nuevas compañías (startup) en Sillicon Valley, pero es probable, que más fuera de allí.

3. Los precios del hardware, redes, networking se reducirá considerablemente.

4. Muchos contratos de Outsourcing, que corresponde ser renovados, tendrán dificultades.

5. La tecnología RFID despegará.

6. Las redes sociales no funcionarán. Existe más gente buscando un contacto, que los que desean ser contactados.

7. Google continuará adelantando a Yahoo en muchos aspectos.

8. Empiezan a aparecer interfaces no basados en browsers. Sobre todo lo usarán las empresas.

9. Por fin una empresa descubre un sistema ideal anti SPAM.

10. Microsoft se hace más fuerte y poderoso, salvo en los browsers, donde Firefox le recorta terreno.

¿Qué os parece? ¿Estáis de acuerdo?

Consejos con grandes dimensiones para Microsoft Analysis Services



- Si tenemos que tratar con dimensiones muy grandes y existe una limitación de memoria por parte del acceso del cliente se pueden intercalar el mayor número de niveles intermedios como sea posible, esto hará que el número de miembros que se bajen por sesión se reduzcan al mínimo.

- En la medida de lo posible, intentar crear cubos virtuales para la simulación de combinaciones de cubos. De este modo, también se reducirá el número de elementos que se bajen.

- Los cubos no tienen porque tener el mismo número de elementos que pueden tener los cubos virtuales. Para ello, utilizaremos las funciones MDX como VALIDMEASURE() para resolver las difrencias entre cubos.

Tags: Microsoft