Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso gratuito para aprender Business Intelligence. Plazas limitadas!!

Diseño multidimensional, OLAP, ETL, visualización, open source...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2017

29 mar. 2014

Open Source Business Intelligence Tips in March14

27 mar. 2014

Smart Cities, que son y para que sirven



















Las Smart Cities y todo lo que rodea su expansión: transparencia, tecnología, Open Data, Big Data, Internet de las cosas (IoT), Open Source, ya están aquí y han venido para quedarse.


Telefónica tiene una web que explica y aclara muchos conceptos. Echadle un vistazo aquí: SmartCity Telefónica

Nuestros compañeros de Stratebi también han preparado una presentación sobre Smart Cities y su apoyo en Open Source y Business Intelligence


26 mar. 2014

Big Data Dictionary: From A to Z

21 mar. 2014

Course in London, UK: Business Intelligence Open Source













Including Pentaho, Ctools, Saiku, Big Data and Social Intelligence, this is the best way to learn about this emerging technology

Web with all the information about the course

Target Audience


Information technology professionals, IT managers, BI Consultants, Marketing Professionals, Data architects, Database administrators, Application developers, Business analysts, Enterprise architects and professionals related to technological field.


After success of the trainings performed in Brazil, Colombia, Mexico, Chile and Spain where we reached full capacity, we organise in London, the most complete Open Source Business Intelligence training.

Dates: From 28 April to 1 May 2014

Definitive dates

Limited capacity book now!!!

Prerequisites


Basic SQL Skills, SQL scripts will be distributed among the students. The course will be taught in English. 

Target


The main objective is teaching students to build a Business Intelligence (BI) system ready for data analysis using Pentaho the open source business intelligence tool.

Furthermore, an introduction to Social Intelligence and Big Data will be performed

Training Contents (view detail)



Integracion SugarCRM y Pentaho


Una de las grandes ventajas de usar soluciones Open Source, es la posibilidad de integrarla con otras herramientas líderes Open Source. Hoy os contamos la solución que hemos creado, que permite aunar las posibilidades del SugarCRM con la capacidad analítica de informes, cubos y cuadros de mando de Pentaho

Ver Solucion SugarCRM con Pentaho

SugarCRM es el mejor CRM Open Source del mercado, incrementa la eficiencia de los equipos de ventas permitiendo a los comerciales controlar, compartir, y organizar contactos y oportunidades, manteniendo la relación con cuentas nuevas o existentes, facilitando la previsión de ventas de la empresa.


Hemos unido el potencial de SugarCRM con la plataforma y herramientas de BI Pentaho para crear una solución con la que poder analizar los más diversos indicadores de rendimiento (KPIs) de marketing y de relación con los clientes.

Además, puedes cruzar la información con la potente solución Social BI, que permite integrar la actividad social (twitter, facebook...), como información de news, google anlytics, youtube, etc....



Más integraciones:



20 mar. 2014

Las 13 Nuevas Tendencias en Business Intelligence







Interesante charla de nuestro colaborador Emilio Arias, en el reciente OpenAnalytics donde exponía las 13 tendencias que marcarán y están marcando el Business Intelligence 




  • 1. Business Intelligence se ha democratizado
  • 2. Open Data
  • 3. Cambio en el ‘statu quo’ de vendedores
  • 4. Open Source
  • 5. Real Time Analytics
  • 6. Big Data
  • 7. Analytics en las nubes
  • 8. Mobile Analytics
  • 9. Social Intelligence
  • 10. Periodismo y Storytelling de datos
  • 11. Visualizacion
  • 12. Smart Cities
  • 13. Smart Citizens 

Ver la presentación:

 

19 mar. 2014

Sorteo de libros PDI Cookbook 2da Edición

Una gran iniciativa de nuestro amigo Bernabeu R. Dario desde RedOpenBI, la red de los interesados en BI Open Source:

Sorteo de libros


Hemos formado equipo con Packt Publishing y hemos coordinado un nuevo sorteo de e-books, esta vez -como el título nos adelantaba - se trata de Pentaho Data Integration Cookbook - Segunda Edición:


Cómo participar
Es muy simple, debes ver los temas del libro y realizar un comentario en este post contándonos qué tema te interesa más (y adjuntar tu mail).


Condiciones
El concurso se cerrará en 2 semanas de tiempo y serán sorteados 3 ejemplares.

Buenos ejemplos de visualizacion sobre mapas

http://vimeo.com/88638226



Nos han gustado estos ejemplos de visualización sobre mapas de la gente de 422


The Lab 
Samples

18 mar. 2014

El futbol empieza a usar Big Data

  

Parece que también ha llegado el Big Data al Futbol. En el siguiente video, la empresa alemana SAP explica como lo aplica al equipo del 1899 TSG Hoffenheim,de la Bundesliga.

La buena noticia es que también se puede usar tecnología Open Source aplicada a las estadisticas deportivas. Os dejamos un par de ejemplos que hemos creado que os pueden servir de referencia:

Tablero Futbolero y Tablero Champions





17 mar. 2014

Un nuevo curso Business Intelligence Open Source realizado en Chile


Queremos agradecer la gran atención a nuestro curso sobre Business Intelligence Open Source que hemos realizado en Santiago de Chile, como anteriormente ocurrió en España, Brasil, Colombia y México en las diferentes ediciones realizadas en cada país.
En la imagen, foto con buena parte de los asistentes al mismo.

Esperamos convocar nuevas ediciones de nuestros cursos en dichas ciudades, además de incluir algunas nuevas que nos han venido solicitando

16 mar. 2014

Cuando los Telediarios hablan de Big Data

 

Pues sí, este fin de semana en el Telediario de Tele5 hablaron de Busines Intelligence, Big Data, Internet de las cosas, etc... como del 'nuevo petroleo' de nuestra era. El reportaje tenía muchos tópicos y lugares comunes (y no se entraba en detalles técnicos), pero es relevante que llegue hasta los telediarios, lo cual da muestra de la importancia que va adquiriendo.

Muchos de los que nos leeis ya sabéis que el Big Data se ha convertido en la 'moda' del momento. Se habla mucho, pero se hace poco. En este enlace tenéis toda la info y recopilción de posts que venimos publicando

Os dejamos unas imágenes captadas directamente de lo que se vió en televisión y el video del telediario,


Este es el video publicado por Tele5

Big Data

15 mar. 2014

Una nueva version de Data Cleaner

Hace poco hablábamos de Data Quality y comentabamos sobre Data Cleaner. Ahora presenta una versión mejorada.



So... What's new then?
  • You can now compose jobs so that a DataCleaner job actually calls/invokes another "child" job as a single transformation. This is an important feature because it allows users to organize and compose complex data processing flows into smaller chunks of work. The new "Invoke child Analysis Job" transformation inlines the transformation section of the child job at execution time, which means that there is practically no overhead to this approach.
  • As a convenience for the above scenario, it is now allowed to save jobs without any analysis section in them. These jobs will thus be "incomplete", but that might actually be the point when composing and putting jobs together.
  • Another new transformation was added: Coalesce multiple fields. This transformation is useful for scenarios where multiple sets of fields are interchangeable, or when multiple interchangeable transformations produce the same set of fields. The "coalesce" transformation can roughly be translated into "pick the first non-empty values". When there's multiple sets of fields in your data processing stream, for instance multiple address definitions, and you need to select just one, then this is very convenient.
  • The handling of source columns has been simplified. Previously we tried to limit the source queries based upon only the source columns that where strictly needed to perform the analysis. But many users gave us the feedback that this caused trouble because the drill-to-detail information available in the analysis results would then be missing important fields for further exploration. So the power is now in the hands of the users: The fields added in the "Source" section of the job are the fields that will be queried.
  • A change was made to the execution engine in dealing with complex filtering and requirement configurations. Previously, if a component (transformation or analysis) consumed inputs from other components, ALL requirements had to be satisfied, which mostly just causes the requirement to never become true. Now the logic has been changed to be inclusive so that if any of the direct input sources' requirements are satisfied, then the component's inferred requirement is also satisfied. Most users will not notice this change, but it does mean that it is now possible to merge separate filtered data streams back into a single stream.
  • An issue was fixed in the access to repository files. Read/write locking is now in place which avoids access conflicts by different processes.
  • The 'requirement' button in DataCleaner has also been reworked. It did not always properly respond to changes in other panels, but now it is consistent.
  • Finally, the 'About' dialog was improved slightly and now contains more licensing information :-)

We hope you will enjoy this release of DataCleaner. Head over to the downloads page and get your copy now.


How was the old Business Intelligence and Big Data way?

























Via @omalmstrom

12 mar. 2014

Gartner Business Intelligece loosers and winners


Open Source explicado con LEGO

Genial!!

10 mar. 2014

Presentacion de Big Data con soluciones Open Source

Hemos creado, junto a nuestros compañeros de Stratebi una presentación que esperamos os sea de utilidad del gran potencial del Big Data, junto a soluciones open source como Pentaho, MonetDB...

R, Pentaho, Kettle


Buena noticia la cada vez mayor convergencia de Pentaho con cada vez más tecnologías y herramientas. Prueba de ello, es lo vertiginoso que está creciendo el Marketplace de Pentaho, con colaboraciones de todas partes del mundo. Nosotros ya hemos subido las nuestras.

Hoy os queríamos hablar del R Script Executor
 
"This step executes an R script within a PDI transformation. R is a freely available language and environment for statistical computing and graphics which provides a wide variety of statistical and graphical techniques: linear and nonlinear modeling, statistical tests, time series analysis, classification, clustering, etc. Please consult the R project homepage for further information.

The general step functionality is to have stream rows pushed into the R environment as a data frame, have your R script manipulate the data and then convert the data frame back into the stream as output rows."

Hasta hay un grupo R-Pentaho en Redopenbi

Data Mining: Nuevo Taller gratuito de Business Intelligence Open Source

http://www.openanalytics.es/

Después de una gran acogida por parte de la comunidad dedicada a la analítica de datos. Open Analytics lanza su segundo charla/taller del 2014, centrado en Data Mining, organizado en Medialab Prado del Ayuntamiento de Madrid. En el primer taller de 2014 se buscó fomentar el uso de las herramientas OpenSource en el análisis de datos empresariales mediante cortas charlas con ponentes expertos en el campo BI. Ver
Presentaciones y Vídeo.
Talleres e Inscripciones

Después de la buena acogida de más de 80 personas en la jornada de Business Intelligence, volvemos a preparar una jornada de análisis de datos con herramientas Open Source. Esta vez, la temática estrella será el Data Mining o comunmente llamado Minería de Datos. Ciencia que permite descubrir patrones de comportamiento en grandes volúmenes de datos.
En la jornada contaremos con 3 charlas las cuales buscan introducir al oyente en el mundo de la minería de datos con dos herramientas estrellas: R y KNIME. En la charla de KNIME contaremos de nuevo con nuestro amigo Diego García (UNICAN). Para las dos charlas de R contaremos con Carlos Ortega, Pedro Concejero y Alfonso de Uña en representación del grupo de usuarios de R de la comunidad de Madrid. Puedes ver más información:

Introducción
Introducción al evento por OpenAnalytics

Minería de Datos con Knime
Knime es una plataforma de minería de datos que permite el desarrollo de modelos en un entorno visual y amigable. Su desarrollo está bajo licencia GPL y está programado sobre la plataforma Eclipse y Java.En la charla se mostrará cómo realizar un proyecto de minería de datos y análisis con algoritmos conocidos para clasificación, asociación o predicción de datos empresariales. Presentado por Diego García : Ingeniero informático e investigador en la Universidad de Cantabria. Profesor de asignaturas del grado en informática de DataMining, Inteligencia Artificial y Algoritmia. En el campo de la investigación busca detectar patrones de comportamiento en plataformas E-learning para mejorar la docencia. 




R y alRededores.
En la presentación se dará una visión general de lo que es R. Desde sus orígenes a su estado actual. Detallando desde el nivel de madurez que R ha alcanzado, el número de paquetes adicionales, sus capacidades de análisis hasta que documentación, libros y ayudas que existen para introducirse a R. Presentado por Carlos Ortega Linkedin: Licenciado en físicas y vinculado al mundo de la estadística y R por pasión. Es coordinador del grupo de usuarios de R en la comunidad de Madrid y participa activamente en la comunidad de R. Compagina su tiempo colaborando como profesional en diversas empresas como el Banco Santander y es profesor del Master online de CEPADE (UPM). 

Taller R: Los discursos (de Navidad) del Rey
Los discursos de Navidad del Rey (se emiten de forma ininterrumpida desde 1975), ¿qué nos puede decir la lingüística acerca de ellos? ¿y desde un punto de vista estadístico? ¿aparece toda la sociedad española representada? ¿evolucionan en el tiempo?  Presentado por: Carlos Ortega Pedro Concejero Cerezo Miembro de Telefónica I+D y profesor asociado de la Universidad Complutense de Madrid. Gracias a R a conseguido crecer como profesional dentro del campo del análisis de datos, como realizar análisis de redes sociales, clasificación de textos, etcs.  Alfonso de Uña Linkedin  Ingeniero informático de profesión centrado en el procesamiento de datos desde diferentes tecnologías, análisis y visualización. Compagina su pasión por la analítica con ser formador en tecnologías Java