Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Pentaho Course in UK: April, 2014, London

Want to learn how to develop BI Open Source? Take this opportunity to learn from the experts

Pentaho 5. Un gran salto

Ya se ha lanzado Pentaho 5 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

OpenAnalytics 2014. Talleres de BI, DataMining y Big Data

Después de la gran acogida del evento de 2013, nos lanzamos a organizar talleres y charlas durante todo el año para concluir con el evento en Octubre 2014.

12 de septiembre de 2014

ColBI 2014, Segundo Congreso colombiando de Inteligencia de Negocios


Hemos tenido la suerte de ser invitados a participar en uno de los principales eventos de Business Intelligence en America Latina, por lo cual estamos muy agradecidos de poder están en Medellín en este importante evento.

Agenda

La Universidad Pontificia Bolivariana, a través de su Especialización en Inteligencia de Negocios, presenta la segunda versión del congreso de inteligencia de negocios realizado en Colombia. 

Esta iniciativa busca fortalecer la capacidad de gestión estratégica de información en las organizaciones, así como el desarrollo de relaciones e intercambio de experiencias entre los participantes.

Esta vez centra su temática alrededor de los temas de mayor actualidad dentro de la Inteligencia de Negocios: Big Data y Business Analytics. Para esto trae a reconocidos expertos internacionales y nacionales que presentarán temas acerca de su valor empresarial, forma de implementación, tendencias futuras, minería sobre textos, imágenes, vídeos y archivos de sonido, cuidados que deben tenerse, casos de éxito, entre otros.

Adicionalmente, se realizarán presentaciones de las distintas propuestas tecnológicas existentes en nuestro país, en donde se tendrá la oportunidad de conocer a los principales proveedores de las mismas.

9 de septiembre de 2014

Data science, analytics, big data, visualization books

Gran recopilación de Vincent Granville en esta entrada:
  1. Implementing Analytics
  2. Visualizing Data
  3. Data Mining Discovering and Visualizing Patterns with Python
  4. Data Science for Business
  5. A Concise Guide to Compositional Data Analysis
  6. Alternative Methods of Regression
  7. How Algorithms Came to Rule Our World
  8. Machine Learning and Statistics, by Lion Solver
  9. Applied Data Science | Columbia University Course
  10. Analyzing the Analyzers
  11. Two books on programming interviews
  12. Forecasting: principles and practice
  13. Big Data Journal
  14. Three data science journals
  15. Practical Data Science with R
  16. Machine Learning plus Intelligent Optimization
  17. Advanced Database Marketing
  18. Predictive Analytics: Microsoft Excel
  19. Two new data science books from CRC Press
  20. Delivering Business Analytics: Practical Guidelines for Best Practice
  21. Secrets of the Big Data Revolution
  22. My O'Reilly book collection
  23. I could not resist adding this book
  24. Two new books on data analysis with open source
  25. 60 statistics textbooks
  26. 5 books on data visualization
  27. Forbes' recommended list
  28. Naked Statistics: Stripping the Dread from the Data
  29. Business Analytics: A Practitioner's Guide
  30. SAS Books
  31. A Practitioner's Guide to Business Analytics
  32. Mining of Massive Data Sets
  33. Two interesting books
  34. Hadoop in Practice
  35. Improving Accuracy Through Combining Predictions 
  36. 30 statistics handbooks
  37. Causality
  38. Handbook of Engineering Statistics
  39. 16 books for statistical consultants
  40. Three popular data mining books 
  41. Statistics for Non-Statisticians
  42. A few new books from the CRC Press
  43. New journal: Decision Analytics 
  44. Machine Learning in Action
  45. Big Data - Principles and best practices of scalable realtime data ...
  46. Handbook of Data Intensive Computing
  47. Practical Text Mining and Statistical Analysis for Non-structured T...
  48. New books on design of experiments (DOE)
  49. Data Mining: Concepts and Techniques
  50. Keyword Intelligence: Keyword Research for Search, Social, and Beyond
  51. Journal of Data Science
  52. Data Mining (Wiley / IEEE)
  53. Big Data Now: Current Perspectives from O'Reilly Radar
  54. Great statistics reference book covering a lot of topics
  55. The R Journal
  56. Data Analysis with Open Source Tools
  57. Competing on Analytics: The New Science of Winning
  58. Presenting to Win: The Art of Telling Your Story
  59. Information Visualization
  60. Encyclopedia of Machine Learning
  61. Analyzing Data from Facebook, Twitter, Linkedin, and Other Social M...
  62. Handbook of Natural Language Processing
  63. Mining of Massive Datasets (free)
  64. Business Analytics for Managers
  65. Handbook of Fitting Statistical Distributions with R (1,718 pages)
  66. Data Mining Techniques in CRM: Inside Customer Segmentation
  67. 10 new data mining books from IGI
  68. Handbook of Statistical Analysis and Data Mining Applications

Periodismo de Datos y Visualizacion con Herramientas Open Source

Os incluimos una gran presentación de nuestro compañero Ignacio Bustillo en las recientes II Jornadas de Periodismo de Datos y Open Data, con trucos en el análisis y procesamiento de datos con Open Source



Todavia no conoces Jedox

 

Pues Jedox es nuestra herramienta CPM (Corporate Performance Management), preferida, que además tiene el core (PALO motor multidimensional open source) y una versión gratuita (Jedox Base)

Si quieres conocer más, escribenos (info@stratebi.com) y te haremos una demostración y presentación, además de responder a todas tu dudas

5 de septiembre de 2014

El Libro Verde del Big Data

Mas que recomendable este 'Libro Verde del Big Data' que han creado nuestros compañeros de Stratebi y que os podéis descargar gratuitamente. Bien explicado, con muchos ejemplos y muy práctico

http://www.stratebi.es/todobi/Sep14/Libro_Verde_BigData.pdf


Contenido:

1. Big Data... ¿y esto qué es?
2. Big Data... ¿y esto qué es? Conclusión mundo BI
3. Creando flujos de datos BigData con Kettle
4. Flujos de datos BigData: Hadoop, Hive y Kettle
5. Bases de datos para proyectos BigData
6. Introducción a MongoDB
7. Trabajando con Kettle y MongoDb
8. Amazon S3 y Analítica de datos
9. Introducción a Amazon Elastic MapReduce
10. Kettle BigData: Amazon EMR y S3
11. 9.000.000.000 de elementos en una tabla de hechos 


22 de agosto de 2014

OLAP with Cassandra and Spark


How do you rapidly derive complex insights on top of really big data sets in Cassandra? 

This session draws upon Evan's experience building a distributed, interactive, columnar query engine on top of Cassandra and Spark. 

We will start by surveying the existing query landscape of Cassandra and discuss ways to integrate Cassandra and Spark. 

We will dive into the design and architecture of a fast, column-oriented query architecture for Spark, and why columnar stores are so advantageous for OLAP workloads. I will present a schema for Parquet-like storage of analytical datasets on Cassandra. Find out why Cassandra and Spark are the perfect match for enabling fast, scalable, complex querying and storage of big analytical data.

Now, we reach a way to deploy Big Data (check posts in previous link) with BI solutions like Pentaho, for instance