Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Te presentamos la mejor plataforma de Planificación y Presupuestacion BI

Forecasts, Web and excel-like interface, Mobile Apps, Qlikview, SAP and Salesforce Integration...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 7 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

La mejor oferta de Cusos Open Source

Después de la gran acogida de nuestros Cursos Open Source, eminentemente prácticos, lanzamos las convocatorias de 2016

26 ago. 2010

Comparativa de Algortimos de herramientas Data Mining



El Data Mining, consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.

Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos.

Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
Ver info en Wikipedia.

Desde TodoBI, hemos llevado a cabo un estudio y creado un documento de diferentes herramientas de data mining, algunas open source como weka, otras gratuitas como k-nime o Rapidminer (que también dispone de versión de pago) y otras sobradamente conocidas de pago como SPSS Clementine (llamada PASW desde su adquisición por IBM en enero).

Descargar Comparativa

Comparativa_DM

Dada la gran cantidad de información disponible para casi todas las herramientas seleccionadas, se ha optado por realizar la comparativa solamente de los distintos algoritmos de datamining que integran, dejando a un lado las opciones de pretratamiento, post-procesado y visualización disponibles. Posiblemente ampliemos el documento realizado con esta información más adelante.

A la vista de los resultados obtenidos nos hemos decantado por Weka, ya que además de ser gratuita y de tener el más amplio abanico de algoritmos, se integra perfectamente con pdi (antes kettle), por lo que será sencillo incorporarlo a nuestras soluciones integrales de Bussiness Intelligence.