Curso recomendado

lunes, 22 de junio de 2009

Data Mining - Novedades de Clementine 13

En esta nueva versión de clementine nos encontramos que se ha incluido un algoritmo que echaba mucho en falta, K-Nearest Neighbor, algoritmo clásico y bastante sencillo que muchas veces se utiliza para rellenar valores nulos durante el preproceso; pero, sin lugar a dudas, lo más importante de esta versión es la capacidad de poner notas en los streams.

Esta pequeña funcionalidad es una reivindicación que muchas personas me han comentado que echaban a faltar, por qué no nos engañemos, Clementine no es una de la herramientas más utilizadas en Minería de Datos por sus algoritmos, velocidad o precisión sino por haber acercado el análisis de datos a un público más global y mejorado la productividad debido a su amigable interface y al poder realizar en un mismo entorno el análisis de datos, el proceso ETL y la modelización, podríamos decir que ha sido el Windows de la Minería de datos.

Con esta funcionalidad será mucho más sencillo documentar procesos, os dejo aquí un enlace con un video de esta funcionalidad en uso y aquí página con la lista completa de mejoras de esta versión.

Por último comentar que ha habido un cambio global en la nomenclatura de los productos de SPSS, a partir de ahora Clementine se llamará PASW Modeler… con lo bonito que era Clementine…

No hay comentarios: