Curso recomendado

lunes, 28 de febrero de 2011

Data Mining - Knime se alia con consultoras

Unas de las máximas de los vendedores de herramientas de análisis de datos es que la venta de su herramienta si no va acompañada de consultoría especifica es muy difícil, y más si esta herramienta es nueva y más todavía en un campo tan técnico como el de la modelización y el análisis de datos.

Esto ya pasó antiguamente con las grandes, SPSS y SAS, que ya fuera vía alianza con una consultora o creando un departamento propio que se encargara de la consultoría.

Creo que mirando este punto Knime se ha aliado con Dymatrix para enlanzandose con una herramienta propia se pueda automatizar el entreno de los modelos de minería de datos, por otro lado Dymatrix también permite también enlazarse con Adapa de Zementis (una herramienta sobre la que hace ya meses que quiero hablar), encargándose esta última de dar un soporte a la explotación de los modelos, ya sea en la nuve o sobre el hardware que tenga la compañía.

La verdad es que lo de automatizar el analítico siempre ha sido un caballo de batalla de diferentes consultoras, por mi experiencia, es posible, pero siempre que esté supervisado por un técnico, ya que muchas veces las necesidades de las compañías cambian con el tiempo y este tipo de desarrollos se encarga de mantener los modelos definidos de inicio. De todas maneras siempre es interesante que diferentes empresas interactúen entre ellas para dar un mejor servicio, y sobre todo que se poco a poco existan herramientas que utilicen el PMML de una manera óptima, haciendo que no sea necesario la herramienta de análisis, normalmente tremendamente cara, a la hora de la explotación.

miércoles, 23 de febrero de 2011

Data Mining - Empresa brasileña de motores de recomendación

Trasteando por la red he encontrado una empresa Brasileña de motores de recomendación Chaordic Systems.

Por lo que he podido ver esta totalmente orientada a este tema, aunque también parece que hace minería clásica orientada a la venta. Desde aquí les deseo toda la suerte posible y que tengan un gran futuro... eso si, a ver si traducen la web.

Lo mejor es que poco a poco van surgiendo empresas que cubran este tipo de necesidas, lo peor, es que aquí no surjan empresas como estas que tienen un potencial increible...

lunes, 21 de febrero de 2011

Data Mining - MADlib libreria para hacer Data Mining en BBDD

Ya cada vez más tenemos todo tipo de iniciativas, la última y que más me ha llamado la atención es MADlib.

Hace ya unos años todas las empresas de BBDD añadieron algoritmos de minería a sus distribuciones, me acuerdo que teníamos más de una discusión sobre si era por que quería orientarse la empresa al analítico o por el hecho que sus divisiones de analítico no habían conseguido cuajar y aprobechaban el trabajo hecho dando alguna funcionalidad más a sus productos estrella; la verdad es que no he visto ningún proyecto de analítico que tuviera como soporte este tipo de software...

Ahora con MADlib tenemos más o menos lo mismo pero en software libre, una librería para hacer en BBDD, en concreto parece que en principio la BBDD GPL que lo soporta es PostgresSQL, aunque parece que también soportará a Greenplum, una BBDD propietaria que no tenía este tipo de servicios; en si parece que Greenplum se ha asociado con "Data Research Group" de la universidad de Berkely para desarrollar esta funcionalidad.

En lo que respecta a la utilidad, pues la verdad dudo que llegue a suplir la necesidad de algún software de análisis de datos a la hora de construir modelos, sinceramente considero mucho más interesante tener la capacidad de explotarlos, es decir, de importar modelo en PMML y explotarlo y no me extrañaría nada que al final esta herramienta se le añadiera esta capacidad, es más, creo que es un objetivo final ya que está en una fase muy inicial de desarrollo y todavía no se sabe hacia donde derivará.

Siceramente si al final es capaz de explotar PMML, si se le da soporte a más BBDD (uno de los puntos donde dicen que tienen que crecer) podría convertirse en una herramienta muy interesante dentro del mundo GPL, si no coge este camino dudo que tengamos más noticias sobre él.

martes, 15 de febrero de 2011

Geomarketing - Segmentación de Precios (Blog de marketisimo)

Acabo de leer el post de "Cómo incrementar las ventas segmentando los precios" del Blog de Marketisimo.

En el post nos cuentan siete estrategias para la segmentación de precios y la repercusión en el beneficio. Creo que en todas de ellas se puede buscar una relación con el mundo del geomarketing, os dejo algunas reflexiones de algunas de ellas, que estoy seguro que podéis completar con más opiniones.

Estr.1. Carácterísticas del consumidor. Incide en variables demográficas que influye en el proceso de compra y sensibilidad al precio con el uso de cupones. Como comentan en el post, la ocupación o la edad son importantes para ofrecer precios diferentes de un mismo producto, cada segmento un precio, ¿pero como lo aplicamos en el punto de venta? Analizando localmente en cada punto de venta estos segmentos, y adecuando no el precio del producto a un segmento simplemente, si no la oferta a cada punto de venta. Es evidente que para adecuar tu oferta a cada segmento, tienes/debes que conocer a los consumidores que te rodean, que van o que pasan por tus diferentes puntos de venta, e incluso segmentar éstos para adecuarlos a los segmentos de consumidores. He aquí un gran ventaja para las empresas el uso del geomarketing para conocer a sus consumidores y adecuar su oferta.

Estr.2. Lugar de Compra. Hace referencia al nivel competencial, adecuando los precios según la competencia en el lugar de compra. Creo que este punto es el más claro en la relación con el geomarketing, aunque se puede hilar más fino, analizando la competencia, su impacto, cuotas, y marca, cosas muy sencillas de analizar con el geomarketing y muy estudiado en el mundo del retail y cadenas de distribución.

Estr.3. Momento de compra. Explican el uso de series temporales para la predicción de compra de billetes de aerolíneas. Que decir tiene la importancia del data mining para este tipo de estrategias. También con el geomarketing podemos analizar a partir del punto de venta como puede evolucionar o como podemos segmentar nuestro negocio.






domingo, 13 de febrero de 2011

Data Mining - Entrevista al creador de los motores de recomendación.

Si os hablo de Andreas S. Weigend se muy posible que nos os despierte nada ese nombre, pero si os digo que fue el creador del motor de recomendación de Amazon, la cosa ya toma otro color.

Este señor no contento con crear, bajo mi punto de vista, el primer motor de recomendación funcional en la web, en el 2004 se desvincula de Amazon y se pone por su cuenta a "estudiar la gente y los datos que generan", ¿tendremos que acunar esta frase a la hora de definir nuestro trabajo? yo la verdad creo que es muy acertada.

En la entrevista que le hacen en el blog del pais nos habla sobre el futuro del análisis de la información, donde parece que cree que el móvil será el nuevo captador de información de calidad y útil.

Esta opinión suya en un principio me hizo dudar un poco, ¿móvil? estoy acostumbrado a trabajar con increíbles cantidades de variables de individuos, pero ¿trabajar con redes de relaciones?... no lo tenía del todo claro. Luego el maestro lo aclaró, el móvil sabe donde estamos en cada momento, que páginas vemos, a que mensajes les prestamos atención, si cogemos un tlf a una persona o no, el tono de nuestra voz, que aplicaciónes nos interesan... y un largo ect.

La verdad es que tiene toda la razón del mundo, pero hay un pero, la gente que tiene un móvil para llamar y punto, en la cual me incluyo, no creo que el móvil sea tan importante, por lo tanto creo que este tipo de mediciones tendrá una importancia en la gente más geek, pero en el resto de los mortales yo no lo tengo tan claro.

De todas maneras el maestro ha hablado estoy seguro que en el futuro, cuando los móviles sean medios de pago extendidos y todo el mundo pueda permitirse un móvil con conexión a internet técnicas diseñada para estudiar las redes de relaciones que se generen serán muy necesarias.

Y vosotros que opinais?

jueves, 3 de febrero de 2011

Data Mining - SAS contra las cuerdas por Pentaho

Que los enanos que le estaban creciendo a SAS están ya en la universidad y que apuntan maneras no es ningún secreto, en concreo tenemos a WPS, que según nuestro compañero Raúl Vaquerizo del blog Análisis y Decisión nos permitiría una migración a una solución mucho más barata es totalmente factible y que conste que Raúl es un experto en SAS.

Por otro lado nos tramos noticias como la siguiente donde nos van haciendo una analogía entre SAS y el mundo del software libre; hya un punto muy interesante que es la comparación de la posición de Microsoft con respecto a Linux, donde Bill Gates decía que el software libre no cubría las necesidades de un usuario profesional y que sería sólo utilizado por aficionados; lo mismo pasó cuando surgieron las bases de datos libres... ya ahora es SAS que el software libre no se puede utilizar en su negocio...

Es muy intereante la gráfica sobre el nivel de búsquedas de SAS frente a Pentaho que nos encontramos en el articulo antes mencionado; si fuera el CEO de SAS estaría muy pero que muy preocupado.

Es cierto que a nivel profesional sólo SPSS (o IBM) puede competir con SAS a nivel analítico, que los clientes de SAS normalmente son clientes que búscan un software analítico y que esto todavía lo tiene que mejorar mucho Pentaho (también hay que recordar que adquirio WEKA por lo tanto está en ello), pero también es cierto que hay otras soluciones para suplir ahora mismo esta deficiencia, el siempre comentado R, y si no recuerdo mal estaban trabajando en enlazar R con Pentaho con algún resultado ya.

Por otro lado recordar que también se puede utilizar soluciones muy comentadas en este blog como son Knime y Rapidminer para solucionar la parte de minería de datos dejando Pentaho para temas de reporting, cubos, carga de BBDD...

Primero fueron los sistemas operativos, luego las BBDD, continuaron con los desarrollos de middlware... parece que ahora ya le toca al BI y a los desarrollos analíticos ¿no creéis?