Curso recomendado

martes, 28 de diciembre de 2010

Data Mining - Documento "Data Mining Map"

Trasteando por la red he encontrado un extraño documento donde se presenta el data mining bastante completito.

Pero lo mas interesante de este documento es que tiene una navegación visual en árbol, es decir, cada una de las ramas y técnicas del data mining están representadas en un árbol, y clikando sobre las diferentes hojas se accede a los documentos explicativos.

Considero que es una manera muy explicita de explicar las diferentes técnicas y pasos que se utilizan dentro de un proyecto; todos conodemos CRIPS-DM y SEMA, pero también es cierto que están ligadas a sus herramientas, detro de este documento podremos ver de manera clara y sencilla los mismo conceptos sin estar atados a una metodología propietaria.

La verdad una forma muy intersante de explicar la materia, os dejo el enlace aquí.

viernes, 24 de diciembre de 2010

Data Mining - Presentación de Machine learning en R

Hola a todos,

hoy os traigo una presentación que ha creado dentro del departamento de I+D de Telefónica donde nos presentan una pequeña introducción desde 0 de R dentro del mundo del Machine Learning.

No es algo nuevo, estoy seguro que si buscamos un poco encontraremos cosas parecidas hechas anteriormente, pero lo que si es remarcable es que es dentro de una empresas privada y en nuestro país.

Os la dejo aquí para que le déis un vistazo.



También aprobecho para desearos felices fiestas a todos.

lunes, 20 de diciembre de 2010

Geomarketing - Geolocalización y Forusquare (3)

De las opiniones que hemos ido vertiendo por los temas de geolocalización y foursquare, el diario catalán "ara" (ahora) en su suplemento de "araemprenem" (ahora emprendemos)  se ha hecho eco de las mismas en un artículo sobre la geolocalización.

Si lo queréis leer aquí lo tenéis, en catalán, pero entendible. Pinchad sobre la foto y se abrirá en google docs.

martes, 14 de diciembre de 2010

Geomarketing - Estudio de transeúntes. City Analytics y Cuende

Si hay algo que cada vez nos interesa más a la hora de abordar un estudio de geomarketing a pequeña escala es el análisis de los transeúntes. Saber cuanta gente pasa por una calle, el tipo de gente, edades, sexos, sus tipologías, horarios puede ser una de las variables más importantes a la hora de abordar una apertura o un cambio de ubicación. 

De este caso recuerdo el de una cadena de bisuteria famosa con un problema en una de sus tiendas en Valencia. La cuestión era que apesar de estar en una buena zona, muy acorde al tipo de tienda, los resultados que estaban obteniendo no eran muy satisfactorios. Analizando el flujo de personas pudimos ver como el tramo de calle donde estaban estaba "cortado", puesto que los flujos de personas se movian en otra dirección al llegar a ese tramo. Moviendo la tienda apenas 100 metros, los resultados fueron instantáneos. 

¿De qué datos disponemos para trabajar los flujos de personas? Actualmente la base de datos de transeúntes más usada el llamado fichero Gogh, que elabora la empresa CUENDE Infometrics. Tradicionalmente se ha venido usando para por ejemplo tarificar los circuitos de publicidad estática en las ciudades, pero cada vez son más las empresas de geomarketing que lo incorporan en sus análisis. La única pega es el precio, algo caro, pero bueno, los precios no son nuestra guerra en el blog. Las características de trabajo de este fichero son (extraído de su página web):

La captura de los desplazamientos se realiza el seguimiento de 5.700 panelistas mediante A-GPS en las áreas metropolitanas de Madrid y Barcelona. En otras poblaciones se recogen los trayectos mediante encuestas realizadas con tablet PC directamente sobre cartografía digital mediante software propio.

Trabajo de Campo:
Ámbito: Principales ciudades mayores de 70.000 habitantes. En las 6 mayores (Madrid, Barcelona, Sevilla, Valencia, Alicante y Bilbao) se incluyen las poblaciones de sus Áreas Metropolitanas con más de 50.000 habitantes.
Universo: Individuos de 14 a 75 años residentes en los municipios de referencia.
Muestra: 21.436 individuos.



Por suerte cada vez hay más iniciativas para el estudio de transeúntes. En el blog de UNICA360 de Guillermo Córdoba han publicado un post sobre city analytics. Podéis leerlo en su blog directamente, un muy buen post de recomendada lectura. Nos ofrecen datos de pasos de personas, vehículos, horario comercial óptimo, etc.





jueves, 9 de diciembre de 2010

Geomarketing - Servicios a emprendedores

Esta semana amanece con tres noticias, bueno no es que sean nuevas, pero es el momento de hablar de ellas. Las tres son servicios a emprendedores marcados en el ámbito del geomarketing, con nuevas aplicaciones on-line, que permiten de manera sencilla obtener datos e informes de zonas para estudiar la viabilidad de negocios, enfocado a los emprendedores que buscan información para sus negocios.

Las herramientas son todas on-line, enfocadas a la venta de informes, con tecnología muy diferente, pero con un resultado muy parecido.

La primera es la herramienta presentada por AXESOR, que compró hace tiempo Data segmento, y que ha englobado la venta de sus servicios bajo el nombre matriz Axesor. Con su herramienta han buscado un canal de venta nuevo a los datos que tradicionalmente han comercializado, sobre todo a nivel de empresas, por lo que no habrá que esperar mucho para que su competidor en este tema, EInforma se ponga manos a la obra con este canal de venta. Básicamente, se trata de una herramienta donde a partir de una dirección, permite realizar áreas sencillas, como un círculo o rectángulo, donde se seleccionan las secciones censales que interesectan con él. La teconología usada es de ESRI, y la verdad es que es muy vistoso. Lo interesante es que puedes usarla gratuitamente, y sólo pagas por los informes que quieres de la zona.


Otra herramienta del estilo viene de la mano de IVER, la empresa que viene desarrollando aplicaciones comerciales de la herramienta gratuita GvSIG. Las herramientas que tienen son GeoMercat en desktop, en web y muy interesante en móvil. Me gustan estos desarrollos en plataformas gratuitas, y más viniendo de Valencia, de donde es uno.


 La tercera herramienta está en desarrollo, y viene de la mano de la empresa SITEP, que ha sido la adjudicataría de un sistema de ayuda a emprendedores para Barcelona Activa.

Data Mining - Interesante post en el blog de Enrique Dans

En el blog de Enrique Dans, blog tremendamente recomendable seas de ámbito que seas, podemos encontramos un interesante post sobre una herramienta de sentiment mining.

Es interesante ver como poco a poco este tipo de herramientas van surgiendo para suplir necesidades de mercado existentes; ya hablamos hace un tiempo de una herramienta española que venía a cubrir la misma necesidad.

Creo firmemente que dentro de un tiempo las grandes empresas dentro del análisis de datos (SAS e IBM) ofrecerán soluciones para este tipo de problema, haciendo que estas soluciones sean mucho más conocidas por el usuario no técnico.





miércoles, 1 de diciembre de 2010

Data Mining - Cosas que tienes que conocer en el 2011 segun Forbes, R.

Hola a todos;

hoy os adjunto un interesante articulo de la revista Forbes de algo que hemos estado intentado avisar a la comunidad de analístas de datos, que R será, o mejor dicho es, una técnología disruptiva la cual cambiará el equilibrio que hay entre las diferentes herramientas de análisis de datos.

Toca puntos que ya hemos comentado, como por ejemplo que Facebook utiliza R para sus análisis o
que R está sustituyendo al software propietario en las empresas y que por lo tanto se está creando una masa de técnicos que ya lo conocerán por defecto, entre otros puntos.

Un punto que no trata y que creo que es muy importante para la estandarización de la herramienta, y que hace que no sólo sea utilizada por Nerds, es la facilidad de uso. Todos sabemos que por muy pontente que sea algo si no es fácil utilizarlo se encontrará con grandes reticencias en su implantación, y es en este campo donde R está dando pasos increibles, con Red-R o sus intefaces con Knime o Rapid Miner.

Señores el futuro llama a nuestra puerta, ¿seremos capaces de seguirle el paso?