Curso recomendado

domingo, 30 de agosto de 2009

Geomarketing - Touche Google Maps Extractor

Aunque me he llevado algunas críticas por mi tendencia "natural" a intentar usar Google Maps para hacer pequeños estudios de Geomarketing, hoy voy a hablar más sobre lo mismo.

Uno de los temas que interesan mucho a la hora de afrontar y abordar un estudio de geomarketing es conocer qué tenemos delante, ¿qué hay donde voy o donde voy a abrir un negocio? Muchas empresas por suerte conocen el potencial de Google Maps, potencial que radica no en ser un GIS ni mucho menos, si no que todo el mundo lo usa hasta para donde ir a comprar el pan, y por ello todas las empresas dan de alta en Google Maps todas sus oficinas, tiendas, sucursales, etc. Con esto Google ha conseguido tener una base de datos cuanto menos interesante, y poder explotarla es mucho más interesante aún.

Supongamos que queremos abrir un negocio en una zona de ocio, por ejemplo Zona Canovas de Valencia. Lo primero que necesitaremos saber es que negocios hay allí, por lo que tenemos dos opciones, o ir a la susodicha zona, o por ejemplo usar Google Maps. Yo me decanto por la segunda. Si introducimos en Google Maps, Zona Canovas, nos muestra directamente la plaza canovas, y un directorio con los negocios (páginas amarillas) que hay con esa dirección:

Incluso podemos Explorar el área a partir de una distancia para ver lo que hay en la zona, indicando que queremos buscar, como por ejemplo, "pubs":

Bueno, a simple vista lo primero que me viene a la cabeza es "que tostón", ¿no sería mejor indicar una dirección, y sacar un listado de todo lo que hay en esa zona? Para responder a esta pregunta podemos usar un nuevo soft, llamado Touch Google Maps Extractor Sencillamente es poner una dirección, una distancia y automáticamente se conecta con Google Maps y nos ofrece un listado con todos los negocios que hay alrededor de esa zona, obteniendo:
  • dirección
  • coordenadas
  • nombre de la compañia
  • teléfono
  • página web
  • link a mapa
Por ejemplo:
Y si hacemos la prueba con el nuevo supermercado Gama del otro día obtenemos un listado con 29 supermercados a menos de una milla (a ver si lo lanzan en km...)


La otra opción es comprar el fichero de Alimarket, pero si Google nos lo ofrece gratis...

NOTA: La primera vez que vi este software fue en Geofumadas, otra cosa es que yo lo haya aplicado, y eso es powered by Geomarketing spain.


lunes, 24 de agosto de 2009

Data Mining - Motores de Recomendación y Strands

Hace tiempo que quiero tocar un tema en el blog, el de los motores de recomendación, en si podríamos decir que son sistemas que lo que buscan es, a partir de tu historia de visitas compras y demás actividades en un sitio web, apoyandose también en el comportamiento del resto de usuarios, recomendarte de una manera eficiente.

Este tipo de tecnología es muy nueva, podríamos afirmar que su creadora es Amazon, y la verdad es que el trabajo es increíble, si buscas algo en su web no sólo lo encuentras, sino que te muestra, en segundo termino, una gran cantidad de productos que seguro que encuentras interesantes. ¿Y en que se traduce esto? pues en venta pura y dura, si tenemos en cuenta la cantidad de gente que pasa por una pagina de Retail en internet y que con esta tecnología obtendremos un incremento en el % de venta cruzada, por pequeño que sea, esto supone supone un incremento en los beneficios a un coste casi 0.

Este tipo de herramientas han nacido acunadas por la red, aunque cada vez más estoy seguro que veremos cosas parecidas en los grandes almacenes de toda la vida; se entrelazan muy bien con las nuevas maneras de pensar a la hora de hacer negocios, como por ejemplo con las teorías Long Tail, o de La paradoja de la elección; cuando tenga algo más de tiempo colgaré un post explicando en detaye estas tendencias y su interacción con la web y los motores de recomendación.

Hace unos días halábamos de Neo-metrics como ejemplo en el I+D+i España pero no es la única, tenemos a Strands, no tiene sede social en España pero si que esta fundada por un español y tiene una oficina en Barcelona, este es el Dr. Francisco J. Martín. La compañía tiene varios productos, un recomendardor de música, una red social propia ..., pero el que considero más interesante desde el punto de vista del BI es el motor de recomendación Strands Recomender.

Con esta herramienta y con un servidor de contenidos decente podemos crear una página web totalmente personalizada al cliente que tengamos en ese momento conectado, ofreciendo productos y servicios con una alta probabilidad de compra para su perfil; vamos que podemos crear nuestra pequeña Amazon.

En un mercado cada vez más saturado con unos clientes que cada vez tienen menos tiempo para dedicar a la compra y con unos catálogos cada vez más grandes y laberínticos sinceramente creo que este tipo de soluciones tiene un futuro muy prometedor.

Por último os dejo aquí un vídeo donde el CEO de Strands, Francisco Martín, y el jefe de proyectos de BBVA, Enrique Gonzalez, nos hablan de la puesta en marcha de un proyecto dentro de la entidad Bancaria con el motor de recomendación de Strands; os la recomiendo.






No es ninguna casualidad que Strands desarrollara este tipo de herramienta para BBVA, ya que esta entidad ha sido una de las que más ha invertido este proyecto, os dejo aquí el enlace.

jueves, 20 de agosto de 2009

Geomarketing - Apertura nuevo Supermercado Gama en Madrid

Hola a todos,

Hoy revisando noticias he encontrado una sobre una nueva apertura de un supermercado de la cadena GAMA en Madrid, más concretamente en la calle Valderribas nº 62. Según la noticia "...la apertura de esta tienda ha ido acompañada del cierre de la tienda que tenía en la calle Capitán Blanco Argibay. Esto es debido a que quería un establecimiento más moderno y con más posibilidades (almacén, zona de pisos nuevos y buen nivel)..."

Bueno, esto me ha llevado a ver si lo que comenta es verdad, sobre todo en el tema de buen nivel, y ver que tal anda la competencia por la zona, de una manera visual evidentemente, sin entrar en detalle, tan solo mostrando la información de la zona de la nueva ubicación.

Como podemos ver en la imagen de google maps el local se encuentra en la esquina, lo que favorece el tránsito de personas. El local según podemos ver en la imagen es de 257 m2, de los cuales han destinado a tienda 159.


Ver mapa más grande

Como se aprecia en la imagen los edificios son de nueva construcción, cosa que queda corroborada si vemos el mapa de la zona con los tipos de vivienda donde la zona es del tipo Vivienda nueva plurifamiliar.


Lo siguiente es ver el "buen nivel" que buscaban en la zona. Lo esperado al tratarse de una nueva zona es que sea así, pero mejor si lo comprobamos:


En la imagen superior se aprecia que la zona se corresponde con un nivel alto-medio alto.

¿Y la competencia? ¿dónde está? En la siguiente imagen se muestra la competencia en la zona y alrededores, y se aprecia que en el margen izquierdo hay una gran saturación de supermercados, y lo que parece quizás algo más preocupante es la superficie de los mismos, donde hay muchos de entre 400 y 1000 m2, variable más que importante si recordamos la atracción del modelo de Huff. A su favor decir que las calles Doctor Esquerdo y Ciudad de Barcelona harán de barrera física "reteniendo" a los clientes potenciales dentro de la zona del supermercado nuevo. Quizás habría que mirar las cadenas, donde domina la cadena DIA, del ramal descuento. Curioso que Mercadona no esté por esta zona, y quizás la entrada del gigante de la distribución podría cambiar la situación.



¿Y la gente que vive? ¿quienes van a ser nuestros clientes? Hemos visto que la zona era de un alto nivel económico, pero también es interesante ver la distribución de edades para ver y estudiar los comportamientos de compra y adecuar el establecimiento a estos datos, pues no compra igual una persona de 30 que uno de 60.


Pues por lo que parece a primera vista están en lo cierto, la zona parece idónea para una nueva apertura, a tenor de los datos iniciales. La duda que tengo es saber el tiempo que han podido tardar en escoger o encontrar esta ubicación, y como la han estudiado.

Por cierto, los mapas y datos los he sacado de la aplicación de Geomarketing GeoStat Desktop de Arvato Services.

lunes, 17 de agosto de 2009

Data Mining - Análisis de Redes Sociales, Neo-metrics y la KDDCup 2007

Hola otra vez a todos, después de unas merecidas vacaciones seguimos en la brecha.

He descubierto una vídeo lectura sobre el análisis de Redes Sociales, esta disciplina trata de estudiar y modelizar las interacciones entre individuos apoyandose en la estadística y últimamente en la minería de datos, más concretamente en la minería de grafos. Está teniendo un gran crecimiento en los últimos años, sobre todo en lo relacionado con internet y la web. Busca estudiar el comportamiento de grupos formados por individuos, ya sea de manera descriptiva, buscando grupos entre relaciones de individuos, o de manera predictiva, intentando predecir el comportamiento de los grupos o como influirá este si se modifica su estructura, por poner un par ejemplos.

No es una disciplina nueva, lleva mucho tiempo en el candelero, pero no ha sido hasta tener suficiente capacidad de computo y técnicas diseñadas para el tratamiento se grandes volúmenes de información que no ha acabado de cuajar, esto se refleja en que casi no hay soluciones privativas para hacer este tipo de análisis.

Por si os interesa profundizar en el tema os dejo aquí enlaces a simposios para este año:

Pero sobre todo os dejo una interesante presentación, con sus diapositivas, donde se puede ver las capacidades de R para hacer análisis de Redes Sociales


Lo cierto es que una empresa Española ganó la KDDCup en 2007 utilizando este tipo de técnicas para resolver problemas de minería de datos, su nombre es Neo-metrics, no sólo la ganó sino que fue la primera empresa europea en hacerlo; la verdad es que todo un hito que una empresa española gane un galardon internacional tan prestigioso dentro del campo del análisis de datos, a ver si más empresas españolas se animan a hacer I+D+i en este campo, ya que cuando nos ponemos en serio no hay que nos haga sombra.

Os adjunto aquí una presentación donde podemos ver al fundador al CEO de Neo-metrics ,José Luís Flores, hablando sobre el galardon y sobre Neo-metrics en general.



martes, 4 de agosto de 2009

Data Mining - Vacaciones....

Si señores, me tomo un merecido descanso por lo tanto estaré unas semanas sin acercarme a un ordenador... espero.





Geomarketing - Opinión de Néstor Sastre en LinkedIN

Dentro de LinkedIn existe un grupo de Geomarketing, llevado por Néstor Sastre, uno de los primeros profesionales que se dedica al sector del Geomarketing. Supongo que tendréis que daros de alta para poder ver los debates, pero hoy transcribo algunas ideas que postea Néstor:

1º Comenta el proyecto de la CECA, en estado inicial. Me gustaría añadir que algunas cajas de la CECA no han entrado en el proyecto con ESRI o se han salido para optar por otras soluciones, en fases mucho más avanzadas que las de ESRI.

2º Lanza una nueva batería de preguntas sobre para qué sirve el geomarketing:
  • ¿qué tipo de clientes viven alrededor de las oficinas?
  • ¿dónde viven nuestros mejores clientes?
  • ¿la cobertura espacial de las oficinas es óptima o se canibalizan el espacio?
  • ¿tiene el cliente la oficina más cercana a su vivienda?

Cómo bien dice estas preguntas son fáciles de responder, y el geomarketing te las ofrece.

3º Comenta también el tema de los cajeros automáticos. Supongo que se referirá al proyecto de Caja Madrid y ESRI para el estudio de la red de cajeros, y abre una nueva vía de publicidad en los mismos. Lo que más me gusta es el término "googleidiano" al cual me aferro últimamente como un buen recurso de ideas. La idea que comenta es la inserción de publicidad en los cajeros, al más puro estilo Google, un cajero en la calle X publicita negocios de la zona, simple, sencillo y directo.

Un ejemplo práctico y real: Hemos cambiado el bar donde almorzamos en la empresa, ¿por qué?, el precio es increible, 1,50 cafe y bocata de jamón. El bar lleva abierto más de un año, y nosotros lo hemos encontrado porque hicieron una campaña de publicidad en los coches con las ofertas. Dio resultado. Pero cuando fui por primera vez, me di cuenta que había pasado mil veces por su puerta, ¿por qué? porque como dinero uno no lleva todos los días, y para pagar el almuerzo pues uno tiene que ir al cajero, y sacar 20 eurillos de nada. Pues el bar está a 20 metros del cajero. Si en una de esas 50 veces que acudí hubiera tenido publicidad en el cajero, filtrada por el importe puesto que el que saca 500 euros no es para almorzar, y mis datos personales, la hora, se puede "saber" que esos 20 euros pueden ser para consumo cotidiano.
Es un ejemplo simple, pero creo que dice mucho del tema.

4º Finalmente habla de la posibilidad de introducir imágenes en la publicidad del cajero. Es una idea que ya vi en Nueva York y San Francisco. La empresa se llama Danoo (estoy buscando la web que no la localiza) , y lo que hacen es una publicidad interesante. Yo he intentado mover algo al respecto, pero no tengo ni tiempo ni recursos. La historia es la siguiente: Ofrecer una red social de negocios. ¿cómo? Lo interesante es analizar que si yo estoy de compras por el centro de una capital, y entro en una tienda de ropa a las 13:00 posiblemente lo siguiente que haga es irme a comer. ¿dónde? Si en el momento de pagar, esos tiempos muertos que habla Néstor Sastre, en la cola se muestra un monitor con un mapa de la zona, con bares asociados a nuestra red, y ofertas, como presentando tu ticket de compra de Zapatería Manolo, llevate el menú especial a precio de menú normal en el Bar Pepe. Evidentemente estaremos redireccionando tráfico de la zapatería al bar, ¿y al revés? Si estoy comiendo en un bar centrico o en una zona de compras, pues puede que quiera comprar, y si me ofrecen un descuento en Zapatería Manolo, quizás vaya para allá.

Esta idea a mi me parece muy buena, y con muchos feed-backs y sinergias para los establecimientos.


lunes, 3 de agosto de 2009

Data Mining - Minería en la nube, Clairo analytics

Estamos en tiempos de cambios, y más si nos fijamos en la evolución de la red, lo último es ahora todo lo relacionado con la Nube, es decir, tener la capacidad de poder trabajar desde cualquier terminal y, por medio de internet, que se ejecute nuestras instrucciones en un servidor y que este tenga capacidad de concurrencia; resumiendo, como si fuera trabajo cliente servidor pero haciendo de red internet y que más de un usuarios pueda abrir el mismo fichero.


Como no la minería de datos ya se ha subido a este carro, y no es de extrañar, ya que muchas de las herramientas con las que se trabaja ya tienen arquitectura cliente servidor. Otro punto por el este tipo de negocio se ajusta bastante la Nube es debido a la necesidades de hardware, poco a poco van surgiendo servicios que nos ofrecen guardar nuestros datos en la red o nos venden capacidad de computo, y por otro lado si sumamos el precio astronómico que hay que pagar por cada licencia de software con la que trabajan los analistas no es de extrañar que tener soluciones donde todo el mundo se pueda conectar y trabajar sin pagar más licencias sólo por lo que necesitas es muy tentador.


La primera solución de software de minería de datos que ha surgido siguiendo esta filosofía es Clario, es un una herramienta pensada para y por la nube, es decir, se puede trabajar desde cualquier sitio y varias personas a la vez sobre el mismo proyecto, desde un terminal que se conecta a un servidor en el cual está en la red.


Si a esta cualidad de estar en la nube le sumamos que el precio es realmente ajustado, por 300$ mes 100 Gb de transferencia con 50 Gb de almacenamiento con 720 horas de tratamiento en un entorno servidor pensado para sacar la máxima eficiencia al programa no está nada mal. Si tenemos en cuenta que un mes tiene unos 22 días laborables y que nuestro técnico trabaja 8 horas con el programa tendremos que utiliza 176 Horas, cierto que puede ser que deje cosas funcionando en bach pero creo que 2 o incluso 3 técnicos pueden trabajar con esas capacidades sin ningún tipo de problema; es decir que con 2 o 3 portátiles y 300$/mes tenemos la infraestructura necesaria para hacer proyecto de minería de datos, totalmente irrisorio si lo comparamos con las soluciones clásicas.


Hay que reconocer que la herramienta está todavía germinando, no es que no funcione, pero aún le quedan muchas funcionalidades por añadir, eso si, crece a buen ritmo, está previsto que dentro de unos 9 meses desarrollen algoritmos basados en árboles (CART, CHAID, MARS) y de clustering (K-means, EM), también tienen previsto mejoras en el interficie y la usabilidad.


En cuanto a la usabilidad hay que decir que se parece mucho a Clementine, quien esté interesado en probarlo hay un periodo de prueba de 30 días así como varios tutoriales sobre la herramienta que podéis encontrar aquí, también tienen un canal en youtube que tiene vídeos del funcionamiento de la herramienta, a ver si os animéis la probáis y nos contéis que os parece.


En un mundo donde cada vez es más difícil ver nuevas y buenas ideas siempre es de agradecer que te sorprendan, y a mi Clario lo ha hecho, si que falta cosas por pulir, como por ejemplo que está muy bien que se pueda trabajar en la nube mientras se diseña el modelo pero cuando se tiene que poner en explotación es mucho más cómodo hacerlo en tu propio servidor, sin tener que subir los datos al servidor de Clario y después bajando el resultado... pero demos les tiempo, seguro que los chicos de Clario desarrollarán algo interesante para cubrir esta necesidad.