Curso recomendado

martes, 15 de marzo de 2011

Geomarketing - Lecturas recomendadas

Ya son muchos los blogs que abordan la temática del data mining y el geomarketing en la blogosfera. Y lo mejor es que el nivel es muy alto, por lo que no me cabe otra que en primer lugar felicitar a los blogueros y daros a conocer noticias publicadas en ellos por si no habéis tenido la suerte de encontrarlos.

En el Blog de la empresa UNICA360, que gestiona nuestro amigo Guillermo Cordoba, tenemos dos posts interesantísimos que recomiendo totalmente su lectura. El primero sobre Análisis RFM en el retail, el cual voy a suar de base para una adaptación con Knime y MapBasic, siguiendo con la línea del anterior post. El segundo sobre la predicción de gasto en libros, muy interesante, sobre todo, si Direct Group está en tu grupo empresarial.

Enhorabuena Guillermo por estos dos posts!

El siguiente Blog es del Juancho Sierra, donde nos muestra dos aplicaciones interesantísimas sobre consulta de datos censales en Estados Unidos. Ójala en España el INE se lance a este tipo de difusión, aunque viendo el negocio de vender esta cartografía dudo que algún día lo haga. En estos links podéis ver las recomendaciones de Juancho. Os linkeo a su blog para que desde allí las veáis, que menos por su fantastico trabajo que paséis por él!

El tercer Blog es un descubrimiento, es el blog GeomarketingValencia, de David Piles. En él encontréis tres posts interesantísimos sobre el estudio del Potencial Económico de una zona.


Desde el blog de GeomarketingSpain os recomendamos estas lecturas, y que sigáis a sus autores, nosotros ya lo hacemos!

jueves, 10 de marzo de 2011

Geomarketing - Integración de knime con MapInfo - MapBasic

El mundo del data minning del que Paco es un verdadero experto siempre me ha quedado un poco lejos, pero gracias a herramientas como KNime voy conociendo un poco más el "mundillo" de la minería de datos.

Y la primera sorpresa que me he llevado ha sido la facilidad para integrar modelos directos, desde un fichero de entrada como pueden ser clientes, aplicarles el algoritmo de kmeans para segmentarlos a partir de valores de negocio y datos sociodemograficos. Evidentemente que este tipo de técnicas requieres de manos expertas, sobre todo para analizar los resultados, pero que menos que poder explotarlo de manera visual en un mapa.

Pues eso he hecho, me he creado un pequeño flujo de 7 nodos, para aplicando K-means y C-means para comparar resultados. Luego desde MapBasic me he creado un menú de conexión a knime, donde ejecutar en modo batch el flujo a partir de tablas que tengo en mapinfo y realizar mapas temáticos.


Por si os interesa os dejo el chorro de código que le paso para ejecutarlo en modo batch desde MapBasic. Lo que hago desde MapBasic es:

Include "MAPBASIC.DEF"
Include "MENU.DEF"

Declare Sub Main
Declare Sub kmeans
Declare Sub Mapa

'genero el menú para tenerlo en MapInfo
Sub Main
    Create Menu "knime" As
        "Segmentacion" Calling kmeans,
        "mapa tematico Segmentacion" Calling Mapa

Alter Menu Bar Add "Knime"

End Sub

Sub kmeans

'Exporto la tabla de clientes para enchufarla al knime como parámetro en opción del nodo
Export clientes_ok Into "E:\knime2\clientes.TXT" Type "ASCII" Overwrite Delimiter "|" CharSet "WindowsLatin1" Titles
'lanzo en modo batch el knime, como véis le paso como parámetros en el option=1 (nodo 1) el fichero que acabo de exportar

'y en el nodo 4 y 7 las dos salidas del modelo para luego levantarlas más adelante, se puede parametrizar el numero de 
' iteraciones y datos a usar en cada algoritmo
Run Program "cmd.exe /c"+" E:\knime2\knime_2.3.1\knime.exe -consoleLog -nosplash -application -noexit org.knime.product.KNIME_BATCH_APPLICATION -workflowFile=E:\knime2\MapInfo2.zip -option=1,DataURL,"+"file:E:\knime2\Clientes.txt"+",String -option=4,filename,"+"tmp/Clientes_kmeans.csv"+",String -option=9,filename,"+"tmp/Clientes_cmeans.csv"+",String"

End Sub

Sub Mapa

'El resultado lo abro y lo paso a TAB directamente
Register Table "E:\knime2\tmp\Clientes_kmeans.csv"  TYPE ASCII Delimiter 44 Titles Charset "WindowsLatin1" Into "E:\knime2\tmp\Clientes_kmeans.TAB"
Open Table "E:\knime2\tmp\Clientes_kmeans.TAB"
Register Table "E:\knime2\tmp\\Clientes_cmeans.csv"  TYPE ASCII Delimiter 44 Titles Charset "WindowsLatin1" Into "E:\knime2\tmp\Clientes_cmeans.TAB"
Open Table "E:\knime2\tmp\Clientes_cmeans.TAB"
'uno las tablas de manera dinámica para luego hacer el temático
Add Column "clientes_ok" (Cluster_kmeans Char (9))From Clientes_kmeans Set To Cluster Where COL1 = COL1  Dynamic
Add Column "clientes_ok" (Cluster_cmeans Char (9))From Clientes_cmeans Set To COL13  Where COL1 = COL1  Dynamic
'shade window Frontwindow() 1 with Cluster_kmeans values  "" Symbol (34,16711680,12) ,"cluster_0" Symbol (34,65280,12) ,"cluster_1" Symbol (34,255,12) ,"cluster_2" Symbol (34,16711935,12) ,"cluster_3" Symbol (34,16776960,12) ,"cluster_4" Symbol (34,65535,12) ,"cluster_5" Symbol (34,8388608,12) ,"cluster_6" Symbol (34,32768,12) ,"cluster_7" Symbol (34,128,12) ,"cluster_8" Symbol (34,8388736,12) ,"cluster_9" Symbol (34,8421376,12) default Symbol (40,0,12) style  replace  off 
End Sub





Pues de una manera sencilla obtenemos una segmentación en un mapa temático usando un programa de data mining como knime. Os dejo algún pantallazo:






martes, 8 de marzo de 2011

Data Mining - Rstudio

La verdad es que el compañero Carlos ya se nos adelantó en su blog al dar la noticia, había nacido un nuevo IDE free para R, Rstudio. Me miré el post y me apunté mentalmente darle un vistazo a fondo al programa, cosa que aún no he podido hacer...

Hasta aquí lo normal, pero revisando los post que tenía por leer me he dado cuenta que en la comunidad de R ha pegado muy muy fuerte, he podido leer posts en multitud de sitios sobre la bondades de este nuevo IDE; la verdad es que por ahora, y según lo que yo he podido ver, no aporta mucho más que, por ejemplo, JGR; cierto es que permite hacer artículos científicos de manera más fácil e integrada, pero a parte de eso yo diría que son prácticamente iguales; bueno mirando un poco más de cerca permite que se instale en un linux y poderte conectar via web al IDE... no es mala opción si lo que quieres es trabjar con un servidor potente en el cual no estás físicamente delante.

Sinceramente hasta que alguno de estos IDE's no integre la debugacción de código estaremos algo cojos de interface... no se si habéis intentado debugar algo en R... es un ejercicio que medirá el nivel de paciencia que tenemos, y si me no creéis intentad lo. Esto siempre hablado en software libre, por que Revolution Analytics ya tiene una IDE que integra debugación y, si las noticias son ciertas, esta trabajando en una interface mucho más visual, digamos que muy cercana a Clementine.

De todas maneras no quiero se escéptico, a ver si por una vez por todas conseguimos que se haga un IDE más amigable para R, que sea multiplataforma y que cubra todas las necesidades que un buen IDE debe tener... ¿será Rstudio este? el tiempo nos lo dirá.

Eso si, está claro que es mucho más bonito que la línea de comandos de R...


viernes, 4 de marzo de 2011

Geomarketing - Feria GlobalGeo

En Barcelona del día 15 al 17 en Barcelona se va a celebrar la 5ª edición de la Feria GlobalGeo.

Si bien por lo que he visto en las ponencias, jornadas y trabajos presentados el geomarketing aún no se presenta como herramienta de apoyo a la empresa, se vuelve a manifestar la importancia de las soluciones LBS en el mundo móvil. Prueba de ello es la ponencia sobre Google Maps.

Respecto al Geomarketing (cabe destacar que para mí Geomarketing no es LBS, ni Facebook Places ni nada del estilo) , lo más parecido que he podido encontrar es una ponencia de ESRI sobre CRM Territorial. Realmente dentro de este nombre "CRM Territorial" ESRI esconde una propuesta muy parecida a la de la empresa amiga TUENT, con sus formatos @participa y @comunica



jueves, 3 de marzo de 2011

Data Mining - El motor de recomendación Mirotele.

Hace nada, en una de las respuestas de un post, una compañera llamada "Precaria", indicaba que había empresas españolas dedicadas a los motores de recomendación, el problema es que no había demanda del mundo empresarial, a lo que yo discrepaba un poco.

Pues la primera en la frente, hace nada en el blog de tecnología Xataka nos habla que Samsung nada menos ha apostado como recomendador de programas de televisión para sus compradores en Mirotele; esto ha sido posible al hecho de que Samsung ha creado un concurso a nivel internacional para buscar las mejores aplicaciónes para "hacer" a la TV inteligente donde esta aplicación ha conseguido hacerse un hueco.

Si no he leído mal esta aplicación ha sido apadrinada por la universidad de Málaga y parece ser que su cara visible es David Bueno Vallejo; también la misma aplicación tiene un blog por si quereis más información sobre su creación.

Pocas veces la realidad me ha corregido tan rápido sobre un comentario hecho, y pocas veces me ha importado tan poco, ojalá proyectos como este llenen nuestra vida en el futuro.

martes, 1 de marzo de 2011

Geomarketing - Un nuevo blog - GeoMk.com

Hoy en twitter he encontrado este nuevo blog de geomarketing GeoMk.Com de Mónica Medina. Te deseamos mucha suerte en esta aventura y estaremos al tanto de tus novedades.

Por otra parte os dejo un link a una noticia interesante, sobre Domino's Pizza en Brasil.

http://www.mundodomarketing.com.br/8,14537,domino-s-projeta-crescimento-em-sp-baseado-em-geomarketing.htm