Curso recomendado

lunes, 30 de noviembre de 2009

Data Mining - Rapid Miner

Hoy os presentaré otra herramienta GPL para hacer minería de datos, creo que ya llevamos 3 y eso que no hemos entrado en las librerías de programación libres, para que luego digan que no hay opciones en el software libre.

Se llama RapidMiner; esta herramienta nace de Yale (Yet Another Learning Environment), una herramienta totalmente gratuita centrada en la investigación de algoritmos de machine learning, con el tiempo se creo una empresa a su alrededor que lo ha estado desarrollado la herramienta desde, más o menos, el 2006.

El resultado, cuando menos, es interesante. Esta herramienta permite ejecutar los algoritmos de Weka dentro de su interface, a demás, en la proxima versión podrán en marcha una nueva interface mucho más visual que la anterior, os dejo un enlace con un vídeo aquí .

Esta herramienta ha ganado varios premios, ha sido la mejor startup de Alemania en el 2007, el año pasado gano otro premio centrado en las Startup de Business, pero lo que considero más interesante es el hecho que se ha metido dentro, como observador, del comite del Data Mining Group, esto quiere decir que en breve soportará exportación e importación de modelos en PMML, pero a demás desde su puesto estará al tanto de la evolución de este formato y podrá aplicar la modificaciones de una manera rápida. Esto es más importante de lo que parece en un principio, ya que se auguran tiempos donde la herramienta de modelización estará desvinculada de la de explotación.

Esta empresa, como otras dentro del software GPL, han optado por el doble producto, uno totalmente libre donde la comunidad puede hacer lo que quiera, y otro Enterprise, donde hay que pagar un precio por el producto, la verdad que no muy abultado, con 9999€ una versión con instalaciones ilimitadas y con un soporte con una respuesta en menos de 2 horas. Os dejo el enlace con las tarifas aquí.

Bueno pues ya tenemos otro entorno donde poder hacer nuestro análisis, ya me contareis que os parece.

viernes, 27 de noviembre de 2009

Data Mining - Knime Reporting

Hace casi nada que os hablamos de Knime, pues hoy ha salido a la luz una nueva funcionalidad muy interesante, la capacidad de hacer reporting con esta herramienta.

Sinceramente cuanta más tiempo pasa más interesante me parece esta herramienta, para que os hagáis una idea o dejo un pantallazo de la nueva funcionalidad justo debajo de estas líneas


Aunque seguro que tiene limitaciones es una capacidad muy interesante, ya que en la misma herramienta tenemos la capacidad de hacer ETL, es decir, que podemos hacer informes con información sucia de cualquier fichero txt o excel, que aunque todo técnico de BI nos dirá que si no está en la BBDD no se puede trabajar con ello o en su defecto se tiene que hacer una petición para que se incluya la información, todos sabemos que las peticiones de información que nos hacen son siempre urgentes y no son estandarts.

Os dejo aquí la página que contiene un par de vídeos para que os hagáis una idea de como funciona todo el conjunto.

Sinceramente cada vez estoy más convencido que escucharemos cosas muy interesantes sobre esta herramienta, ETL, Minería, Reporting, capacidad de exportar a PMML, capacidad de ejecutar escripts de Python y R...

jueves, 26 de noviembre de 2009

Data Mining - Canal Data Mining Youtube

De vez en cuando la red deja encontrar una pela, pues hoy ha sido uno de esos días; trasteando he encontrado un canal en youtube que trata sobre la minería de datos. Me los he estado mirando y hay un curso entero de minería impartido en el Google Campus del 2007, se llama Staditical Aspets of Data Mining (Stats 202) tiene 13 vídeos de poco menos de una hora, son los 13 primeros que podéis encontrar en el visor.

Os dejo debajo de estas líneas el reproductor con todos los vídeos. Echad les un vistazo que no tienen desperdicio.




ACTUALIZACIÓN: he encontrado las transparencias que utilizan en el curso, las encontrareis aquí

lunes, 23 de noviembre de 2009

Data Mining - Libro "Los numerati"


Hace tiempo ya que la manera de hacer negocios esta cambiando de manera radical, las empresas se están dando cuenta que no pueden tratar de manera adecuada a sus clientes sin tener un modelo basado en la experiencia previa, de esta prioridad deriva la necesidad de tener técnicos capaces de estudiar a nuestros clientes, construir modelos de contacto, preveer los cambios de los clientes,...

Esta nueva profesión es la que viene a presentarnos el libro "Los numerati", en un mundo donde la información que se tiene de las personas cada vez es más extensa y crece de manera exponencial los técnicos que sean capaz de analizarla, y utilizarla de manera útil serán cada vez más necesarios.

Esta capacidades permiten a la empresa o institución focalizar sus esfuerzos de una manera más productiva y eficiente. Por otro lado el consumidor lo tendrá más fácil y se sentirá más tenido en cuenta, pero, también está la otra cara de la moneda ¿utilizarán estas técnicas los gobiernos para ejecer control sobre nosotros? tenemos que ser conscientes que de aquí poco tiempo, si no ya, toda nuestra vida estará registrada, qué compramos, cuándo, dónde, qué nos gusta, qué miramos por internet....

El libro de Stephen Baker nos habla de una manera sencilla sobre la figura del analísta de datos, de como ha trabajado hasta ahora y que le depara un futuro centrado en el mundo de la red, tratando también temas de privacidad del consumidor y ética.

No me lo he podido leer todavía pero creo que es una léctura muy recomendable para cualquiera que se quiera acercar a este mundo.

jueves, 19 de noviembre de 2009

Data Mining - Conferencia de mototres de recomendación

Hace unas semanas se realizó la "3rd ACM Conference on Recomender Systems", ya hemos hablado alguna vez sobre los sistemas de recomendación, y siempre es interesante que surjan simposios donde se discutan las nuevas tendencias, para que de esta manera se estandarice la tecnología.

Hasta aquí lo normal de una conferencia, pero lo que es remarcable es el hecho que Francisco Martín, CEO de Mystrands, diera una charla sobre su carrera, su empresa actual y diera unos consejos para la implantación de sistemas de recomendación, os dejo aquí un resumen sobre el tema:

  1. ¿Realmente lo necesitas? hay que tener claro que invertir en un motor de recomendación es un proyecto costos y necesitas de tener un tráfico en la web importante para que sea rentable.
  2. Las recomendaciones deben tener una visión estratégica del cliente, es decir, no siempre la recomendación con más portabilidad de compra es la mejor a largo plazo.
  3. Elige bien la herramienta y el proveedor del servicio, incluso si dispones de suficiente presupuesto plantéate el hacer una herramienta especifica para tus necesidades.
  4. No tener miedo al comienzo frío, hay que ser creativo a la hora de comenzar y no tener miedo de hacer prouestas inicial, en el peor de los casos el algoritmo irá mejorando las recomendaciones con el tiempo.
  5. Hay que tener en cuenta que el 70% del éxito está en la calidad de los datos y el 30% en el algoritmo. (esto es aplicable a cualquier modelo predictivo)
  6. La atención del cliente es nuestro bien más preciado, si que es complicado saber qué y cuando, pero no servirá si no tenemos una página que capte su atención.
  7. No intentes hacer perfiles de clientes, utiliza la información que tienes a tu disposición en la red (Facebook, Twitter,..)
  8. Escala cuanto antes mejor tu negocio.
  9. Elige tu sistema de puntuación con detenimiento, si lo modificas ten en cuenta que tus usuarios no repuntuarán todo lo hecho hasta el momento.
  10. Y como no, MIDELO TODO, que sea la respuesta de tus usuarios la que guíen durante el desarrollo.
A ver si entre todos conseguimos que más empresas sean punteras en temas de analítico a nivel internacional.

miércoles, 18 de noviembre de 2009

Data Mining - No al tijeretazo

Sin más, me uno a esta iniciativa que surgió del blog "La aldea irreductible"

miércoles, 11 de noviembre de 2009

Geomarketing - Los Globos de Enfinity

Hoy iba de camino a la oficina, en Alcorcón, para más señas, y sabía que hoy se iba a respirar un ambiente diferente, por aquello de la eliminación de la copa, pero lo que he respirado ha sido una sorpresa mayúscula, por lo menos para mí.

Hoy estaba inundada la zona anexa a las oficinas de globos con una marca "Enfinity" y los retrovisores de los coches con un colgante de la misma marca. Evidentemente lo primero que me he preguntado ha sido ¿quiénes son estos? Pues son una empresa de inversiones en energias renovables entre otras cosas.

Como siempre, la idea original. Me ha impactado ver un parque infantil lleno de globos, ahora bien, mi pregunta de siempre, valga la redundancia, ¿era ese el mejor lugar para tal propósito? Según su propia web esta empresa ofrece:

  • EXPERIENCIA: Enfinity es una multinacional belga, que desde su fundación en 2005 ha desarrollado una amplia experiencia internacional, teniendo más de 100 MW en proyectos en instalación.
  • GARANTÍA: Enfinity es garantía de instalaciones fotovoltaicas de calidad, estableciendo acuerdos sólo con fabricantes áltamente reconocidos a nivel mundial.
  • PROFESIONALIDAD: Proporcionamos todo lo necesario para la instalación “llave en mano” desde su diseño, hasta el montaje, puesta en marcha y mantenimiento. Nos adecuamos a las necesidades de cada cliente y combinamos la máxima productividad con una impecable calidad estética.
 Sin querer adentrarme en el mundo de la publicidad, me gustaria que alguien me descifrara cuales pueden ser los objetivos de una campaña de este tipo en una zona como esta porque como decía un feligrés de un bar valenciano "mi no entender".

Por cierto, tengo fotos, ahora solo falta que consiga bajarlas del móvil.

Saludos

Data Mining - Estudio BI Open y R

Me hago eco de la noticia que ha publicado un gran blog de BI, TodoBi.

En la entrada comentan un estudio de BI Open Source realizado por Mark Madesn. En la página de TodoBi tenéis el pdf completo el cual podéis descargar, no tiene desperdicio; pero yo sólo quería hacer mención al siguiente gráfico:


Se puede observar que la parte donde más crecimiento hay en Open Source es en la división de analítico; esto puede ser por inercia, me encontrado con más de un consultor de riesgo que se le ponen los pelos de punta cuando dices de hacer un score sin SAS, falta de técnicos cualificados, miedo al cambio entre otros; pero la conclusión que tengo en mente al ver el gráfico es que no es nada descabellado que en medio plazo más del 30% de las empresas tengan sus departamentos de analítico funcionando en software libre, que es lo que hay actualmente en sistemas de BBDD Open.

Pero lo más interesante ha sido que hace unos días leí en el blog de REvolution una entrada sobre la opinión de R de Steve Miller, nos comenta que a SAS le están creciendo los enanos, la existencia de REvolution, productos que copian la sintaxis de SAS (WPS, Carolina), pero lo que cree que le va ha hacer más daño a medio plazo es que ahora en las universidades ya se enseña R y no SAS; no puedo estar más deacuerdo en el punto donde nos explica que de aquí a unos 5 años R será la herramienta preferida para los nuevos estadísticos en el mundo empresarial.

LLevamos tiempo con vientos de cambio en todo lo relacionado con el software, y parece que ahora ya le toca al mundo analítico, y lo más interesante es que ahora es cuando ya no se discute en las organizaciones si es necesario hacer análisis, sino como se hacen y que nos cuesta hacerlos; en una situación como la actual, con una crisis acuciante, el open source no es visto como un un medio de apredizaje relegado a las universidades, sino como una opción más que valida para las organizaciones.

jueves, 5 de noviembre de 2009

Geomarketing - Se busca consultor de geomarketing

Hola a todos,

En la parte derecha del blog tengo un RSS de Infojobs para puestos de trabajo en Geomarketing. Bueno, pues esta semana hay una oferta nueva en la empresa en la que trabajo. Se está buscando un consultor para el área de Geomarketing para las oficinas de Barcelona. El puesto es global, desde parte técnica hasta habilidades con clientes, gestión de proyectos, etc.

Si alguien se anima le dejo en link de la oferta para que se apunte:

http://www.infojobs.net/barcelona/consultor-geomarketing/of-i108210425328704705102504814323

saludos.

PD: Estoy un poco inactivo esta semana, pero es que estoy dando cursos de formación a todos nuestros clientes en Barcelona, y entre esto y los cierres de proyectos, no doy para más. Eso si, estoy preparando un post sobre un cierre de un supermercado como el de Gama pero de la cadena Carrefour que salió publicado en varios medios:

http://www.publico.es/dinero/266104/carrefour/cierra/tres/centros/bajos/niveles/ventas

Saludos