jueves, 8 de octubre de 2015

Tutorial SAS Enterprise Guide

Un grupo de consultores B.I. estamos realizando un estudio del perfil de los usuarios de SAS con objeto de orientar nuestras acciones formativas SAS a determinados perfiles y especializaciones, de modo que nos interesa recopilar una breve información.





Enviaremos un tutorial de SAS Enterprise Guide a los usuarios que nos escriban a la dirección:    

cursos_a_medida_r@yahoo.es

Adjuntando la siguiente info:

Nombre
País y ciudad
- Perfil profesional, a elegir entre los siguientes:
         1. Consultor IT Business Analytics (programador, consultor junior/senior, project manager)
         2. Analista de negocio (marketing, control de gestión, Riesgos, Actuarios seguros, 
                                            investigación de mercados, analistas cuantitativos)
         3. Perfil científico / universitario (doctorandos, profesores)
         4.  Otros (especificar)
Sector de actividad: banca, seguros, telco, industria, Univesidad, admin pública
Opcional: toda la info que nos quieran ampliar acerca del uso que le dan a SAS.

Esta info se utilizará para mejorar nuestras acciones formativas SAS a necesidades más específicas.







Gracias a los quieran participar.

domingo, 4 de octubre de 2015

Análitica para sector retail: análisis cesta de la compra

Existen múltiples aplicaciones de business analytics para el sector retail. Desde diferentes perspectivas el los sistemas de business intelligence ayudan cuestiones críticas para el negicio, como pueden ser:

- Analizar clientes (segmentación, captación, retención, fidelización)
- Optimizar precios (elasticidad, pricing)
- Procesos de previsión de la demanda y previsión de ventas
- Análisis de las redes de distribución, transporte y almacenamiento
- Control geográfico de redes comerciales de gran capilaridad
- Seguimiento transacciones de venta (análisis productos y cesta de la compra)

En este post vamos a centrarnos en los procesos de análisis de cesta de la compra, realizando un rápido ejemplo.


Los procesos de análisis de la cesta de compras permiten encontrar asociaciones en los datos. Estas reglas de asociación pueden indicar cuestiones tales como cuáles son los artículos que se suelen comprar al mismo tiempo, en qué medida la compra de un artículo provoca la compra de un segundo, etc..

Esta información es útil para implementar estrategias de venta cruzada, realizar recomendaciones a los clientes sobre productos relacionados, y promocionar estos colocándolos muy cerca unos de otros en páginas Web, catálogos o en la misma estantería.

Vamos a ver un ejemplo empleando la herramienta de SAS: Enterprise Miner. Esta herramienta dispone de un nodo específico para realizar este tipo de proceso, dentro del grupo de tareas orientadas a la exploración:



Los datos de este ejemplo son datos de compras de supermercado, disponibles en: datos cesta compra

Este fichero es importado en SAS y se realizan las transformaciones para adaptarlos a los que en SAS Enterprise Miner se denomina formato transacción:


El formato de transacción necesita delimitar claramente los items que componen una transacción: para ello utilizamos un id y un secuencial.

Este dataset debe ser incorporado a Enterprise Miner con el tipo transacción y definiendo el  rol de las variables a utilizar:



Este dataset es input del nodo "market basket analysis" que va a obtener las reglas de asociación entre los productos vendidos en las transacciones.



Existen diferentes parámetros a configurar, entre ellos el número de elementos a relacionar y el nivel mínimo de confianza:


La ejecución del nodo nos dan los resultados estadísticos del estudio de reglas de asociación:



En particular nos fijamos en las reglas de asociación obtenidas:


En las reglas de asociación obtenidas se analizan cuestiones tales como el soporte de la regla (support%) que es la probabilidad de que aparezcan los dos productos en la cesta de la  compra, la confianza (confidence%) es la probabilidad condicionada de que aparezca el producto B en la cesta de la compra, una vez que aparece el producto A. Confianza esperada es simplemente la probabilidad de que aparezca B en la cesta y Lift (factor de elevación) es el ratio de de dividir confianza por confianza esperada. Un valor de lift = 1 indica que ese conjunto aparece una cantidad de veces acorde a lo esperado bajo condiciones de independencia. Un valor de lift > 1 indica que ese conjunto aparece una cantidad de veces superior a lo esperado bajo condiciones de independencia (por lo que se puede intuir que existe una relación que hace que los productos se encuentren en el conjunto más veces de lo normal).Por último, en el campo Rule vemos la regla de asociación obtenida.

Este proceso Miner precisa de una preparación de datos en Enterprise Guide y de una integración de ambos procesos.

Podemos realizar este tipo de análisis de forma no costosa con otras potentes herramientas de análisis de datos tales como Knime, R (librería arules), entre otras.

Un estudio similar a este realizado hace tiempo en la cadena Wal-Mart dio lugar a la famosa historia de la correlación entre los pañales y la cerveza: pañales y cerveza