32
La práctica de Machine Learning en la Empresa Emilio Osori Chief Technology Predictive Tech minoru@predictive Dr. Manuel Reyez Gomez Chief Data Scientist Predictive Technologies [email protected]

La Práctica de Machine Learning en la empresa

Embed Size (px)

DESCRIPTION

En esta sesión expondremos el impacto que machine learning tendra en la competividad de las empresas, así como revisar casos concretos del tipo de problemas que machine learning resuelve hoy en día. Así mismo, compartiremos un modelo de adopción de machine learning que los asistentes puedan utilizar para introducir esta práctica en sus organizaciones. Semblanza del conferencista: Manuel Reyes es investigador y consultor en análisis de datos. Cuenta con un doctorado en Ingeniería Eléctrica por la Universidad de Columbia y durante 7 años colaboró como investigador para el grupo de Bing en el corporativo de Microsoft en Redmond, Washington. Emilio Osorio es Consultor Principal en Sistemas Humanos, un colectivo de profesionistas especializados en procesos de adopción y apropiación en tecnologías. Cuenta con una larga trayectoria en la industria de TI, habiendo fundado empresas como NexusNet, Nexusware y el mismo Sistemas Humanos. Emilio también gusta de participar como voluntario en una gama de proyectos y organizaciones sin fines de lucro en proyectos relacionados con educación, tecnología y cultura libres. http://mx.linkedin.com/in/minoruosorio

Citation preview

Page 1: La Práctica de Machine Learning en la empresa

La práctica de Machine Learningen la Empresa

Emilio Osorio GarcíaChief Technology OfficerPredictive Technologies

[email protected]

Dr. Manuel Reyez GomezChief Data ScientistPredictive [email protected]

Page 2: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

¿Qué imaginábamos hace 30 años?

Page 3: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

El presente...

* Traducción Liberal

“Las mejores mentes de mi generación están pensando en como hacer que la gente haga

click en un anuncio. Eso no esta chido”*

-Jeff Hammerback Cofundador de Cloudera

Page 4: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

¿Donde estaremos en 30 años?

Page 5: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

El estado del arte

• No existen soluciones que sean “llave en mano”

• Los datos estructurados crecen exponencialmente

• Se requiere investigación de los problemas específicos de negocio

• Baja utilización de los sistemas analíticos existentes

• Lidiar con el cambio constante en los datos

Page 6: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Que es “Machine Learning”• Es una rama de la Inteligencia artificial• Aprender de los datos• Descubrir, codificar y modelar patrones encontrados

en los datos (historicos) que después permitan estimar variables desconocidas, mediante el uso del contexto

• Representación de los datos (Arte)• Modelo probabilístico

• Genéricos: Neural Networks, SVMs, Decision Trees, etc• A la medida usando la infraestructura de modelos gráficos

“Graphical Models Framework”

Page 7: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Detección de fuentes de sonido

FRECUENCIA

Page 8: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Prediciendo usando el contexto

Page 9: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Usando el modelo para hallar anomalías

Puntos donde los datos no siguen el modelo

Page 10: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Page 11: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Bing Local

Page 12: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Bing Local

Page 13: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Bing Local

Page 14: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Recomendación de Películas

? ? ? ?

Page 15: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Caracterización de Variables

Es Romántica : (0,1)Es infantil: [0,1]Es animada: (0,1)Tiene director famoso: (0,1)Tiene actores famosos: (0,1)Grado de violencia: (0,1,2,3,4,5)Edad promedio de actores: (Continua)Año de publicación: (Discreta)…..…..…..

x0

x1

x2

x3

x4

x5

x6

x7

.

.

.

Clasificación : (0,1,2,3,4,5) y

X

Page 16: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Estimación del modelo

X1 = [0, 1, 0, 1, 0, 3, 23.6, 1981]; y1 = 3 X2 = [1, 1, 0, 1, 1, 4, 43.3, 2013]; y2 = 5 X3 = [0, 1, 1, 1, 1, 5, 14.4, 1999]; y3 = 2 X4 = [1, 1, 1, 1, 0, 4, 35.3, 1954]; y4 = 3 X5 = [0, 1, 0, 1, 0, 3, 23.6, 2001]; y5 = 3X6 = [0, 1, 0, 1, 0, 3, 23.6, 2001]; y6 = 1….

f(W,X) = y’

w0+w1x1+w2x2+w3x3+…= y’

Estimar el modelo consiste en estimar W usando los valores de los ejemplos Xi, yi de tal manera que minimice:

∑𝑖=1

𝑁

(𝑦 ′ 𝑖❑−𝑦 𝑖)

2=¿∑𝑖=1

𝑁

( 𝑓 (𝑊 , 𝑋 𝑖❑)− 𝑦 𝑖)

2¿

Page 17: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

En producción• Para nuevos elementos y sus representaciones X, se

estima sus y’ usando el modelo estimado

?

x0

x1

x2

x3

x4

x5

x6

x7

.

.

.

X

w0+w1x1+w2x2+w3x3+…= y’

y’ =

Page 18: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Otras soluciones• Estimación de riesgo crediticio

• Estimación optima de abasto de suministros

• Estimación de probabilidad de perdida del cliente

• Estimación optima de cantidades de mercancía por tipo y locación (datos no estructurados)

• Selección automática de mejores candidatos para puestos disponibles

Page 19: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

No se necesita descubrir el hilo negro

• Modelos genéricos accesibles en el mercado• Lineal Regression• Neural Networks• Logistic Regression• Support Vector Machines• Decision Trees

• Software Libre– R Studio– Mahout– Weka– MLib

• Software Licenciado– Oracle Data Mining– SAS Advance Analytics– IBM Predictive Analytics– Matlab

Page 20: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

60% Arte – 40% Ciencia• Representación (Arte)

• Representación que generalice correctamente• Representación que induzca transferencia• Limpieza de datos• Normalización de valores • Ajustar representación a las limitaciones del modelo

• Fecha de Publicación: Decision Tree-> Continua • Logistic Regression: discretizada binaria. [1985-1990]

• Ciencia• Selección o diseño del modelo• Prevención de “overfitting”• Regularización de parámetros• Análisis de errores (experto de dominio)• Estar consciente de las limitaciones del modelo

Page 21: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Modelos genéricos vs. a la medida

• Modelos genéricos

• Modelos a la medida

Informacióndel

sistema Modelo

Información del sistema se debe transformar/adaptar al modelo

Informacióndel

sistema ModeloModelo

Modelo se diseña dada la Información del sistema

Page 22: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Modelos genéricos vs. a la medida

• Modelos genéricos• Pros

• Sus propiedades y características han sido ampliamente estudiadas• Muchas implementaciones optimas disponibles • Fáciles de entrenar y probar

• Cons• La información del sistema requiere de un proceso adecuado de los

valores en sus variables para ajustarlas a las predisposiciones y limitaciones de cada modelo

• Tienen Limitaciones, al ser genéricos no son los suficientemente ricos para modelar sistemas complejos

• No son apropiadas para problemas con mas de una variable de salida que interactúan entre si

Page 23: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Modelos genéricos vs. a la medida• Modelos a la medida

• Pros• Como se diseñan para modelar el sistema sin las limitaciones de los

modelos genéricos tienen mejor desempeño• Se pueden patentar• Dan ventajas competitivas• Apropiados para sistemas donde se requiere estimar varias variables

de salida que interactúan entre si. (Predicción de Trafico)

• Cons• Requieren diseño especializado por lo tanto las soluciones son mas

caras que cuando usando modelos genéricos • Soluciones • Soluciones basadas en modelos a la medida requieren mas testeo

que las basadas en modelos genéricos• Soluciones requieren mas tiempo de implementación

Page 24: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Pasos para implementar en relación al

data scientist

• Fase 1• Análisis de factibilidad en datos históricos disponibles.

Determinar si se tienen suficientes y diversos datos que cubran las diferentes condiciones del sistema

• Fase 2 con modelos genéricos• Diseño e implementación de la representación de variables• Selección del modelo• Estimación del modelo (con regularización y “tunning” para

evitar “overfitting”)• Análisis de errores• Recalibración del modelo

Page 25: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Machine Learning como Práctica

• En esencia es investigación y desarrollo

• El reto es como crear una práctica que tenga resultados de negocio

• ¿Como operacionalizar la inteligencia artificial?

Page 26: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Las fases de la metodología CRISP-DM

Page 27: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Lean Machine Learning

• Eliminar el derroche • Construir con Calidad

Incluida • Respetar a las Personas • Crear conocimiento • Diferir los compromisos • Entregar Rápido • Optimizar el Todo

Page 28: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Los roles de equipo en Machine Learning

• Business Product Owner • Business Domain Expert • Data Scientist • Data Analyst • Machine Learning

Engineer • Data Engineer

Page 29: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Nuevas habilidades requeridas

• Formulación correcta de problemas • Cultura de Prototipaje • Intuición para tomar realizar asunciones a

problemas no muy bien definidos • Diseñar experimentos para probar hipótesis • Analizar resultados y plantear mejoras

continuamente

Page 30: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Tecnología: Software Libre para aprender

Page 31: La Práctica de Machine Learning en la empresa

Manuel Reyes / [email protected] SGCE 2014 Emilio Osorio / [email protected]

Tecnología: Proveedores para escalar

Page 32: La Práctica de Machine Learning en la empresa

Preguntas y Respuestas

Emilio Osorio GarcíaChief Technology OfficerPredictive Technologies

[email protected]

Dr. Manuel Reyez GomezChief Data ScientistPredictive [email protected]