25
Как устроено машинное обучение в Qlean Евгений Гапон

Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Embed Size (px)

Citation preview

Page 1: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

КакустроеномашинноеобучениевQlean

ЕвгенийГапон

Page 2: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Мысервис поуборкеквартир• Работаемв3 городахРоссии• СайтиiOS-приложениедляклиентов• Android-приложениедляисполнителей• Свои CRMдляклиентовиисполнителей• Микросервисная архитектура

Page 3: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Аещеунасестьмашинноеобучение

• Скоринг заказовнавероятностьотмены• МодельактивностиклиентовследующиеNдней• МодельактивностиисполнителейследующиеNдней• Скоринг исполнителейнавероятностьнеявкиназаказ• Скоринг лидов исполнителей

Page 4: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Нужнопройтивсего6этапов*

• Сборихранениеданных• Формулировказадачи• Извлечениепризнаков• Построениеиоценкамодели• Бизнес-тестированиемодели• Внедрениемодели

*– обязательнодолжныбытькультураработысданнымиилюди

Page 5: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Планпростипотомукрасив

Page 6: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Сборихранениеданных• Формулировказадачи• Извлечениепризнаков• Построениеиоценкамодели• Бизнес-тестированиемодели• Внедрениемодели

Page 7: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Мысобралиданныеизразныхисточниковводномместе

Нашиисточникиданных:

• Операционныеданныеизproductionбазы

• Клик- иивент-стримы изSnowplow• МобильныйтрекингизAdjust• ОбращениявподдержкуизZendesk• ДанныепозвонкамизМанго• Затратынарекламуизразличных

источников

Postgres

Page 8: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Мысделалиданныедоступными

Page 9: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Сборихранениеданных• Формулировказадачи• Извлечениепризнаков• Построениеиоценкамодели• Бизнес-тестированиемодели• Внедрениемодели

Page 10: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Некоторыезадачиможнорешитьибезмашинногообучения

SQL vs

Page 11: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Сборихранениеданных• Формулировказадачи• Извлечениепризнаков• Построениеиоценкамодели• Бизнес-тестированиемодели• Внедрениемодели

Page 12: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Shitinshitout

Признаки Прогноз

Модель

Page 13: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Заинжениренные признакиработаютлучше

Кол-воотменвпрошлом

Привязаналикредитнаякарта

Кол-водоп.услугвзаказе

Доляотменпопрошедшимзаказам

Наличиеотдельныхдоп.услуг

Page 14: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Сборихранениеданных• Формулировказадачи• Извлечениепризнаков• Построениеиоценкамодели• Бизнес-тестированиемодели• Внедрениемодели

Page 15: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Получшеразберитесьсполученнымрезультатом

0%

20%

40%

60%

80%

100%

0

200

400

600

800

1000

1200

1400

1600

Доляотм

ен

Кол-возаказов

Вероятностьотмены

заказотменилсязаказсостоялсядоляотмен

Page 16: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Сборихранениеданных• Формулировказадачи• Извлечениепризнаков• Построениеиоценкамодели• Бизнес-тестированиемодели• Внедрениемодели

Page 17: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

ДовнедрениямоделимыпроводимручноеA/B-тестирование

40%

50%

60%

70%

80%

90%

100%

[50%;60%) [60%;70%) [70%;80%) [80%;90%) [90%;100%]

Дол

яотмен

Вероятностьотменызаказа

control test

Мырукаминачислялибонусзасохранениезаказатестовойгруппе.Чембольшевероятностьотмены,тембольшебонус.

Page 18: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Сборихранениеданных• Формулировказадачи• Извлечениепризнаков• Построениеиоценкамодели• Бизнес-тестированиемодели• Внедрениемодели

Page 19: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Воттакустроенанаша«ml-инфраструктура»

Productionсреда

Productionбаза

процесс1

процесс2

процесс3

Page 20: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

• Соберитеданныеводномместеиначнитепользоватьсяими• Задачидолжныприходитьотбизнеса• Некоторыезадачиможнорешитьибезмашинногообучения• Нежалейтевременинаизвлечениепризнаков• Заинжениренные признакиработаютлучше• Разберитесьсполученнымрезультатом• ПроводитеручноеA/B-тестирование• Наколеночная инфраструктурарулит!

Итого

Page 21: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Спасибо!

ЕвгенийГапон[email protected]/egapon

Page 22: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean
Page 23: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean
Page 24: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean

Модельскоринга заказовиееприменение

https://goo.gl/gCe33U

Page 25: Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean