Data science своими руками на R. Использование data science...

Preview:

Citation preview

Data science своими руками на R

Использование data science моделей для анализа

данных про маркетинг и рекламу

Алексей Данилин

Докладчик

Мы делаем прибыльнее бизнес наших клиентов

Наши разработки

Про Netpeak

Работаем на рынке

интернет-маркетинга

с 2006 года

2000+

успешных проектов

200+

сертифицированных

специалистов

7 офисов в

4 странах мира

лет работы на результат11

проектасоставляют наш опыт и знаниевсех необходимых деталей

2 024

интернет-магазиновувеличивают свои продажи благодарярезультатам нашей работы

806

сотрудниковработают над этим

327

сертификатовподтверждают их профессиональный уровень

287

выступленияна профильных мероприятиях

284

офисов в 5 странахКиев, Одесса, Харьков, Алматы, София, Москва, Самара, Нью-Йорк

8

проведенных отраслевых конференцийобучают и развивают рынок интернет-маркетинга с 2011 года

10

наградза участие в международных рейтингах

25

публикацийв Блоге Netpeak про интернет-маркетинги не только

1 100

публикацийо нас в тематических СМИ

169

отзывот довольных клиентов

81

Про Netpeak

Как мы определяем успех нашего маркетинга

Все начинается с ...

С другой стороны ...

Зачем маркетологу язык программирования

Остановимся на R

“R is a language and environment for statistical computing and

graphics”.

“First appeared August 1993”.

Больше об R:

https://www.r-project.org/about.html

Почему R

Почему R

Почему R

Почему R

Почему R

Почему R

http://www.dataseries.org/

Почему R

Почему R

Почему R

А не лучше ли Python?

Какие задачи будем сегодня решать

● R https://goo.gl/aVG7NJ

● R Studio https://goo.gl/PdLRgx

● Рабочий код https://goo.gl/CNycY5

Что нам понадобится

Сам по себе R не sexy

Но есть RStudio

Кластеризация

RFM

Дерево решений

Научиться можно тут:

https://stepik.org/course/497/

https://stepik.org/course/129/

https://stepik.org/course/724/

Мы не будем учиться программировать

1. Базовый анализ.

2. Построение дерева решений.

3. Обогащение данных с помощью кластеризации.

4. Обогащение данных с помощью RFM.

5. Адаптация дерева решений под новые данные.

6. Построение прогноза для ранее не известных данных.

7. Улучшение модели прогнозирования.

Процесс

Пора заглянуть в код

Алексей Данилин

Analytics Strategist

xxx xxxx

a.danilin@netpeak.net

netpeak

Буду рад ответить на все ваши

вопросы

Recommended