Кристина Исакова
Data Scientist в Holidu
Находите закономерности в прошлом и делайте прогнозы на будущее
Что будет с продажами в следующем месяце, какое количество пользователей вернется за вашим продуктом, как распределить рабочую силу и сколько новых сотрудников нанять, чтобы нарастить производство, ― это лишь часть вопросов, на которые можно ответить с помощью Time Series. Реализовывать модели временных рядов вы научитесь на курсе.
После курса вы сможете использовать библиотеки Pandas, NumPy, Scikit-learn, XGBoots, CatBoots и Prophet для Time Series, строить временные ряды на основе сырых данных, применять разные модели временных рядов: от метода скользящего среднего ― до метода Хольта-Винтерса, разбираться в процессах feature engineering и строить прогнозы «без признаков», строить прогнозы с учетом трендов, сезонности и цикличности.
23 ноября — 13 января
12 занятий (по вторникам и четвергам)
О лекторе
Data Scientist в Holidu
Определите, чем задачи, которые можно решить с помощью Time Series, отличаются от других задач Machine Learning. Ознакомьтесь с библиотеками Python, которые используются в Time Series [Pandas, NumPy, Scikit-learn, XGBoost, CatBoost]. Изучите схему анализа временного ряда: от агрегации ― до построения модели и оценки качества предсказания. Постройте временной ряд на основе сырых данных.
Вспомните базовые понятия статистики, необходимые для дальнейшей оценки предсказаний во временных рядах. Разберитесь в метриках оценки предсказаний. Изучите суть доверительных интервалов и научитесь грамотно представлять результаты своих предсказаний. Постройте простую модель временного ряда и оцените ее точность. Сделайте cross validation для Time Series и определите, чем она отличается от обычной cross validation.
Разберитесь в нюансах работы с разными форматами данных (.csv, .txt, .json). Научитесь подключать внешние базы данных и данные веб-страниц к Excel. Напишите макросы для для автоматического обновления данных с тех источников, которые вы подключили к программе.
Изучите методы построения предсказаний. Поймите суть моделей экспоненциального сглаживания и научитесь повышать сложность модели за счет тренда, сезонности и цикличности. Изучите метод Хольта-Винтерса.
Примените изученные методы на практике. Научитесь аргументировать выбор того или иного метода под задачу. По желанию забронируйте слот на 30 минут личной консультации с лектором и подготовьте вопросы по пройденному материалу.
Ознакомьтесь с преимуществами и недостатками линейной регрессии на реальных примерах. Изучите процессы feature engineering. Узнайте, что можно сделать с временным рядом, если есть только временная переменная и зависимая переменная, которую надо предсказать. Научитесь работать с ограниченным количеством признаков и добавлять нужные признаки по необходимости.
Разберитесь в понятиях [стационарность, авторегрессия, частичная авторегрессия]. Научитесь строить модель ARIMA. Разберите несколько временных рядов на компоненты. Напишите отчет о моделях. По желанию забронируйте слот на 30 минут личной консультации с лектором и подготовьте вопросы по пройденному материалу.
Научитесь подбирать тип отчета под потребности анализа и работать с шаблонами для построения отчетов. Настройте права доступа к отчету.
Ознакомьтесь с алгоритмом работы библиотеки Prophet от Facebook. Узнайте, какие типы задач можно решить с помощью этой библиотеки и какие формулы для этого стоит применять. Сделайте предсказание для временного ряда.
Повторите все темы курса. Ознакомьтесь с Roadmap аналитика и поймите, в каком направлении вам необходимо развиваться. Задайте вопросы лектору о профессии, сложных темах и личном опыте.
Ознакомьтесь с основными понятиями нейронных сетей. Изучите принципы построения нейронных сетей. Научитесь использовать нейронные сети для анализа временных рядов.
Вместе с лектором постройте нейронную сеть для предсказаний. Оцените эту модель и сравните ее с предыдущими. Научитесь выбирать оптимальный метод исходя из задачи. Презентуйте финальный проект и получите фидбек от лектора.
интерпретировать и оценивать результаты прогнозов
находить аномалии и выбросы в реальных данных
применять нейронные сети для временных рядов