ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС ЖИВОЙ ОНЛАЙН-КУРС

DATA SCIENCE WITH PYTHON

даты: 10 августа — 9 октября 2023

длительность: 10 недель каждый понедельник и четверг 19:30 по Киеву

ЗАПИСАТЬСЯ

АЛЕКСАНДРА КАРДАШ

r_d

ЗАПИСАТЬСЯ

Живой онлайн-курс по углубленной работе с Python и его библиотеками

Курс для тех, кто хочет научиться пользоваться библиотеками Python для решения задач анализа данных.

Обучать и давать фидбек будет Александра Кардаш, Data Scientist в Shelf.

КУРС ПОДОЙДЕТ:

ВЫ АНАЛИТИК

Вы умеете делать запросы в базы данных, использовать формулы в Excel, писать отчеты — и хотите перейти на Python, чтобы с помощью простого кода проводить манипуляции над данными и на основе глубокого анализа предлагать бизнес-решения, которые точно сработают.
ВЫ PYTHON-РАЗРАБОТЧИК

Вы имеете 1+ год опыта программирования на Python, можете автоматизировать пайплайны обработки данных и хотите научиться проводить Exploratory Data Analysis, делать прогнозы и строить простые ML-модели.

ПРО КУРС:

На курсе вы научитесь использовать 6 основных библиотек Python для задач Data Science и машинного обучения:

- NumPy для работы с цифрами и Big Data

- Pandas для манипулирования и быстрой работы с табличными данными

- Matplotlib, Seaborn и Plotly для построения визуализаций (гистограмм, диаграмм, графиков и карт)

- scikit-learn для тренировки моделей линейной регрессии

Вы сможете проводить Exploratory Data Analysis, обучать модели деревьев решений для задач регрессии и классификации, делать прогнозы и начать свой путь в Data Science.

В ПРОГРАММУ КУРСА ВХОДЯТ:

ИНСТРУМЕНТЫ

Научитесь работать с цифрами и математическими формулами в NumPy, с табличными данными ― в Pandas, с визуализациями ― в Matplotlib, Seaborn и Plotly. И освоите еще 6 библиотек Python для Data Science.
СИЛЬНЫЙ КОНТЕНТ

Получите overview основных задач Data Science, разберете базовые типы визуализаций и модели регрессий, техники построения ансамблей и моделей machine learning.
ПРАКТИКА

Во время обучения вас ждет много практики. Вы будете выполнять сложные домашние задания и получать фидбек от лектора по каждому.
КАРЬЕРА

Значительно расширите стек навыков, сможете внедрить новые решения на текущей работе и заложите фундамент для развития в Data Science.

ЛЕКТОР:

АЛЕКСАНДРА
КАРДАШ

Data Scientist в Shelf ― американском стартапе в сфере knowledge management
была одним из первых Data Scientists в Shelf.io и принимала участие в развитии DS команды до более чем 15 специалистов
имеет 5 лет опыта в Data Science в разных технических областях, работала со стартапами от идеи до готового продукта
в портфолио ― успешные кейсы в сфере Forecasting & Time Series Analysis, оптимизации, предиктивной аналитике и NLP

Программа

01

10.08.2023

Задачи Data Science. Interactive Python и знакомство с NumPy
- узнаете, чем машинное обучение отличается от классического программирования, и ознакомитесь с видами задач машинного обучения
- освоите инструменты для интерактивной работы с Python [IPython, Jupyter Notebook и Google Colaboratory]
- познакомитесь с библиотекой NumPy
- научитесь работать с типом данных Array: инициализация, характеристики, копирование, типы данных, reshape, фильтрация, сортировка
- изучите базовые математические функции Array
- научитесь создавать массивы и выполнять базовые операции над ними в библиотеке NumPy
02

14.08.2023

NumPy. Линейная алгебра и статистика
- получите краткое введение в линейную алгебру и разберете на примерах, как эти математические функции работают в библиотеке NumPy
- научитесь использовать математические и статистические функции в NumPy
- научитесь вводить и выводить NumPy-матрицы и массивы разной величины
03

17.08.2023

Знакомство с Pandas
- узнаете, зачем нужна библиотека Pandas и что она позволяет делать с данными
- ознакомитесь со структурами данных в Pandas (Series и DataFrame) и научитесь проводить базовые операции над ними
- научитесь создавать, импортировать и экспортировать табличные данные в Pandas DataFrame
- научитесь манипулировать табличными данными
- узнаете, как быстро и удобно работать с табличными данными с помощью Pandas
04

21.08.2023

Визуализация данных
- ознакомитесь с библиотекой Matplotlib
- научитесь строить базовые визуализации в Python с помощью Matplotlib
- узнаете о трех способах визуализировать данные в Pandas DataFrame
- научитесь строить продвинутые визуализации: heatmap, box plot, pair plot, cumulative plot
- научитесь строить базовые интерактивные визуализации
05

28.08.2023

Exploratory Data Analysis (EDA) и очистка данных
- узнаете, что такое Exploratory Data Analysis (EDA) и его основные компоненты
- научитесь быстро понимать структуру набора данных любого размера
- узнаете, что делать с пропущенными данными и дубликатами
- научитесь проводить EDA с помощью Pandas, SweetViz, Pandas Profiling
06

31.08.2023

Поиск и удаление пропущенных значений
- узнаете, что такое пропущенные значения и почему их нужно прорабатывать
- ознакомитесь с типами пропущенных значений (случайные, последствия системной ошибки и т. п.)
- научитесь обнаруживать пропущенные значения в выборке данных
- ознакомитесь с разными способами заполнения пропущенных значений и научитесь использовать каждый из них
07

04.09.2023

Задача прогнозирования. Линейная регрессия. Градиентный спуск
- разберете модель простой линейной регрессии и ее математическую основу
- ознакомитесь с методом наименьших квадратов и методом градиентного спуска
- научитесь тренировке модели линейной регрессии с помощью библиотеки scikit-learn
- узнаете, как оценивать качество модели линейной регрессии, и научитесь работать с метриками MSE и RMSE
08

07.09.2023

Другие типы регрессий
- разберете модель многомерной линейной регрессии и научитесь строить ее с помощью scikit-learn
- научитесь интерпретировать коэффициенты линейной регрессии
- разберете модель полиномиальной регрессии
- узнаете, как оценивать качество модели с помощью метрик MAE, MAPE, R-squared
- разберете модели гребневой регрессии, регрессии по методу LASSO и регрессии «эластичная сеть»
09

11.09.2023

Выбор наилучшей модели. Техники валидации. Поиск гиперпараметров
- узнаете, зачем разбивать выборку на train/validation/test-выборки
- поймете, в чем отличие validation- и test-выборок
- узнаете, что такое гиперпараметры модели и в чем их отличие от параметров
- ознакомитесь с методами подбора гиперпараметров и научитесь вызывать их в scikit-learn
- узнаете, что такое перекрестная валидация и как использовать ее в sklearn
- поймете, что такое overfit и underfit (и почему это проблема)
- научитесь применять регуляризацию в моделях регрессии
10

14.09.2023

Задача классификации. Логистическая регрессия
- узнаете, как обучать модель логистической регрессии для классификации данных и оценивать ее качество
- получите алгоритм действий в случае мультиклассовой классификации и поймете, как оценить качество таких моделей
11

18.09.2023

Модель «деревья решений»
- ознакомитесь с моделью «деревья решений» и узнаете, в чем ее отличие от линейных моделей
- научитесь строить модель «деревья решений» в scikit-learn
12

21.09.2023

Ансамбли моделей
- поймете, как работают ансамбли моделей и в чем их преимущества
- разберете базовые (Max Voting, Averaging, Weighted Averaging) и продвинутые (Stacking, Bagging, Boosting) техники построения ансамблей
- научитесь строить разные типы ансамблей моделей
- узнаете, какой способ ансамблирования нужно использовать в случае high bias, а какой — в случае high variance
13

25.09.2023

Алгоритмы бустинга: адаптивный и градиентный бустинг. Библиотеки XGBoost
- изучите принципы работы адаптивного и градиентного бустингов
- ознакомитесь с функциями библиотеки XGBoost, разберете ее особенности и преимущества
14

28.09.2023

Кластерный анализ данных
- разберете модель кластеризации в качестве примера задачи обучения без учителя
- разберете модели кластеризации K-Means, DBSCAN, Agglomerative Clustering, а также особенности их построения и принципы работы на практике
- научитесь выявлять группы схожих экземпляров данных с помощью кластеризации
15

02.10.2023

Выбор признаков. Уменьшение размерности данных
- научитесь уменьшать размерность набора данных с большим количеством признаков
- научитесь выбирать фичи так, чтобы оставить только самые значимые для модели
- узнаете, как работают и чем отличаются методы уменьшения размерности SVD, PCA и LDA
16

05.10.2023

Статистический анализ данных
- ознакомитесь с библиотекой SciPy
- научитесь генерировать случайные величины разных вероятностных распределений, проводить тесты нормальности и сравнивать распределения двух случайных величин
- изучите основы проверки статистических гипотез: ошибки I и II рода, p-value
- узнаете, как проводить А/В-тестирование и проверять гипотезы
17

09.10.2023

Защита курсового проекта

Регистрация

Чтобы узнать больше о курсе и стоимости, зарегистрируйтесь.

Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.