ОВЛАДЕЙТЕ БИБЛИОТЕКАМИ PYTHON ДЛЯ ОБРАБОТКИ МАССИВОВ ДАННЫХ

Data Science with Python

Александра Кардаш Senior Software Engineer в Google

Онлайн-курс

Продолжительность:

17 онлайн-занятий
по понедельникам и четвергам

Научитесь пользоваться библиотеками Python и проводить комплексный анализ данных, чтобы находить инсайты и принимать data-driven решения.

На курсе Data Science with Python вы:

• овладеете 10 ключевыми библиотеками Python для работы с данными и их визуализации

• научитесь очищать данные и искать недостающие значения, а еще овладеете прогнозированием и классификацией, кластерным анализом данных и поиском взаимосвязей

• научитесь запускать A/B-тесты и валидировать гипотезы, отбирать признаки и строить модели Machine Learning

• сможете проводить разведывательный анализ данных, строить деревья решений и ансамбли для задач классификации и прогнозирования.

Лектор курса Data Science with Python

Александра
Кардаш

Senior Software Engineer в Google
former Director of Data Science в Shelf — американском стартапе в сфере Knowledge Management
была одним из первых Data Scientists в Shelf.io и участвовала в развитии DS-команды до более чем 15 специалистов
имеет 5 лет опыта в Data Science в различных технических отраслях, работала со стартапами от идеи до готового продукта
в портфолио ― успешные кейсы в сфере Forecasting & Time Series Analysis, оптимизации, предиктивной аналитики и NLP

Методистка курса Data Science with Python

Ирина
Бескровная

Technical Data Lead у Xometry
former Product Analyst в Genesis Tech
на действующей должности формирует техническое видение аналитических решений и отвечает за масштабирование data-процессов в компании
имеет 5+ лет опыта работы с данными: от Data Engineer до Data Scientist и аналитического лидерства
внедряла A/B-тестирование, сегментации и модели прогнозирования в сфере E-commerce, мобильных приложений
участвовала в создании алгоритма ML-идентификации, использовала модели прогнозирования для выявления потенциальных CPA

ПРОГРАММА КУРСА PYTHON FOR DATA SCIENCE:

01

15.01.2026 19:30

Задачи Data Science. Interactive Python и знакомство с NumPy
- выясните, чем машинное обучение отличается от классического программирования
- поймете, как формулируется задача машинного обучения
- разберете процесс работы над Data Science задачами
- научитесь создавать массивы и выполнять базовые операции над ними в библиотеке NumPy
- ознакомитесь с преимуществами библиотеки NumPy для работы с данными
02

19.01.2026 19:30

NumPy. Линейная алгебра и статистика
- научитесь использовать функции линейной алгебры и статистики в NumPy
- сможете вводить и выводить numpy-матрицы и массивы разной величины
03

22.01.2026 19:30

Знакомство с Pandas
- научитесь создавать, импортировать и экспортировать табличные данные в Pandas Dataframe
- сможете манипулировать табличными данными (создание новых колонок, агрегации)
- выясните, как быстро и удобно работать с табличными данными с помощью Pandas

04

26.01.2026 19:30

Визуализация данных
- научитесь строить базовые визуализации в Python с помощью matplotlib и seaborn
- разберете три способа визуализации данных с Pandas Dataframe
- сможете построить продвинутые визуализации: heatmap, box plot, pair plot, cumulative plot
- овладеете построением базовых интерактивных визуализаций
05

29.01.2026 19:30

Exploratory Data Analysis (EDA) и очистка данных
- поймете цели и этапы EDA
- научитесь исследовать структуру любого набора данных
- сможете обнаруживать пропущенные значения, дубликаты и очищать данные
- будете знать несколько техник заполнения пробелов и поймете, когда какую использовать
06

02.02.2026 19:30

Задача прогнозирования. Линейная регрессия. Градиентный спуск
- поймете, как работает линейная регрессия
- узнаете, как работает алгоритм градиентного спуска
- научитесь тренировать модель линейной регрессии с использованием библиотеки sklearn
- разберетесь, как оценить качество модели линейной регрессии
07

05.02.2026 19:30

Другие типы регрессий
- научитесь строить многомерную линейную регрессию
- узнаете, как интерпретировать коэффициенты линейной регрессии
08

09.02.2026 19:30

Выбор лучшей модели. Техники валидации. Поиск гиперпараметров
- узнаете, зачем разбивать выборку на train/validation/test-выборки
- поймете, в чем отличие validation- и test-выборок
- узнаете, что такое гиперпараметры модели и в чем их отличие от параметров
- ознакомитесь с методами подбора гиперпараметров и научитесь вызывать их в scikit-learn
- узнаете, что такое перекрестная валидация и как использовать ее в sklearn
- поймете, что такое overfit и underfit (и почему это проблема)
- научитесь применять регуляризацию в моделях регрессии
09

12.02.2026 19:30

Задача классификации. Логистическая регрессия
- сможете обучать модель логистической регрессии для классификации данных и оценивать ее качество
- узнаете, что делать в случае мультиклассовой классификации и как оценить качество таких моделей
10

16.02.2026 19:30

Модель «дерева решений»
- ознакомитесь с принципом работы модели «дерева решений»
- сможете обучать модели деревьев решений для решения задач регрессии и классификации
11

19.02.2026 19:30

Ансамбли моделей, алгоритмы бустинга
- поймете, как работают ансамбли моделей и в чем их преимущества
- научитесь строить разные типы ансамблей моделей
- узнаете, какой способ ансамблирования нужно использовать в случае high bias, а какой — в случае high variance
- разберете отличие адаптивного бустинга от градиентного
- ознакомитесь с базовым функционалом библиотеки xgboost
12

23.02.2026 19:30

Выбор признаков. Уменьшение размерности данных
- научитесь уменьшать размерность набора данных с большим количеством признаков
- сможете выбрать фичу так, чтобы оставить только наиболее значимые для модели
- узнаете, как работают и чем отличаются методы уменьшения размерности SVD, PCA и LDA
13

26.02.2026 19:30

Кластерный анализ данных
- научитесь выявлять группы схожих экземпляров в данных с помощью кластеризации
- узнаете, как работают методы кластеризации K-Means, DBSCAN и Agglomerative Clustering
14

02.03.2026 19:30

Статистический анализ данных
- научитесь генерировать случайные величины разных распределений
- сможете проверить гипотезу о нормальности распределения
- научитесь сравнивать распределение двух случайных величин
15

05.03.2026 19:30

От истории AI до Prompt Engineering
- поймете, как развивался искусственный интеллект и почему сейчас произошел «AI-бум»
- разберете разницу между классическим ML и Generative AI
- научитесь формулировать эффективные промпты для задач анализа данных и Python-кода
- сможете использовать базовые AI-инструменты для проверки и оптимизации промптов
16

09.03.2026 19:30

AI Tools for Data & Developers
- ознакомитесь с AI-инструментами для аналитиков и Python-разработчиков
- научитесь использовать AI для написания кода, анализа данных и создания визуализаций
- сможете интегрировать AI-ассистента в собственную рабочую среду (VS Code, Jupyter, GitHub)
17

12.03.2026 19:30

Собеседования и требования к ним. Распространенные ошибки в домашних заданиях
- узнаете, как подготовиться к техническому собеседованию и пройти его успешно
- получите ответы на проблемные вопросы, возникшие в течение курса
- получите правильные ответы на домашние задания и узнаете, какие самые распространенные ошибки совершают специалисты

Регистрация

Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.