Курс Data Science with Python: обучение анализу данных | robot_dreams

ОВЛАДЕЙТЕ БИБЛИОТЕКАМИ PYTHON ДЛЯ ОБРАБОТКИ МАССИВОВ ДАННЫХ

Data Science with Python

Александра Кардаш Senior Software Engineer в Google

Онлайн-курс

Продолжительность:

17 онлайн-занятий
по понедельникам и четвергам

Научитесь пользоваться библиотеками Python и проводить комплексный анализ данных, чтобы находить инсайты и принимать data-driven решения.

На курсе Data Science with Python вы:

  • • овладеете 10 ключевыми библиотеками Python для работы с данными и их визуализации

    • научитесь очищать данные и искать недостающие значения, а еще овладеете прогнозированием и классификацией, кластерным анализом данных и поиском взаимосвязей

    • научитесь запускать A/B-тесты и валидировать гипотезы, отбирать признаки и строить модели Machine Learning

    • сможете проводить разведывательный анализ данных, строить деревья решений и ансамбли для задач классификации и прогнозирования.

Лектор курса Data Science with Python

Александра
Кардаш

  • Senior Software Engineer в Google
  • former Director of Data Science в Shelf — американском стартапе в сфере Knowledge Management
  • была одним из первых Data Scientists в Shelf.io и участвовала в развитии DS-команды до более чем 15 специалистов
  • имеет 5 лет опыта в Data Science в различных технических отраслях, работала со стартапами от идеи до готового продукта
  • в портфолио ― успешные кейсы в сфере Forecasting & Time Series Analysis, оптимизации, предиктивной аналитики и NLP

Методистка курса Data Science with Python

Ирина
Бескровная

  • Technical Data Lead у Xometry
  • former Product Analyst в Genesis Tech
  • на действующей должности формирует техническое видение аналитических решений и отвечает за масштабирование data-процессов в компании
  • имеет 5+ лет опыта работы с данными: от Data Engineer до Data Scientist и аналитического лидерства
  • внедряла A/B-тестирование, сегментации и модели прогнозирования в сфере E-commerce, мобильных приложений
  • участвовала в создании алгоритма ML-идентификации, использовала модели прогнозирования для выявления потенциальных CPA

ПРОГРАММА КУРСА PYTHON FOR DATA SCIENCE:

  • 01

    15.01.2026 19:30

    Задачи Data Science. Interactive Python и знакомство с NumPy

    • выясните, чем машинное обучение отличается от классического программирования
    • поймете, как формулируется задача машинного обучения
    • разберете процесс работы над Data Science задачами
    • научитесь создавать массивы и выполнять базовые операции над ними в библиотеке NumPy
    • ознакомитесь с преимуществами библиотеки NumPy для работы с данными
  • 02

    19.01.2026 19:30

    NumPy. Линейная алгебра и статистика

    • научитесь использовать функции линейной алгебры и статистики в NumPy
    • сможете вводить и выводить numpy-матрицы и массивы разной величины
  • 03

    22.01.2026 19:30

    Знакомство с Pandas

    • научитесь создавать, импортировать и экспортировать табличные данные в Pandas Dataframe
    • сможете манипулировать табличными данными (создание новых колонок, агрегации)
    • выясните, как быстро и удобно работать с табличными данными с помощью Pandas
  • 04

    26.01.2026 19:30

    Визуализация данных

    • научитесь строить базовые визуализации в Python с помощью matplotlib и seaborn
    • разберете три способа визуализации данных с Pandas Dataframe
    • сможете построить продвинутые визуализации: heatmap, box plot, pair plot, cumulative plot
    • овладеете построением базовых интерактивных визуализаций
  • 05

    29.01.2026 19:30

    Exploratory Data Analysis (EDA) и очистка данных

    • поймете цели и этапы EDA
    • научитесь исследовать структуру любого набора данных
    • сможете обнаруживать пропущенные значения, дубликаты и очищать данные
    • будете знать несколько техник заполнения пробелов и поймете, когда какую использовать
  • 06

    02.02.2026 19:30

    Задача прогнозирования. Линейная регрессия. Градиентный спуск

    • поймете, как работает линейная регрессия
    • узнаете, как работает алгоритм градиентного спуска
    • научитесь тренировать модель линейной регрессии с использованием библиотеки sklearn
    • разберетесь, как оценить качество модели линейной регрессии
  • 07

    05.02.2026 19:30

    Другие типы регрессий

    • научитесь строить многомерную линейную регрессию
    • узнаете, как интерпретировать коэффициенты линейной регрессии
  • 08

    09.02.2026 19:30

    Выбор лучшей модели. Техники валидации. Поиск гиперпараметров

    • узнаете, зачем разбивать выборку на train/validation/test-выборки
    • поймете, в чем отличие validation- и test-выборок
    • узнаете, что такое гиперпараметры модели и в чем их отличие от параметров
    • ознакомитесь с методами подбора гиперпараметров и научитесь вызывать их в scikit-learn
    • узнаете, что такое перекрестная валидация и как использовать ее в sklearn
    • поймете, что такое overfit и underfit (и почему это проблема)
    • научитесь применять регуляризацию в моделях регрессии
  • 09

    12.02.2026 19:30

    Задача классификации. Логистическая регрессия

    • сможете обучать модель логистической регрессии для классификации данных и оценивать ее качество
    • узнаете, что делать в случае мультиклассовой классификации и как оценить качество таких моделей
  • 10

    16.02.2026 19:30

    Модель «дерева решений»

    • ознакомитесь с принципом работы модели «дерева решений»
    • сможете обучать модели деревьев решений для решения задач регрессии и классификации
  • 11

    19.02.2026 19:30

    Ансамбли моделей, алгоритмы бустинга

    • поймете, как работают ансамбли моделей и в чем их преимущества
    • научитесь строить разные типы ансамблей моделей
    • узнаете, какой способ ансамблирования нужно использовать в случае high bias, а какой — в случае high variance
    • разберете отличие адаптивного бустинга от градиентного
    • ознакомитесь с базовым функционалом библиотеки xgboost
  • 12

    23.02.2026 19:30

    Выбор признаков. Уменьшение размерности данных

    • научитесь уменьшать размерность набора данных с большим количеством признаков
    • сможете выбрать фичу так, чтобы оставить только наиболее значимые для модели
    • узнаете, как работают и чем отличаются методы уменьшения размерности SVD, PCA и LDA
  • 13

    26.02.2026 19:30

    Кластерный анализ данных

    • научитесь выявлять группы схожих экземпляров в данных с помощью кластеризации
    • узнаете, как работают методы кластеризации K-Means, DBSCAN и Agglomerative Clustering
  • 14

    02.03.2026 19:30

    Статистический анализ данных

    • научитесь генерировать случайные величины разных распределений
    • сможете проверить гипотезу о нормальности распределения
    • научитесь сравнивать распределение двух случайных величин
  • 15

    05.03.2026 19:30

    От истории AI до Prompt Engineering

    • поймете, как развивался искусственный интеллект и почему сейчас произошел «AI-бум»
    • разберете разницу между классическим ML и Generative AI
    • научитесь формулировать эффективные промпты для задач анализа данных и Python-кода
    • сможете использовать базовые AI-инструменты для проверки и оптимизации промптов
  • 16

    09.03.2026 19:30

    AI Tools for Data & Developers

    • ознакомитесь с AI-инструментами для аналитиков и Python-разработчиков
    • научитесь использовать AI для написания кода, анализа данных и создания визуализаций
    • сможете интегрировать AI-ассистента в собственную рабочую среду (VS Code, Jupyter, GitHub)
  • 17

    12.03.2026 19:30

    Собеседования и требования к ним. Распространенные ошибки в домашних заданиях

    • узнаете, как подготовиться к техническому собеседованию и пройти его успешно
    • получите ответы на проблемные вопросы, возникшие в течение курса
    • получите правильные ответы на домашние задания и узнаете, какие самые распространенные ошибки совершают специалисты

Регистрация

 

 
 
 
Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.