Онлайн-курс «Математика и статистика для Data Science» | robot_dreams

Используйте математические методы и теории для обработки Big Data

Математика и статистика для Data Science

Наталья Кеес, Data Scientist в Airbus

Библиотеки Python для анализа данных

ПРОДОЛЖИТЕЛЬНОСТЬ:

18 онлайн-занятий
каждый вторник и четверг

Курс, на котором вы научитесь проводить статистический анализ данных с помощью Python и разовьете математическое мышление для решения реальных задач Data Science. В результате — будете принимать решения на основе цифр, а не абстрактных гипотез.

  • Результаты после курса:

     

    • обрабатываете, анализируете и визуализируете данные с помощью Python и его библиотек

    • используете в работе основные математические методы и теории обработки данных

    • интерпретируете результаты анализа, находите и корректируете ошибки

    • описываете реальные процессы и задачи на математическом языке

    • строите и проверяете статистические гипотезы

    • принимаете правильные решения на основе анализа данных

  • В финале курса презентуете проект — результаты анализа на основе одного из математических методов, который выберете самостоятельно.

В программу курса входят:

  1. СИЛЬНЫЙ КОНТЕНТ

    Освоите основы научного и математического мышления, а также усвоите математические методы и теории, необходимые для обработки данных.

  2. ИНСТРУМЕНТЫ

    Будете использовать библиотеки NumPy, Pandas, Matplotlib, Seaborn, Plotly, scikit-learn, scipy.stats.

  3. ПРАКТИКА

    В финале обучения презентуете курсовую, где используете методы научного и статистического анализа.

  4. КАРЬЕРА

    Получите фундаментальные знания по математике, которые помогут развиваться в Data Science и понимать алгоритмы машинного обучения.

ЛЕКТОР:

Наталья
Кеес

  • Data Scientist в Airbus
  • имеет 5+ лет опыта в Data Science
  • создает системы искусственного интеллекта для обработки естественного языка
  • строит поисковые системы и умные ассистенты для автоматизации процессов
  • работала в Data Science проектах в сферах науки, страхования, машиностроения

Программа курса:

  • 01

    Python для анализа данных: part 1

    • Научитесь запускать код в Jupyter Notebook
    • Проведете базовые операции над числами и простыми структурами данных
    • Примените циклы for и while
    • Поймете, как сочетание «математика + Python» поможет вам в работе
  • 02

    Python для анализа данных: part 2

    • Подключите библиотеки Python
    • Научитесь оперировать данными с помощью библиотек NumPy и Pandas
    • Визуализируете данные и интерпретируете результаты с помощью библиотек Matplotlib и Seaborn
  • 03

    Дескриптивная статистика

    • Примените моду, медиану, среднее значение и среднеквадратическое отклонение для анализа данных
    • Визуализируете результаты анализа и опишете данные
    • Научитесь работать с библиотеками Matplotlib, Seaborn и Plotly
  • 04

    Теория множеств

    • Узнаете, что такое множества и зачем они нужны
    • Используете матрицы и векторы для анализа данных с помощью NumPy
    • Примените операции над множествами в работе с данными
    • Научитесь читать математические обозначения интегрального и дифференциального исчисления
    • Узнаете, как использовать диаграммы Венна для анализа проблем
  • 05

    Теория вероятности

    • Узнаете, что такое вероятность и условная вероятность
    • Выполните простые задания на вероятность
  • 06

    Случайные величины и распределения

    • Примените теорему Байеса в повседневной жизни при принятии решений
    • Узнаете, что такое распределение и как оно связано с вероятностью
    • Поймете, что такое математическое ожидание и дисперсия
    • Научитесь анализировать проблемы и задачи в рабочем контексте
    • Опишете задачу с помощью математического ожидания, дисперсии и коэффициента эксцесса
  • 07

    Зависимость между случайными величинами

    • Поймете разницу между корреляцией и причинностью
    • Научитесь анализировать и использовать в работе диаграммы рассеяния для анализа корреляции
    • Узнаете, что такое математическое ожидание, дисперсия, ковариация и корреляция
  • 08

    Основные распределения

    • Рассмотрите основные распределения, научитесь их применять
    • Выявите, какое распределение описывает вашу проблему
    • Используете библиотеку stats
  • 09

    Данные. Статистика. Выборка

    • Узнаете, что такое статистика и какие проблемы она решает
    • Рассмотрите методы выборки
    • Научитесь планировать и делать сборник данных
  • 10

    Точечная оценка

    • Понимаете, что такое точечная оценка
    • Узнаете, как работает метод максимальной вероятности
    • Используете простые статистики для оценки пропорций и средних значений
  • 11

    Интервальная оценка

    • Рассмотрите, что такое доверительный интервал
    • Интерпретируете доверительный интервал
    • Научитесь строить доверительные интервалы для простых проблем и поймете, в каких случаях они не работают
  • 12

    Проверка статистических гипотез

    • Узнаете, что такое P-значение и как его интерпретировать
    • Разбираетесь в типах ошибок
    • Формулируете статистические гипотезы
    • Проверяете простые статистические гипотезы разными методами
  • 13

    Анализ качественных данных

    • Научитесь анализировать качественные данные
    • Поймете, как строить и анализировать таблицы сопряженности
    • Проверите адекватность модели с помощью chi-square и библиотеки stats
  • 14

    Статистика на практике

    • Научитесь распознавать возможную ошибку в анализе и корректировать ее
    • Узнаете, как проводить поправку во время проверки множеств гипотез
  • 15

    Регрессионный анализ

    • Сформулируете проблему для линейной регрессии
    • Научитесь использовать scikit-learn для регрессионного анализа данных
    • Узнаете, как проверять результат регрессионного анализа на адекватность
    • Отрегулируете свою модель разными методами в случае переобучения
  • 16

    Логистическая регрессия. Введение в машинное обучение

    • Поймете, что такое статистическое обучение
    • Научитесь решать проблемы классификации с помощью логистической регрессии
    • Разберетесь, как применять перекрестную проверку
    • Научитесь использовать scikit-learn для классификации данных с помощью логистической регрессии и перекрестной проверки
    • Научитесь делать перекрестную проверку вручную
  • 17

    Заключительное занятие. Выводы

    • Узнаете, как приниматься за решение проблем
    • Поймете, как снизить вероятность ошибок
  • 18

    Презентация курсового проекта

    • Представите свою работу коллегам

Регистрация

 

 
 
 
Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.