Онлайн-курс «Математика и статистика для Data Science» | robot_dreams
  • онлайн-курс
  • 18 занятий
  • курсовой проект

МАТЕМАТИКА И СТАТИСТИКА ДЛЯ DATA SCIENCE

Получите практические навыки для проведения статистического анализа данных с помощью Python

Наталья Кеес

5+ лет опыта в Data Science

Data Scientist в Airbus

О КУРСЕ

  • Продолжительность:

    18 занятий

  • Курсовой проект:

    дескриптивный анализ и визуализация данных

Вы научитесь проводить статистический анализ данных с помощью Python и разовьете математическое мышление для решения реальных задач Data Science, чтобы принимать решения, опираясь на цифры, а не на гипотезы.

В финале курса презентуете проект — результаты анализа на основе одного из математических методов, который выберете самостоятельно. .

ПОСЛЕ КУРСА ВЫ

  • обрабатываете, анализируете и визуализируете данные с помощью Python и его библиотек

  • используете в работе основные математические методы и теории обработки данных

  • интерпретируете результаты анализа, находите и корректируете ошибки

  • описываете реальные процессы и задачи на математическом языке

  • строите и проверяете статистические гипотезы

  • принимаете правильные решения на основе анализа данных

В ПРОГРАММУ КУРСА ВХОДЯТ

01

МАТЕМАТИЧЕСКАЯ ТЕОРИЯ

Освоите основы научного и математического мышления, а также усвоите математические методы и теории, необходимые для обработки данных.

02

РАЗБОР ИНСТРУМЕНТОВ

Будете использовать библиотеки Python, такие как NumPy, Pandas, Matplotlib, Seaborn, Plotly, scikit-learn, scipy.stats.

03

АНАЛИТИЧЕСКАЯ ПРАКТИКА

Научитесь решать задачи линейной и логистической регрессии, анализировать и интерпретировать данные, проверять гипотезы и находить закономерности.

04

РАЗРАБОТКА ПРОЕКТА

В течение курса вы создадите курсовой проект, посвященный использованию научного метода и статистического анализа для решения определенной проблемы.

05

АПГРЕЙД СКИЛОВ

Получите фундаментальные знания по математике, которые помогут развиваться в Data Science и понимать алгоритмы машинного обучения.

ЛЕКТОРКА:

Наталья Кеес

Data Scientist в Airbus, 5+ лет опыта в Data Science

  • создает системы искусственного интеллекта для обработки естественного языка

  • строит поисковые системы и умные ассистенты для автоматизации процессов

  • работала в Data Science проектах в сферах науки, страхования, машиностроения

Программа

  • 01 занятие
    18.11 19:30

    Python для анализа данных: part 1

    • Научитесь запускать код в Jupyter Notebook
    • Проведете базовые операции над числами и простыми структурами данных
    • Примените циклы for и while
    • Поймете, как сочетание «математика + Python» поможет вам в работе
  • 02 занятие
    20.11 19:30

    Python для анализа данных: part 2

    • Подключите библиотеки Python
    • Научитесь оперировать данными с помощью библиотек NumPy и Pandas
    • Визуализируете данные и интерпретируете результаты с помощью библиотек Matplotlib и Seaborn
  • 03 занятие
    25.11 19:30

    Дескриптивная статистика

    • Примените моду, медиану, среднее значение и среднеквадратическое отклонение для анализа данных
    • Визуализируете результаты анализа и опишете данные
    • Научитесь работать с библиотеками Matplotlib, Seaborn и Plotly
  • 04 занятие
    27.11 19:30

    Теория множеств

    • Узнаете, что такое множества и зачем они нужны
    • Используете матрицы и векторы для анализа данных с помощью NumPy
    • Примените операции над множествами в работе с данными
    • Научитесь читать математические обозначения интегрального и дифференциального исчисления
    • Узнаете, как использовать диаграммы Венна для анализа проблем
  • 05 занятие
    02.12 19:30

    Теория вероятности

    • Узнаете, что такое вероятность и условная вероятность
    • Выполните простые задания на вероятность
  • 06 занятие
    04.12 19:30

    Случайные величины и распределения

    • Примените теорему Байеса в повседневной жизни при принятии решений
    • Узнаете, что такое распределение и как оно связано с вероятностью
    • Поймете, что такое математическое ожидание и дисперсия
    • Научитесь анализировать проблемы и задачи в рабочем контексте
    • Опишете задачу с помощью математического ожидания, дисперсии и коэффициента эксцесса
  • 07 занятие
    09.12 19:30

    Зависимость между случайными величинами

    • Поймете разницу между корреляцией и причинностью
    • Научитесь анализировать и использовать в работе диаграммы рассеяния для анализа корреляции
    • Узнаете, что такое математическое ожидание, дисперсия, ковариация и корреляция
  • 08 занятие
    11.12 19:30

    Основные распределения

    • Рассмотрите основные распределения, научитесь их применять
    • Выявите, какое распределение описывает вашу проблему
    • Используете библиотеку stats
  • 09 занятие
    16.12 19:30

    Данные. Статистика. Выборка

    • Узнаете, что такое статистика и какие проблемы она решает
    • Рассмотрите методы выборки
    • Научитесь планировать и делать сборник данных
  • 10 занятие
    18.12 19:30

    Точечная оценка

    • Поймете, что такое точечная оценка
    • Узнаете, как работает метод максимальной вероятности
    • Используете простые статистики для оценки пропорций и средних значений
  • 11 занятие
    23.12 19:30

    Интервальная оценка

    • Рассмотрите, что такое доверительный интервал
    • Интерпретируете доверительный интервал
    • Научитесь строить доверительные интервалы для простых проблем и поймете, в каких случаях они не работают
  • 12 занятие
    30.12 19:30

    Проверка статистических гипотез

    • Узнаете, что такое P-значение и как его интерпретировать
    • Разберетесь в типах ошибок
    • Сформулируете статистические гипотезы
    • Проверьте простые статистические гипотезы разными методами
  • 13 занятие
    06.01 19:30

    Анализ качественных данных

    • Научитесь анализировать качественные данные
    • Поймете, как строить и анализировать таблицы сопряженности
    • Проверите адекватность модели с помощью chi-square и библиотеки stats
  • 14 занятие
    08.01 19:30

    Статистика на практике

    • Научитесь распознавать возможную ошибку в анализе и корректировать ее
    • Узнаете, как проводить поправку во время проверки множеств гипотез
  • 15 занятие
    13.01 19:30

    Регрессионный анализ

    • Сформулируете проблему для линейной регрессии
    • Научитесь использовать scikit-learn для регрессионного анализа данных
    • Узнаете, как проверять результат регрессионного анализа на адекватность
    • Отрегулируете свою модель разными методами в случае переобучения
  • 16 занятие
    15.01 19:30

    Логистическая регрессия. Введение в машинное обучение

    • Поймете, что такое статистическое обучение
    • Научитесь решать проблемы классификации с помощью логистической регрессии
    • Разберетесь, как применять перекрестную проверку
    • Научитесь использовать scikit-learn для классификации данных с помощью логистической регрессии и перекрестной проверки
    • Научитесь делать перекрестную проверку вручную
  • 17 занятие
    20.01 19:30

    Заключительное занятие. Выводы

    • Узнаете, как приниматься за решение проблем
    • Поймете, как снизить вероятность ошибок
  • 18 занятие
    22.01 19:30

    Презентация курсового проекта

    • Представите свою работу коллегам

РЕГИСТРАЦИЯ

Регистрируйтесь на курс, чтобы овладеть Python для анализа данных и научиться структурно работать с Big Data.

 
 
 
Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.