Онлайн-курс «Математика и статистика для Data Science» | robot_dreams
  • онлайн-курс
  • 18 занятий
  • курсовой проект

МАТЕМАТИКА И СТАТИСТИКА ДЛЯ DATA SCIENCE

Освойте инструменты для анализа Big Data и прогнозирования с Python, чтобы с помощью математических методов и формул решать задачи в направлении Data Science

Наталья Кеес

5+ лет опыта в Data Science

Data Scientist в Airbus

о курсе

  • Продолжительность:

    18 занятий

  • Курсовой проект:

    дескриптивный анализ и визуализация данных

Вы научитесь проводить статистический анализ данных с помощью Python и освоите инструменты для решения задач Data Science, в частности библиотеки и фреймворки Pandas, NumPy, Matplotlib, Seaborn, Plotly и scikit-learn.

В финале курса представите результаты собственного анализа на основе одного из математических методов, который выберете самостоятельно

ЭТОТ КУРС ДЛЯ ВСЕХ, КТО ЗНАЕТ PYTHON И ХОЧЕТ

  • восполнить пробелы в знаниях математики и статистики и понять процессы, которые стоят за длинными математическими формулами

  • обрабатывать и анализировать данные с помощью математических теорий и формул

  • формировать и валидировать статистические гипотезы, строить регрессионные модели

  • добавлять в свои проекты фичи на основе Data Science и Machine Learning

  • начать карьеру в Data Science

ВОПРОСЫ ОТ СТУДЕНТОВ

photo
1.Научусь ли я правильно проверять гипотезы?

Да, последние занятия курса посвящены проверке статистических гипотез, что научит правильно формулировать и проверять гипотезы с помощью P-значения и других методов.

photo
2. Я не уверен в использовании методов выборки данных. Научусь ли я выбирать правильный?

Занятия по выборке данных и центральной предельной теореме помогут понять, как правильно выбирать метод выборки и как избежать ошибок на этом этапе.

photo
3. Я не могу применять математические методы на практике — стоит ли регистрироваться на курс?

Да, ведь практические задания с использованием Python, scikit-learn и других инструментов позволят студентам научиться сразу же применять теоретические знания на реальных кейсах.

photo
4. А если мне сложно понять корреляции и зависимости между данными?

Курс научит анализировать ковариацию и корреляцию между величинами, что поможет лучше понять связь между различными переменными в данных.

photo
5. Подойдет ли курс, если у меня есть проблемы с построением и интерпретацией регрессионных моделей?

Да, ведь отдельные занятия курса посвящены линейной и полиномиальной регрессии, методам наименьших квадратов и регуляризации. Вы научитесь использовать scikit-learn для построения и проверки регрессионных моделей.

photo
6. А если я не знаю, как строить прогнозы на основе данных?

Занятия по случайным величинам, распределениям и математическому ожиданию научат вас создавать прогностические модели и применять их для анализа и предсказаний.

photo
7. Что делать, если я не понимаю теорию вероятности и ее применение?

Курс объясняет основы теории вероятности, в частности условные вероятности и аксиомы Колмогорова, а также их применение в реальных бизнес-задачах.

photo
8. Как мне преодолеть трудности в работе с большими наборами данных?

На курсе вы научитесь использовать библиотеки Python для эффективной обработки и анализа больших наборов данных, а также решите задачи с помощью векторов и матриц в библиотеке NumPy.

photo
9. Как использовать статистические методы для анализа данных?

Курс постепенно введет в дескриптивную статистику (мода, медиана, среднее значение) и покажет, как эти методы применяют к реальным данным с помощью библиотек Matplotlib и Seaborn.

photo
10. Как начать работать с Python для анализа данных?

Первые занятия курса посвящены настройке среды Python в Jupyter Notebook, знакомству со структурами данных и основными библиотеками (NumPy, Pandas). Это позволит уверенно работать с данными уже с самого начала обучения.

 

В ПРОГРАММУ КУРСА ВХОДЯТ

01

МАТЕМАТИЧЕСКАЯ ТЕОРИЯ

Освоите основы научного и математического мышления, а также усвоите математические методы и теории, необходимые для обработки данных.

02

РАЗБОР ИНСТРУМЕНТОВ

Будете использовать библиотеки Python, такие как NumPy, Pandas, Matplotlib, Seaborn, Plotly, scikit-learn, scipy.stats.

03

АНАЛИТИЧЕСКАЯ ПРАКТИКА

Научитесь решать задачи линейной и логистической регрессии, анализировать и интерпретировать данные, проверять гипотезы и находить закономерности.

04

РАЗРАБОТКА ПРОЕКТА

В течение курса вы создадите курсовой проект, посвященный использованию научного метода и статистического анализа для решения определенной проблемы.

05

АПГРЕЙД СКИЛОВ

Получите фундаментальные знания по математике, которые помогут развиваться в Data Science и понимать алгоритмы машинного обучения.

ЛЕКТОР

Наталья Кеес

Data Scientist в Airbus, 5+ лет опыта в Data Science

  • создает системы искусственного интеллекта для обработки естественного языка

  • строит поисковые системы и умные ассистенты для автоматизации процессов

  • работала в Data Science проектах в сферах науки, страхования, машиностроения

Программа

  • 01 занятие
    31.03 19:30

    Python для анализа данных: part 1

    • Научитесь запускать код в Jupyter Notebook
    • Проведете базовые операции над числами и простыми структурами данных
    • Примените циклы for и while
    • Поймете, как сочетание «математика + Python» поможет вам в работе
  • 02 занятие
    02.04 19:30

    Python для анализа данных: part 2

    • Подключите библиотеки Python
    • Научитесь оперировать данными с помощью библиотек NumPy и Pandas
    • Визуализируете данные и интерпретируете результаты с помощью библиотек Matplotlib и Seaborn
  • 03 занятие
    07.04 19:30

    Дескриптивная статистика

    • Примените моду, медиану, среднее значение и среднеквадратическое отклонение для анализа данных
    • Визуализируете результаты анализа и опишете данные
    • Научитесь работать с библиотеками Matplotlib, Seaborn и Plotly
  • 04 занятие
    09.04 19:30

    Теория множеств

    • Узнаете, что такое множества и зачем они нужны
    • Используете матрицы и векторы для анализа данных с помощью NumPy
    • Примените операции над множествами в работе с данными
    • Научитесь читать математические обозначения интегрального и дифференциального исчисления
    • Узнаете, как использовать диаграммы Венна для анализа проблем
  • 05 занятие
    14.04 19:30

    Теория вероятности

    • Узнаете, что такое вероятность и условная вероятность
    • Выполните простые задания на вероятность
  • 06 занятие
    16.04 19:30

    Случайные величины и распределения

    • Примените теорему Байеса в повседневной жизни при принятии решений
    • Узнаете, что такое распределение и как оно связано с вероятностью
    • Поймете, что такое математическое ожидание и дисперсия
    • Научитесь анализировать проблемы и задачи в рабочем контексте
    • Опишете задачу с помощью математического ожидания, дисперсии и коэффициента эксцесса
  • 07 занятие
    21.04 19:30

    Зависимость между случайными величинами

    • Поймете разницу между корреляцией и причинностью
    • Научитесь анализировать и использовать в работе диаграммы рассеяния для анализа корреляции
    • Узнаете, что такое математическое ожидание, дисперсия, ковариация и корреляция
  • 08 занятие
    23.04 19:30

    Основные распределения

    • Рассмотрите основные распределения, научитесь их применять
    • Выявите, какое распределение описывает вашу проблему
    • Используете библиотеку stats
  • 09 занятие
    28.04 19:30

    Данные. Статистика. Выборка

    • Узнаете, что такое статистика и какие проблемы она решает
    • Рассмотрите методы выборки
    • Научитесь планировать и делать сборник данных
  • 10 занятие
    14.05 19:30

    Точечная оценка

    • Поймете, что такое точечная оценка
    • Узнаете, как работает метод максимальной вероятности
    • Используете простые статистики для оценки пропорций и средних значений
  • 11 занятие
    19.05 19:30

    Интервальная оценка

    • Рассмотрите, что такое доверительный интервал
    • Интерпретируете доверительный интервал
    • Научитесь строить доверительные интервалы для простых проблем и поймете, в каких случаях они не работают
  • 12 занятие
    21.05 19:30

    Проверка статистических гипотез

    • Узнаете, что такое P-значение и как его интерпретировать
    • Разберетесь в типах ошибок
    • Сформулируете статистические гипотезы
    • Проверите простые статистические гипотезы разными методами
  • 13 занятие
    26.05 19:30

    Анализ качественных данных

    • Научитесь анализировать качественные данные
    • Поймете, как строить и анализировать таблицы сопряженности
    • Проверите адекватность модели с помощью chi-square и библиотеки stats
  • 14 занятие
    28.05 19:30

    Статистика на практике

    • Научитесь распознавать возможную ошибку в анализе и корректировать ее
    • Узнаете, как проводить поправку во время проверки множеств гипотез
  • 15 занятие
    02.06 19:30

    Регрессионный анализ

    • Сформулируете проблему для линейной регрессии
    • Научитесь использовать scikit-learn для регрессионного анализа данных
    • Узнаете, как проверять результат регрессионного анализа на адекватность
    • Отрегулируете свою модель разными методами в случае переобучения
  • 16 занятие
    04.06 19:30

    Логистическая регрессия. Введение в машинное обучение

    • Поймете, что такое статистическое обучение
    • Научитесь решать проблемы классификации с помощью логистической регрессии
    • Разберетесь, как применять перекрестную проверку
    • Научитесь использовать scikit-learn для классификации данных с помощью логистической регрессии и перекрестной проверки
    • Научитесь делать перекрестную проверку вручную
  • 17 занятие
    09.06 19:30

    Заключительное занятие. Выводы

    • Узнаете, как приниматься за решение проблем
    • Поймете, как снизить вероятность ошибок
  • 18 занятие
    11.06 19:30

    Презентация курсового проекта

    • Представите свою работу коллегам

Регистрация

Регистрируйтесь на курс, чтобы освоить Python для анализа данных и научиться структурно работать с Big Data.

 
 
 
Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.