МАТЕМАТИКА И СТАТИСТИКА ДЛЯ DATA SCIENCE
Получите практические навыки для проведения статистического анализа данных с помощью Python
Наталья Кеес
5+ лет опыта в Data Science
Data Scientist в Airbus
О КУРСЕ
- Продолжительность:
18 занятий
- Курсовой проект:
дескриптивный анализ и визуализация данных
Вы научитесь проводить статистический анализ данных с помощью Python и разовьете математическое мышление для решения реальных задач Data Science, чтобы принимать решения, опираясь на цифры, а не на гипотезы.
В финале курса презентуете проект — результаты анализа на основе одного из математических методов, который выберете самостоятельно. .
ПОСЛЕ КУРСА ВЫ
-
обрабатываете, анализируете и визуализируете данные с помощью Python и его библиотек
-
используете в работе основные математические методы и теории обработки данных
-
интерпретируете результаты анализа, находите и корректируете ошибки
-
описываете реальные процессы и задачи на математическом языке
-
строите и проверяете статистические гипотезы
-
принимаете правильные решения на основе анализа данных
В ПРОГРАММУ КУРСА ВХОДЯТ
ЛЕКТОРКА:
Наталья Кеес
Data Scientist в Airbus, 5+ лет опыта в Data Science
-
создает системы искусственного интеллекта для обработки естественного языка
-
строит поисковые системы и умные ассистенты для автоматизации процессов
-
работала в Data Science проектах в сферах науки, страхования, машиностроения
Программа
-
01 занятие18.11 19:30
Python для анализа данных: part 1
- Научитесь запускать код в Jupyter Notebook
- Проведете базовые операции над числами и простыми структурами данных
- Примените циклы for и while
- Поймете, как сочетание «математика + Python» поможет вам в работе
-
02 занятие20.11 19:30
Python для анализа данных: part 2
- Подключите библиотеки Python
- Научитесь оперировать данными с помощью библиотек NumPy и Pandas
- Визуализируете данные и интерпретируете результаты с помощью библиотек Matplotlib и Seaborn
-
03 занятие25.11 19:30
Дескриптивная статистика
- Примените моду, медиану, среднее значение и среднеквадратическое отклонение для анализа данных
- Визуализируете результаты анализа и опишете данные
- Научитесь работать с библиотеками Matplotlib, Seaborn и Plotly
-
04 занятие27.11 19:30
Теория множеств
- Узнаете, что такое множества и зачем они нужны
- Используете матрицы и векторы для анализа данных с помощью NumPy
- Примените операции над множествами в работе с данными
- Научитесь читать математические обозначения интегрального и дифференциального исчисления
- Узнаете, как использовать диаграммы Венна для анализа проблем
-
05 занятие02.12 19:30
Теория вероятности
- Узнаете, что такое вероятность и условная вероятность
- Выполните простые задания на вероятность
-
06 занятие04.12 19:30
Случайные величины и распределения
- Примените теорему Байеса в повседневной жизни при принятии решений
- Узнаете, что такое распределение и как оно связано с вероятностью
- Поймете, что такое математическое ожидание и дисперсия
- Научитесь анализировать проблемы и задачи в рабочем контексте
- Опишете задачу с помощью математического ожидания, дисперсии и коэффициента эксцесса
-
07 занятие09.12 19:30
Зависимость между случайными величинами
- Поймете разницу между корреляцией и причинностью
- Научитесь анализировать и использовать в работе диаграммы рассеяния для анализа корреляции
- Узнаете, что такое математическое ожидание, дисперсия, ковариация и корреляция
-
08 занятие11.12 19:30
Основные распределения
- Рассмотрите основные распределения, научитесь их применять
- Выявите, какое распределение описывает вашу проблему
- Используете библиотеку stats
-
09 занятие16.12 19:30
Данные. Статистика. Выборка
- Узнаете, что такое статистика и какие проблемы она решает
- Рассмотрите методы выборки
- Научитесь планировать и делать сборник данных
-
10 занятие18.12 19:30
Точечная оценка
- Поймете, что такое точечная оценка
- Узнаете, как работает метод максимальной вероятности
- Используете простые статистики для оценки пропорций и средних значений
-
11 занятие23.12 19:30
Интервальная оценка
- Рассмотрите, что такое доверительный интервал
- Интерпретируете доверительный интервал
- Научитесь строить доверительные интервалы для простых проблем и поймете, в каких случаях они не работают
-
12 занятие30.12 19:30
Проверка статистических гипотез
- Узнаете, что такое P-значение и как его интерпретировать
- Разберетесь в типах ошибок
- Сформулируете статистические гипотезы
- Проверьте простые статистические гипотезы разными методами
-
13 занятие06.01 19:30
Анализ качественных данных
- Научитесь анализировать качественные данные
- Поймете, как строить и анализировать таблицы сопряженности
- Проверите адекватность модели с помощью chi-square и библиотеки stats
-
14 занятие08.01 19:30
Статистика на практике
- Научитесь распознавать возможную ошибку в анализе и корректировать ее
- Узнаете, как проводить поправку во время проверки множеств гипотез
-
15 занятие13.01 19:30
Регрессионный анализ
- Сформулируете проблему для линейной регрессии
- Научитесь использовать scikit-learn для регрессионного анализа данных
- Узнаете, как проверять результат регрессионного анализа на адекватность
- Отрегулируете свою модель разными методами в случае переобучения
-
16 занятие15.01 19:30
Логистическая регрессия. Введение в машинное обучение
- Поймете, что такое статистическое обучение
- Научитесь решать проблемы классификации с помощью логистической регрессии
- Разберетесь, как применять перекрестную проверку
- Научитесь использовать scikit-learn для классификации данных с помощью логистической регрессии и перекрестной проверки
- Научитесь делать перекрестную проверку вручную
-
17 занятие20.01 19:30
Заключительное занятие. Выводы
- Узнаете, как приниматься за решение проблем
- Поймете, как снизить вероятность ошибок
-
18 занятие22.01 19:30
Презентация курсового проекта
- Представите свою работу коллегам
РЕГИСТРАЦИЯ
Регистрируйтесь на курс, чтобы овладеть Python для анализа данных и научиться структурно работать с Big Data.