МАТЕМАТИКА И СТАТИСТИКА ДЛЯ DATA SCIENCE
Освойте инструменты для анализа Big Data и прогнозирования с Python, чтобы с помощью математических методов и формул решать задачи в направлении Data Science
Наталья Кеес
5+ лет опыта в Data Science
Data Scientist в Airbus

о курсе
- Продолжительность:
18 занятий
- Курсовой проект:
дескриптивный анализ и визуализация данных
Вы научитесь проводить статистический анализ данных с помощью Python и освоите инструменты для решения задач Data Science, в частности библиотеки и фреймворки Pandas, NumPy, Matplotlib, Seaborn, Plotly и scikit-learn.
В финале курса представите результаты собственного анализа на основе одного из математических методов, который выберете самостоятельно
ЭТОТ КУРС ДЛЯ ВСЕХ, КТО ЗНАЕТ PYTHON И ХОЧЕТ
-
восполнить пробелы в знаниях математики и статистики и понять процессы, которые стоят за длинными математическими формулами
-
обрабатывать и анализировать данные с помощью математических теорий и формул
-
формировать и валидировать статистические гипотезы, строить регрессионные модели
-
добавлять в свои проекты фичи на основе Data Science и Machine Learning
-
начать карьеру в Data Science
ВОПРОСЫ ОТ СТУДЕНТОВ
В ПРОГРАММУ КУРСА ВХОДЯТ
ЛЕКТОР
Наталья Кеес
Data Scientist в Airbus, 5+ лет опыта в Data Science
-
создает системы искусственного интеллекта для обработки естественного языка
-
строит поисковые системы и умные ассистенты для автоматизации процессов
-
работала в Data Science проектах в сферах науки, страхования, машиностроения
Программа
-
01 занятие31.03 19:30
Python для анализа данных: part 1
- Научитесь запускать код в Jupyter Notebook
- Проведете базовые операции над числами и простыми структурами данных
- Примените циклы for и while
- Поймете, как сочетание «математика + Python» поможет вам в работе
-
02 занятие02.04 19:30
Python для анализа данных: part 2
- Подключите библиотеки Python
- Научитесь оперировать данными с помощью библиотек NumPy и Pandas
- Визуализируете данные и интерпретируете результаты с помощью библиотек Matplotlib и Seaborn
-
03 занятие07.04 19:30
Дескриптивная статистика
- Примените моду, медиану, среднее значение и среднеквадратическое отклонение для анализа данных
- Визуализируете результаты анализа и опишете данные
- Научитесь работать с библиотеками Matplotlib, Seaborn и Plotly
-
04 занятие09.04 19:30
Теория множеств
- Узнаете, что такое множества и зачем они нужны
- Используете матрицы и векторы для анализа данных с помощью NumPy
- Примените операции над множествами в работе с данными
- Научитесь читать математические обозначения интегрального и дифференциального исчисления
- Узнаете, как использовать диаграммы Венна для анализа проблем
-
05 занятие14.04 19:30
Теория вероятности
- Узнаете, что такое вероятность и условная вероятность
- Выполните простые задания на вероятность
-
06 занятие16.04 19:30
Случайные величины и распределения
- Примените теорему Байеса в повседневной жизни при принятии решений
- Узнаете, что такое распределение и как оно связано с вероятностью
- Поймете, что такое математическое ожидание и дисперсия
- Научитесь анализировать проблемы и задачи в рабочем контексте
- Опишете задачу с помощью математического ожидания, дисперсии и коэффициента эксцесса
-
07 занятие21.04 19:30
Зависимость между случайными величинами
- Поймете разницу между корреляцией и причинностью
- Научитесь анализировать и использовать в работе диаграммы рассеяния для анализа корреляции
- Узнаете, что такое математическое ожидание, дисперсия, ковариация и корреляция
-
08 занятие23.04 19:30
Основные распределения
- Рассмотрите основные распределения, научитесь их применять
- Выявите, какое распределение описывает вашу проблему
- Используете библиотеку stats
-
09 занятие28.04 19:30
Данные. Статистика. Выборка
- Узнаете, что такое статистика и какие проблемы она решает
- Рассмотрите методы выборки
- Научитесь планировать и делать сборник данных
-
10 занятие14.05 19:30
Точечная оценка
- Поймете, что такое точечная оценка
- Узнаете, как работает метод максимальной вероятности
- Используете простые статистики для оценки пропорций и средних значений
-
11 занятие19.05 19:30
Интервальная оценка
- Рассмотрите, что такое доверительный интервал
- Интерпретируете доверительный интервал
- Научитесь строить доверительные интервалы для простых проблем и поймете, в каких случаях они не работают
-
12 занятие21.05 19:30
Проверка статистических гипотез
- Узнаете, что такое P-значение и как его интерпретировать
- Разберетесь в типах ошибок
- Сформулируете статистические гипотезы
- Проверите простые статистические гипотезы разными методами
-
13 занятие26.05 19:30
Анализ качественных данных
- Научитесь анализировать качественные данные
- Поймете, как строить и анализировать таблицы сопряженности
- Проверите адекватность модели с помощью chi-square и библиотеки stats
-
14 занятие28.05 19:30
Статистика на практике
- Научитесь распознавать возможную ошибку в анализе и корректировать ее
- Узнаете, как проводить поправку во время проверки множеств гипотез
-
15 занятие02.06 19:30
Регрессионный анализ
- Сформулируете проблему для линейной регрессии
- Научитесь использовать scikit-learn для регрессионного анализа данных
- Узнаете, как проверять результат регрессионного анализа на адекватность
- Отрегулируете свою модель разными методами в случае переобучения
-
16 занятие04.06 19:30
Логистическая регрессия. Введение в машинное обучение
- Поймете, что такое статистическое обучение
- Научитесь решать проблемы классификации с помощью логистической регрессии
- Разберетесь, как применять перекрестную проверку
- Научитесь использовать scikit-learn для классификации данных с помощью логистической регрессии и перекрестной проверки
- Научитесь делать перекрестную проверку вручную
-
17 занятие09.06 19:30
Заключительное занятие. Выводы
- Узнаете, как приниматься за решение проблем
- Поймете, как снизить вероятность ошибок
-
18 занятие11.06 19:30
Презентация курсового проекта
- Представите свою работу коллегам
Регистрация
Регистрируйтесь на курс, чтобы освоить Python для анализа данных и научиться структурно работать с Big Data.
