16 онлайн-занятий
[каждый понедельник и четверг]
Практический курс о том, как принимать правильные решения на основе данных, находить закономерности, проверять гипотезы и делать прогнозы даже в условиях неопределенности.
Язык курса — русский
На курсе вы заложите фундамент математического мышления, научитесь проводить регрессионный анализ, применять точечную и интервальную оценку, распределение и статистические модели для решения рабочих задач.
Вы научитесь использовать библиотеки Python для анализа и визуализации данных. Будете решать задачи прогнозирования и классификации при помощи математических формул и аналитики.
По итогам курса вы научитесь структурно работать с большим объемом данных, получите основательный математический бэкграунд и усилите свои компетенции.

Без фундаментальных знаний по математике и статистике не получится проанализировать данные, обучить модель, найти закономерности или предсказать что-то новое.
Поэтому на курсе мы начнем с основ линейной алгебры и теории множеств, изучим базовые опции библиотек NumPy, Pandas, MatPlotLib, Seaborn и Plotly. Затем углубимся в теорию вероятности и методы распределения данных. Будем применять точечную и интервальную оценку, проверять статистические гипотезы, строить регрессии и делать прогнозы.
В результате ― будете принимать правильные решения на основе анализа данных и сможете начать путь в Data Science.
Лектор выстроил программу так, чтобы вы не просто заучивали математические формулы и подходы, а понимали, как устроены процессы анализа и прогнозирования, и сразу же применяли знания на практике.
В процессе обучения вы будете использовать библиотеки NumPy, Pandas, MatPlotLib, Seaborn, Plotly, scikit-learn, scipy.stats.
Будете находить закономерности, валидировать гипотезы, строить линейную и полиномиальную регрессию. По каждому домашнему заданию вы будете получать фидбек от методиста Виктории Дворник - Data Scientist в Epam. Также мы предусмотрели сессии по разбору домашнего задания с лектором на онлайн занятиях, где вы сможете задать вопросы и получить ответы на них.
Получите фундаментальные знания по математике, с которыми сможете развиваться в Data Science и понимать алгоритмы машинного обучения. Это откроет перед вами возможности карьерного роста.

- Научитесь определять структуры данных и проводить операции над ними.
- Изучите базовые функции Jupyter Notebook.
- Запустите код в Jupyter Notebook.
- Научитесь подключать библиотеки Python.
- Научитесь оперировать данными с помощью библиотек NumPy и Pandas.
- Узнаете, как использовать дескриптивную статистику для описания и визуализации данных.
- Научитесь применять моду, медиану, среднее значение и среднеквадратическое отклонение для анализа данных.
- Освоите визуализацию данных с помощью библиотек Matplotlib, Seaborn и Plotly.
- Перейдете к изучению основных понятий теории множеств.
- Научитесь применять операции над множествами в работе с данными, использовать диаграммы Венна для анализа проблем.
- Научитесь работать с векторами и матрицами с помощью библиотеки NumPy.
- Научитесь читать математические обозначения для разработки и внедрения алгоритмов.
- Узнаете, в чем разница между вероятностью и статистикой.
- Овладеете разными подходами определения вероятности.
- Научитесь решать простые задачи на вероятность.
- Изучите теорему Байеса, чтобы правильно рассуждать о вероятности в повседневной жизни.
- Разберетесь в понятиях распределения, математического ожидания, дисперсии, ковариации, корреляции и т. д.
- Установите взаимосвязь между распределением и вероятностью.
- Научитесь анализировать и использовать в работе диаграммы рассеяния для анализа корреляции.
- Ознакомитесь с примерами использования распределений, математического ожидания и дисперсии.
- Разберетесь в том, какая связь существует между распределением и вероятностью.
- Узнаете, в чем заключается разница между корреляцией и причинностью и поможет ли прохождение этого курса увеличить вашу зарплату.
- Научитесь анализировать и использовать диаграмму рассеяния для анализа корреляции.
- Изучите основные виды распределений: биномное распределение, распределение Пуассона, распределение Гаусса. Научитесь их применять.
- Научитесь определять, какое распределение описывает вашу проблему.
- Начнете использовать библиотеку stats.
- Разберетесь в том, что такое статистика и какие вопросы она решает.
- Изучите методы выборки.
- Научитесь планировать и выполнять сборку данных.
- Примените моду, медиану и среднее значение для анализа данных, а затем визуализируете результаты анализа и опишете данные с помощью библиотек Matplotlib, Seaborn и Plotly.
- Научитесь предсказывать результаты выборов.
- Изучите понятие точечной оценки.
- Сделаете первые шаги к интерпретации данных.
- Сможете использовать интервальную оценку для определения ошибок во время интерпретации данных.
- Изучите, что такое доверительный интервал, какие бывают его примеры и интерпретации.
- Построите доверительный интервал для простой проблемы.
- Перейдете к исследованию главных и конкурирующих гипотез.
- Узнаете, что такое значение P и как его интерпретировать.
- Научитесь определять типы ошибок.
- Сформулируете статистическую гипотезу, а затем проверите ее разными способами.
- Откроете доступ к знаниям о качественных переменных и непараметрических методах.
- Научитесь анализировать качественные данные.
- Построите и проанализируете таблицы сопряженности.
- Проверите соответствие модели с помощью chi-square и библиотеки stats.
- Научитесь использовать статистические методы на предприятии.
- Распознаете возможную ошибку в анализе и откорректируете ее.
- Поймете, как проводить поправку при проверке множества гипотез.
- Изучите понятия линейной регрессии, полиномиальной регрессии, метода наименьших квадратов.
- Сформулируете проблему для линейной регрессии.
- Сможете использовать библиотеку scikit-learn для регрессионного анализа данных.
- Проверите результат регрессионного анализа на адекватность.
- Познакомитесь с основами статистического обучения.
- Научитесь решать проблемы классификации с помощью логистической регрессии.
- Научитесь применять перекрестную проверку.