r_d

Математика и статистика для Data Science

Онлайн-курс о том, почему фраза: ‘математика — царица наук’ — не только любимый аргумент школьных учителей, но и незаменимый аспект в работе с Big Data и Data Science. Для перехода на уровень ‘провожу статистический анализ данных с помощью различных математических методов’, подтвердите свои действия скроллом вниз для ознакомления с курсом и регистрацией.
О курсе

Чтобы найти ответы на вопросы в работе с данными, не делая типичных ошибок, следует научиться анализировать проблемы и методы их решения с помощью математики и статистики. Для решения этой задачи, рекомендуется воспользоваться следующей формулой: (25 часов обучения + домашние задания)².

С ее помощью специалист, который умеет успешно обрабатывать данные, но не способен находить закономерности и тенденции, сможет научиться строить и проверять гипотезы, описывать реальные процессы и задачи математическим языком.

15 июня — 20 августа
записаться
лектор
Сергей Бобровский

Data Scientist в отделении AI Platforms в Airbus

  • на данный момент: занимается разработкой систем искусственного интеллекта для анализа временных рядов из сенсоров
  • спикер международных конференций по искусственному интеллекту в Лондоне (Re-Work Deep Learning Summit), Стокгольме (Nordic Data Science) и Лозанне (Applied Machine Learning Days)
  • до этого: на протяжении 3-х лет работал и преподавал физику и космонавтику в отделе развития бизнеса в Центре Управления Полетами Германского центра авиации и космонавтики (DLR)
  • до этого²: 3 года работал в группе теоретической физики Немецкого Электронного Синхротрона (DESY)
  • итого: имеет более 5-ти лет опыта анализа данных в различных отраслях: от поиска мошенничества в онлайн-торговле до анализа физических данных на Большом Адронном Коллайдере
  • кандидат физико-математических наук, Университет Гамбург
программа
1
занятие 15.06
Python для анализа данных: начало
Начните знакомство с Python. Научитесь определять структуры данных и проводить операции над ними. Изучите базовые функции Jupyter Notebook. Запустите код в Jupyter Notebook.
2
занятие 18.06
Python для анализа данных: продолжение
Подключите библиотеки Python. Научитесь с их помощью упрощать подготовку и обработку данных. Откройте навык ‘умею оперировать данными при помощи библиотек NumPy и Pandas’. Освойте умение ‘визуализация данных с помощью библиотек MatPlotLib и Seaborn’.
3
занятие 29.06
Теория множеств. Линейная алгебра
Перейдите к изучению основных понятий теории множеств. Научитесь применять операции над множествами в работе с данными. Используйте диаграммы Венна для анализа проблем. Перейдите к работе с векторами и матрицами при помощи библиотеки NumPy. Освойте чтение математических обозначений для разработки и имплементации алгоритмов.
4
занятие 02.07
Теория вероятности. Введение
Узнайте, в чем состоит разница между вероятностью и статистикой. Переместитесь на следующий уровень: освойте разные подходы к определению вероятности. Научитесь решать простые задачи на вероятность. Для правильных размышлений о вероятности в повседневной жизни, изучите теорему Байеса.
5
занятие 06.07
Случайные величины и распределения
Получите доступ к знаниям по темам: распределение, математическое ожидание, дисперсия, ковариация и корреляция. Установите взаимосвязь между распределением и вероятностью. Научитесь анализировать и использовать в работе диаграммы рассеяния для анализа корреляции.
6
занятие 09.07
Основные распределения
Изучите основные виды распределений: биномиальное распределение, распределение Пуассона, распределение Гаусса. Научитесь их применять. Получите доступ к возможности определять, какое распределение описывает вашу проблему. Начните использовать библиотеку stats.
7
занятие 13.07
Данные. Статистика. Выборка
Получите ответ на вопрос: ‘что такое статистика и какие вопросы она решает?’. Изучите методы выборки. Научитесь планировать и выполнять сборку данных. Примените моду, медиану и среднее значение для анализа данных А затем визуализируйте результаты анализа и опишите данные с помощью библиотек MatPlotLib, SeaBorn и Plotly.
8
занятие 16.07
Точечная оценка
Научитесь предсказывать результаты выборов. Изучите понятие точечной оценки. Сделайте первые шаги к интерпретации данных: узнайте, что выборка говорит о настоящем распределении. Поймите, как работает метод максимального правдоподобия.
9
занятие 20.07
Интервальная оценка
Научитесь правильно предсказывать результаты выборов. Используйте интервальную оценку для определения ошибок при интерпретации данных. Изучите, что такое доверительный интервал, какие бывают его примеры и интерпретации. Постройте доверительный интервал для простой проблемы.
10
занятие 23.07
Проверка статистических гипотез
Перейдите к изучению основных и конкурирующих гипотез. Узнайте, что такое P-значение и как его интерпретировать. Научитесь определять типы ошибок. Сформулируйте статистическую гипотезу. Затем проверьте её разными методами.
11
занятие 27.07
Анализ качественных данных
Откройте доступ к знаниям о качественных переменных и непараметрических методах. Научитесь анализировать качественные данные. Постройте и проанализируйте таблицы сопряженности. Проверьте адекватность модели c помощью chi-square и библиотеки stats.
12
занятие 30.07
Статистика на практике
Научитесь использовать статистические методы на предприятии. Распознайте возможную ошибку в анализе и откорректируйте ее. Поймите, как проводить поправку при множественной проверке гипотез.
13
занятие 03.08
Регрессионный анализ
Изучите следующие понятия: линейная регрессия, полиномиальная регрессия, метод наименьших квадратов. Сформулируйте проблему для линейной регрессии. Используйте библиотеку ScikitLearn для регрессионного анализа данных. Затем проверьте результат вашего регрессионного анализа на адекватность.
14
занятие 06.08
Логистическая регрессия. Введение в машинное обучение
Познакомьтесь с основами статистического обучения. Научитесь решать проблемы классификации с помощью логистической регрессии. Используйте ScikitLearn. Научитесь применять перекрестную проверку. И снова используйте ScikitLearn. Затем попробуйте сделать перекрестную проверку вручную.
15
занятие 10.08
Заключение. Как врать при помощи статистики
Ознакомьтесь с научным методом и дизайном экспериментов. Разберите примеры экспериментального дизайна. Узнайте о том, как приступать к решению проблем. Научитесь уменьшать вероятность ошибок.
16
занятие 20.08
Презентация курсового проекта
Вам дана тема: ‘Использование научного метода и статистического анализа для решения проблемы’. Ваша задача: провести анализ и презентовать его результаты.
вы
ваши свойства
  • аналитик данных
  • разработчик
  • data scientist
  • product manager
ваши свойства
  • знания линейной алгебры
  • основы интегрального и дифференциального исчисления
Открытие навыка
1
python-библиотеки
сможете работать с основными библиотеками Python для обработки, анализа и визуализации данных
2
построение гипотез
сможете строить и проверять статистические гипотезы
3
решение задач прогнозирования и классификации
научитесь решать задачи при помощи основных математических методов аналитики данных
регистрация

это обязательное поле

введите правильный адрес

это тоже обязательное поле

введите корректный номер телефона

и это тоже обязательное поле

 
 
 
 
Регистрируясь, вы соглашаетесь с условиями
договора-оферты и политикой конфиденциальности.