МАТЕМАТИКА ТА СТАТИСТИКА ДЛЯ DATA SCIENCE
Опануйте інструменти для аналізу Big Data і прогнозування з Python, щоб за допомогою математичних методів і формул розвʼязувати задачі в напрямі Data Science
Наталія Кеес
5+ років досвіду в Data Science
Data Scientist в Airbus

про курс
- Тривалість:
18 занять
- Курсовий проєкт:
дескриптивний аналіз та візуалізація даних
Ви навчитеся проводити статистичний аналіз даних за допомогою Python та опануєте інструменти для розв’язання завдань Data Science, зокрема бібліотеки та фреймворки Pandas, NumPy, Matplotlib, Seaborn, Plotly та scikit-learn.
У фіналі курсу з математики для Data Science — презентуєте результати власного аналізу на основі одного з методів, який оберете самостійно.
ЦЕЙ КУРС ДЛЯ ВСІХ, ХТО ЗНАЄ PYTHON І ХОЧЕ
-
заповнити прогалини в знаннях математики та статистики й зрозуміти процеси, які стоять за довгими математичними формулами
-
обробляти й аналізувати дані за допомогою математичних теорій і формул
-
формувати і валідувати статистичні гіпотези, будувати регресійні моделі
-
додавати у свої проєкти фічі на основі Data Science і Machine Learning
-
розпочати карʼєру в Data Science
ЗАПИТАННЯ ВІД СТУДЕНТІВ
ДО ПРОГРАМИ КУРСУ ВХОДЯТЬ
ЛЕКТОРКА
Наталія Кеес
Data Scientist в Airbus, 5+ років досвіду в Data Science
-
створює системи штучного інтелекту для обробки природної мови
-
будує пошукові системи та розумні асистенти для автоматизації процесів
-
працювала в Data Science проєктах у сферах науки, страхування, машинобудування
Програма
-
01 заняття31.03 19:30
Python для аналізу даних: part 1
- Навчитеся запускати код у Jupyter Notebook
- Проведете базові операції над числами та простими структурами даних
- Застосуєте цикли for та while
- Зрозумієте, як поєднання «математика + Python» допоможе вам у роботі
-
02 заняття02.04 19:30
Python для аналізу даних: part 2
- Під’єднаєте бібліотеки Python
- Навчитеся оперувати даними за допомогою бібліотек NumPy та Pandas
- Візуалізуєте дані та інтерпретуєте результати за допомогою бібліотек Matplotlib та Seaborn
-
03 заняття07.04 19:30
Дескриптивна статистика
- Застосуєте моду, медіану, середнє значення та середньоквадратичне відхилення для аналізу даних
- Візуалізуєте результати аналізу та опишете дані
- Навчитеся працювати з бібліотеками Matplotlib, Seaborn та Plotly
-
04 заняття09.04 19:30
Теорія множин
- Дізнаєтеся, що таке множини та навіщо вони потрібні
- Використаєте матриці та вектори для аналізу даних за допомогою NumPy
- Застосуєте операції над множинами в роботі з даними
- Навчитеся читати математичні позначення інтегрального та диференціального числення
- Дізнаєтеся, як використовувати діаграми Венна для аналізу проблем
-
05 заняття14.04 19:30
Теорія ймовірності
- Дізнаєтеся, що таке ймовірність та умовна ймовірність
- Виконаєте прості завдання на ймовірність
-
06 заняття16.04 19:30
Випадкові величини та розподіли
- Застосуєте теорему Баєса в щоденному житті під час ухвалення рішень
- Дізнаєтеся, що таке розподіл та як він пов’язаний з імовірністю
- Зрозумієте, що таке математичне очікування та дисперсія
- Навчитеся аналізувати проблеми та завдання в робочому контексті
- Опишете завдання за допомогою математичного очікування, дисперсії та коефіцієнта ексцесу
-
07 заняття21.04 19:30
Залежність між випадковими величинами
- Зрозумієте відмінність між кореляцією та причинністю
- Навчитеся аналізувати й використовувати в роботі діаграми розсіювання для аналізу кореляції
- Дізнаєтеся, що таке математичне очікування, дисперсія, коваріація та кореляція
-
08 заняття23.04 19:30
Основні розподіли
- Розглянете основні розподіли, навчитеся їх застосовувати
- Визначите, який розподіл описує вашу проблему
- Використаєте бібліотеку stats
-
09 заняття28.04 19:30
ДДані. Статистика. Вибірка
- Дізнаєтеся, що таке статистика та які проблеми вона розвʼязує
- Розглянете методи вибірки
- Навчитеся планувати та робити збірку даних
-
10 заняття14.05 19:30
Точкова оцінка
- Зрозумієте, що таке точкова оцінка
- Дізнаєтеся, як працює метод максимальної вірогідності
- Використаєте прості статистики для оцінювання пропорцій та середніх значень
-
11 заняття19.05 19:30
Інтервальна оцінка
- Розглянете, що таке довірчий інтервал
- Інтерпретуєте довірчий інтервал
- Навчитеся будувати довірчі інтервали для простих проблем та зрозумієте, у яких випадках вони не працюють
-
12 заняття21.05 19:30
Перевірка статистичних гіпотез
- Дізнаєтеся, що таке P-значення та як його інтерпретувати
- Розберетеся у типах помилок
- Сформулюєте статистичні гіпотези
- Перевірите прості статистичні гіпотези різними методами
-
13 заняття26.05 19:30
Аналіз якісних даних
- Навчитеся аналізувати якісні дані
- Зрозумієте, як будувати й аналізувати таблиці сполученості
- Перевірите адекватність моделі за допомогою chi-square та бібліотеки stats
-
14 заняття28.05 19:30
Статистика на практиці
- Навчитеся розпізнавати можливу помилку в аналізі та коригувати її
- Дізнаєтеся, як проводити поправку під час перевірки множин гіпотез
-
15 заняття02.06 19:30
Регресійний аналіз
- Сформулюєте проблему для лінійної регресії
- Навчитеся використовувати scikit-learn для регресійного аналізу даних
- Дізнаєтеся, як перевіряти результат регресійного аналізу на адекватність
- Відрегулюєте свою модель різними методами в разі перенавчання
-
16 заняття04.06 19:30
Логістична регресія. Вступ до машинного навчання
- Зрозумієте, що таке статистичне навчання
- Навчитеся розв’язувати проблеми класифікації за допомогою логістичної регресії
- Розберетеся, як застосовувати перехресну перевірку
- Навчитеся використовувати scikit-learn для класифікації даних за допомогою логістичної регресії та перехресної перевірки
- Навчитеся робити перехресну перевірку вручну
-
17 заняття09.06 19:30
Заключне заняття. Висновки
- Дізнаєтеся, як братися за розв’язання проблем
- Зрозумієте, як зменшити ймовірність помилок
-
18 заняття11.06 19:30
Презентація курсового проєкту
- Презентуєте свою роботу колегам
Реєстрація
Реєструйтеся на курс, щоб опанувати Python для аналізу даних та навчитися структурно працювати з Big Data.
