МАТЕМАТИКА ТА СТАТИСТИКА ДЛЯ DATA SCIENCE
Набудьте практичних навичок для проведення статистичного аналізу даних за допомогою Python
Наталія Кеес
5+ років досвіду в Data Science
Data Scientist в Airbus
про курс
- Тривалість:
18 занять
- Курсовий проєкт:
дескриптивний аналіз та візуалізація даних
Ви навчитеся проводити статистичний аналіз даних за допомогою Python та розвинете математичне мислення для розв’язання реальних завдань Data Science, щоб ухвалювати рішення, спираючись на цифри, а не на гіпотези.
У фіналі курсу презентуєте проєкт — результати аналізу на основі одного з математичних методів, який оберете самостійно.
ПІСЛЯ КУРСУ ВИ
-
обробляєте, аналізуєте й візуалізуєте дані за допомогою Python і його бібліотек
-
використовуєте в роботі основні математичні методи й теорії з обробки даних
-
інтерпретуєте результати аналізу, знаходите та коригуєте помилки
-
описуєте реальні процеси та завдання математичною мовою
-
будуєте й перевіряєте статистичні гіпотези
-
ухвалюєте правильні рішення на основі аналізу даних
ДО ПРОГРАМИ КУРСУ ВХОДЯТЬ
ЛЕКТОРКА:
Наталія Кеес
Data Scientist в Airbus, 5+ років досвіду в Data Science
-
створює системи штучного інтелекту для обробки природної мови
-
будує пошукові системи та розумні асистенти для автоматизації процесів
-
працювала в Data Science проєктах у сферах науки, страхування, машинобудування
Програма
-
01 заняття18.11 19:30
Python для аналізу даних: part 1
- Навчитеся запускати код у Jupyter Notebook
- Проведете базові операції над числами та простими структурами даних
- Застосуєте цикли for та while
- Зрозумієте, як поєднання «математика + Python» допоможе вам у роботі
-
02 заняття20.11 19:30
Python для аналізу даних: part 2
- Під’єднаєте бібліотеки Python
- Навчитеся оперувати даними за допомогою бібліотек NumPy та Pandas
- Візуалізуєте дані та інтерпретуєте результати за допомогою бібліотек Matplotlib та Seaborn
-
03 заняття25.11 19:30
Дескриптивна статистика
- Застосуєте моду, медіану, середнє значення та середньоквадратичне відхилення для аналізу даних
- Візуалізуєте результати аналізу та опишете дані
- Навчитеся працювати з бібліотеками Matplotlib, Seaborn та Plotly
-
04 заняття27.11 19:30
Теорія множин
- Дізнаєтеся, що таке множини та навіщо вони потрібні
- Використаєте матриці та вектори для аналізу даних за допомогою NumPy
- Застосуєте операції над множинами в роботі з даними
- Навчитеся читати математичні позначення інтегрального та диференціального числення
- Дізнаєтеся, як використовувати діаграми Венна для аналізу проблем
-
05 заняття02.12 19:30
Теорія ймовірності
- Дізнаєтеся, що таке ймовірність та умовна ймовірність
- Виконаєте прості завдання на ймовірність
-
06 заняття04.12 19:30
Випадкові величини та розподіли
- Застосуєте теорему Баєса в щоденному житті під час ухвалення рішень
- Дізнаєтеся, що таке розподіл та як він пов’язаний з імовірністю
- Зрозумієте, що таке математичне очікування та дисперсія
- Навчитеся аналізувати проблеми та завдання в робочому контексті
- Опишете завдання за допомогою математичного очікування, дисперсії та коефіцієнта ексцесу
-
07 заняття09.12 19:30
Залежність між випадковими величинами
- Зрозумієте відмінність між кореляцією та причинністю
- Навчитеся аналізувати й використовувати в роботі діаграми розсіювання для аналізу кореляції
- Дізнаєтеся, що таке математичне очікування, дисперсія, коваріація та кореляція
-
08 заняття11.12 19:30
Основні розподіли
- Розглянете основні розподіли, навчитеся їх застосовувати
- Визначите, який розподіл описує вашу проблему
- Використаєте бібліотеку stats
-
09 заняття16.12 19:30
ДДані. Статистика. Вибірка
- Дізнаєтеся, що таке статистика та які проблеми вона розвʼязує
- Розглянете методи вибірки
- Навчитеся планувати та робити збірку даних
-
10 заняття18.12 19:30
Точкова оцінка
- Зрозумієте, що таке точкова оцінка
- Дізнаєтеся, як працює метод максимальної вірогідності
- Використаєте прості статистики для оцінювання пропорцій та середніх значень
-
11 заняття23.12 19:30
Інтервальна оцінка
- Розглянете, що таке довірчий інтервал
- Інтерпретуєте довірчий інтервал
- Навчитеся будувати довірчі інтервали для простих проблем та зрозумієте, у яких випадках вони не працюють
-
12 заняття30.12 19:30
Перевірка статистичних гіпотез
- Дізнаєтеся, що таке P-значення та як його інтерпретувати
- Розберетеся у типах помилок
- Сформулюєте статистичні гіпотези
- Перевірите прості статистичні гіпотези різними методами
-
13 заняття06.01 19:30
Аналіз якісних даних
- Навчитеся аналізувати якісні дані
- Зрозумієте, як будувати й аналізувати таблиці сполученості
- Перевірите адекватність моделі за допомогою chi-square та бібліотеки stats
-
14 заняття08.01 19:30
Статистика на практиці
- Навчитеся розпізнавати можливу помилку в аналізі та коригувати її
- Дізнаєтеся, як проводити поправку під час перевірки множин гіпотез
-
15 заняття13.01 19:30
Регресійний аналіз
- Сформулюєте проблему для лінійної регресії
- Навчитеся використовувати scikit-learn для регресійного аналізу даних
- Дізнаєтеся, як перевіряти результат регресійного аналізу на адекватність
- Відрегулюєте свою модель різними методами в разі перенавчання
-
16 заняття15.01 19:30
Логістична регресія. Вступ до машинного навчання
- Зрозумієте, що таке статистичне навчання
- Навчитеся розв’язувати проблеми класифікації за допомогою логістичної регресії
- Розберетеся, як застосовувати перехресну перевірку
- Навчитеся використовувати scikit-learn для класифікації даних за допомогою логістичної регресії та перехресної перевірки
- Навчитеся робити перехресну перевірку вручну
-
17 заняття20.01 19:30
Заключне заняття. Висновки
- Дізнаєтеся, як братися за розв’язання проблем
- Зрозумієте, як зменшити ймовірність помилок
-
18 заняття22.01 19:30
Презентація курсового проєкту
- Презентуєте свою роботу колегам
Зареєструватися
Реєструйтеся на курс, щоб опанувати Python для аналізу даних та навчитися структурно працювати з Big Data.