Математика та статистика для Data Science — онлайн-курс, який допоможе отримати практичні навички для проведення статистичного аналізу даних за допомогою Python | robot_dreams

Використовуйте математичні методи й теорії для обробки даних

Математика та статистика для Data Science

Кристина Ісакова, PhD в галузі математичного моделювання
Data Scientist у Holidu

Бібліотеки Python для аналізу даних

ТРИВАЛІСТЬ:

21 онлайн-заняття
щовівторка та щочетверга

Курс, на якому ви навчитеся проводити статистичний аналіз даних за допомогою Python та розвинете математичне мислення для розв'язання реальних завдань Data Science, щоб ухвалювати рішення, спираючись на цифри, а не на гіпотези.

  • Результати після курсу:

     

    • обробляєте, аналізуєте та візуалізуєте дані за допомогою Python і його бібліотек

    • використовуєте в роботі основні математичні методи й теорії з обробки даних

    • інтерпретуєте результати аналізу, знаходите та коригуєте помилки

    • описуєте реальні процеси та завдання математичною мовою

    • будуєте та перевіряєте статистичні гіпотези

    • ухвалюєте правильні рішення на основі аналізу даних

  • У фіналі курсу зможете презентувати проєкт — результати власного аналізу на основі одного з математичних методів, який оберете самостійно.

До програми курсу входять:

  1. СИЛЬНИЙ КОНТЕНТ

    Опануєте основи наукового та математичного мислення, а також засвоїте математичні методи й теорії, необхідні для обробки даних.

  2. ІНСТРУМЕНТИ

    Використовуватимете бібліотеки NumPy, Pandas, Matplotlib, Seaborn, Plotly, scikit-learn, scipy.stats.

  3. ПРАКТИКА

    У фіналі навчання презентуєте курсовий проєкт, присвячений використанню наукового методу та статистичного аналізу для розв'язання певної проблеми.

  4. ФІДБЕК ВІД МЕТОДИСТКИ

    Методистка курсу — Вікторія Дворик, Data Scientist у N-iX, яка має 4 роки досвіду у Data Science. Вона перевірятиме домашні завдання та консультуватиме у Slack і на Q&A-сесіях.

  5. КАР’ЄРА

    Набудете фундаментальних знань з математики, які допоможуть розвиватися в Data Science та розуміти алгоритми машинного навчання.

ЛЕКТОР:

Кристина
Ісакова

  • Data Scientist у Holidu (пошук і бронювання житла)
  • розробляла моделі передбачень та моніторингу метрик у німецькій транспортній компанії FlixBus
  • PhD в галузі математичного моделювання
  • має понад 5 років досвіду на позиції Data Scientist
  • проводить Time Series Analysis та знаходить аномалії у даних на позиції Data Scientist у німецькому стартапі з пошуку та бронювання житла Holidu
  • будує системи автоматизованого блокування фроду та «поганих» користувачів
  • викладала фізику та математику в Університеті Генуї [Італія] та Гамбурзькому університеті [Німеччина]

Програма курсу:

  • 01

    Python для аналізу даних: part 1

    • Запускаєте код у Jupyter Notebook
    • Проводите базові операції над числами та простими структурами даних
    • Застосовуєте цикли for та while
    • Розумієте, як поєднання «математика + Python» допоможе вам у роботі
  • 02

    Python для аналізу даних: part 2

    • Під'єднуєте бібліотеки Python
    • Оперуєте даними за допомогою бібліотек NumPy та Pandas
    • Візуалізуєте дані та інтерпретуєте результати за допомогою бібліотек Matplotlib та Seaborn
  • 03

    Дескриптивна статистика

    • Застосовуєте моду, медіану, середнє значення та середньоквадратичне відхилення для аналізу даних
    • Візуалізуєте результати аналізу та описуєте дані
    • Використовуєте бібліотеки Matplotlib, Seaborn та Plotly
  • 04

    Теорія множин

    • Знаєте, що таке множини та навіщо вони потрібні
    • Використовуєте матриці та вектори для аналізу даних за допомогою NumPy
    • Застосовуєте операції над множинами в роботі з даними
    • Вмієте читати математичні позначення інтегрального та диференціального числення
    • Використовуєте діаграми Венна для аналізу проблем
  • 05

    Теорія ймовірності

    • Знаєте, що таке ймовірність та умовна ймовірність
    • Виконуєте прості завдання на ймовірність
  • 06

    Випадкові величини та розподіли

    • Застосовуєте теорему Баєса в щоденному житті під час ухвалення рішень
    • Знаєте, що таке розподіл та як він пов’язаний з імовірністю
    • Розумієте, що таке математичне очікування та дисперсія
    • Вмієте аналізувати проблеми та завдання в робочому контексті
    • Описуєте завдання за допомогою математичного очікування, дисперсії та коефіцієнта ексцесу
  • 07

    Q&A-сесія з методистом

    • Розберете свої запитання на Live-сесії з методистом
  • 08

    Залежність між випадковими величинами

    • Розумієте відмінність між кореляцією та причинністю
    • Вмієте аналізувати й використовувати в роботі діаграми розсіювання для аналізу кореляції
    • Знаєте, що таке математичне очікування, дисперсія, коваріація та кореляція
  • 09

    Основні розподіли

    • Знаєте основні розподіли, вмієте їх застосовувати
    • Визначаєте, який розподіл описує вашу проблему
    • Використовуєте бібліотеку stats
  • 10

    Дані. Статистика. Вибірка

    • Знаєте, що таке статистика та які проблеми вона розвʼязує
    • Вивчили методи вибірки
    • Плануєте та виконуєте збірку даних
  • 11

    Точкова оцінка

    • Розумієте, що таке точкова оцінка
    • Знаєте, як працює метод максимальної вірогідності
    • Використовуєте прості статистики для оцінювання пропорцій та середніх значень
  • 12

    Інтервальна оцінка

    • Знаєте, що таке довірчий інтервал
    • Інтерпретуєте довірчий інтервал
    • Будуєте довірчі інтервали для простих проблем та розумієте, у яких випадках вони не працюють
  • 13

    Перевірка статистичних гіпотез

    • Знаєте, що таке P-значення та як його інтерпретувати
    • Розбираєтесь у типах помилок
    • Формулюєте статистичні гіпотези
    • Перевіряєте прості статистичні гіпотези різними методами
  • 14

    Q&A-сесія з методистом

    • Розберете свої запитання на Live-сесії з методистом
  • 15

    Аналіз якісних даних

    • Аналізуєте якісні дані
    • Будуєте й аналізуєте таблиці сполученості
    • Перевіряєте адекватність моделі за допомогою chi-square та бібліотеки stats
  • 16

    Статистика на практиці

    • Розпізнаєте можливу помилку в аналізі та коригуєте її
    • Проводите поправку під час перевірки множин гіпотез
  • 17

    Регресійний аналіз

    • Формулюєте проблему для лінійної регресії
    • Використовуєте scikit-learn для регресійного аналізу даних
    • Перевіряєте результат регресійного аналізу на адекватність
    • Регулюєте свою модель різними методами в разі перенавчання
  • 18

    Логістична регресія. Вступ до машинного навчання

    • Знаєте, що таке статистичне навчання
    • Розв'язуєте проблеми класифікації за допомогою логістичної регресії
    • Застосовуєте перехресну перевірку
    • Використовуєте scikit-learn для класифікації даних за допомогою логістичної регресії
    • Використовуєте scikit-learn для перехресної перевірки
    • Вмієте робити перехресну перевірку вручну
  • 19

    Q&A-сесія з методистом

    • Розберете свої запитання на Live-сесії з методистом
  • 20

    Висновок, або як брехати за допомогою статистики

    • Знаєте, як братися за розв'язання проблем
    • Розумієте, як зменшити ймовірність помилок
  • 21

    Презентація курсового проєкту

Реєстрація

 

 
 
 
Реєструючись, ви погоджуєтеся з умовами договору-оферти та політикою конфіденційності.