Онлайн-курс «Математика і статистика для Data Science» | robot_dreams
  • онлайн-курс
  • 18 занять
  • курсовий проєкт

МАТЕМАТИКА ТА СТАТИСТИКА ДЛЯ DATA SCIENCE

Набудьте практичних навичок для проведення статистичного аналізу даних за допомогою Python

Наталія Кеес

5+ років досвіду в Data Science

Data Scientist в Airbus

про курс

  • Тривалість:

    18 занять

  • Курсовий проєкт:

    дескриптивний аналіз та візуалізація даних

Ви навчитеся проводити статистичний аналіз даних за допомогою Python та розвинете математичне мислення для розв’язання реальних завдань Data Science, щоб ухвалювати рішення, спираючись на цифри, а не на гіпотези.

У фіналі курсу презентуєте проєкт — результати аналізу на основі одного з математичних методів, який оберете самостійно.

ПІСЛЯ КУРСУ ВИ

  • обробляєте, аналізуєте й візуалізуєте дані за допомогою Python і його бібліотек

  • використовуєте в роботі основні математичні методи й теорії з обробки даних

  • інтерпретуєте результати аналізу, знаходите та коригуєте помилки

  • описуєте реальні процеси та завдання математичною мовою

  • будуєте й перевіряєте статистичні гіпотези

  • ухвалюєте правильні рішення на основі аналізу даних

ДО ПРОГРАМИ КУРСУ ВХОДЯТЬ

01

МАТЕМАТИЧНА ТЕОРІЯ

Опануєте основи наукового та математичного мислення, а також засвоїте математичні методи й теорії, потрібні для обробки даних.

02

РОЗБІР ІНСТРУМЕНТІВ

Використовуватимете бібліотеки Python, як-от NumPy, Pandas, Matplotlib, Seaborn, Plotly, scikit-learn, scipy.stats.

03

АНАЛІТИЧНА ПРАКТИКА

Навчитеся розв’язувати завдання лінійної та логістичної регресії, аналізувати й інтерпретувати дані, перевіряти гіпотези та знаходити закономірності.

04

РОЗРОБКА ПРОЄКТУ

Протягом курсу ви створите курсовий проєкт, присвячений використанню наукового методу та статистичного аналізу для розв’язання певної проблеми.

05

АПГРЕЙД СКІЛІВ

Набудете фундаментальних знань з математики, які допоможуть розвиватися в Data Science та розуміти алгоритми машинного навчання.

ЛЕКТОРКА:

Наталія Кеес

Data Scientist в Airbus, 5+ років досвіду в Data Science

  • створює системи штучного інтелекту для обробки природної мови

  • будує пошукові системи та розумні асистенти для автоматизації процесів

  • працювала в Data Science проєктах у сферах науки, страхування, машинобудування

Програма

  • 01 заняття
    18.11 19:30

    Python для аналізу даних: part 1

    • Навчитеся запускати код у Jupyter Notebook
    • Проведете базові операції над числами та простими структурами даних
    • Застосуєте цикли for та while
    • Зрозумієте, як поєднання «математика + Python» допоможе вам у роботі
  • 02 заняття
    20.11 19:30

    Python для аналізу даних: part 2

    • Під’єднаєте бібліотеки Python
    • Навчитеся оперувати даними за допомогою бібліотек NumPy та Pandas
    • Візуалізуєте дані та інтерпретуєте результати за допомогою бібліотек Matplotlib та Seaborn
  • 03 заняття
    25.11 19:30

    Дескриптивна статистика

    • Застосуєте моду, медіану, середнє значення та середньоквадратичне відхилення для аналізу даних
    • Візуалізуєте результати аналізу та опишете дані
    • Навчитеся працювати з бібліотеками Matplotlib, Seaborn та Plotly
  • 04 заняття
    27.11 19:30

    Теорія множин

    • Дізнаєтеся, що таке множини та навіщо вони потрібні
    • Використаєте матриці та вектори для аналізу даних за допомогою NumPy
    • Застосуєте операції над множинами в роботі з даними
    • Навчитеся читати математичні позначення інтегрального та диференціального числення
    • Дізнаєтеся, як використовувати діаграми Венна для аналізу проблем
  • 05 заняття
    02.12 19:30

    Теорія ймовірності

    • Дізнаєтеся, що таке ймовірність та умовна ймовірність
    • Виконаєте прості завдання на ймовірність
  • 06 заняття
    04.12 19:30

    Випадкові величини та розподіли

    • Застосуєте теорему Баєса в щоденному житті під час ухвалення рішень
    • Дізнаєтеся, що таке розподіл та як він пов’язаний з імовірністю
    • Зрозумієте, що таке математичне очікування та дисперсія
    • Навчитеся аналізувати проблеми та завдання в робочому контексті
    • Опишете завдання за допомогою математичного очікування, дисперсії та коефіцієнта ексцесу
  • 07 заняття
    09.12 19:30

    Залежність між випадковими величинами

    • Зрозумієте відмінність між кореляцією та причинністю
    • Навчитеся аналізувати й використовувати в роботі діаграми розсіювання для аналізу кореляції
    • Дізнаєтеся, що таке математичне очікування, дисперсія, коваріація та кореляція
  • 08 заняття
    11.12 19:30

    Основні розподіли

    • Розглянете основні розподіли, навчитеся їх застосовувати
    • Визначите, який розподіл описує вашу проблему
    • Використаєте бібліотеку stats
  • 09 заняття
    16.12 19:30

    ДДані. Статистика. Вибірка

    • Дізнаєтеся, що таке статистика та які проблеми вона розвʼязує
    • Розглянете методи вибірки
    • Навчитеся планувати та робити збірку даних
  • 10 заняття
    18.12 19:30

    Точкова оцінка

    • Зрозумієте, що таке точкова оцінка
    • Дізнаєтеся, як працює метод максимальної вірогідності
    • Використаєте прості статистики для оцінювання пропорцій та середніх значень
  • 11 заняття
    23.12 19:30

    Інтервальна оцінка

    • Розглянете, що таке довірчий інтервал
    • Інтерпретуєте довірчий інтервал
    • Навчитеся будувати довірчі інтервали для простих проблем та зрозумієте, у яких випадках вони не працюють
  • 12 заняття
    30.12 19:30

    Перевірка статистичних гіпотез

    • Дізнаєтеся, що таке P-значення та як його інтерпретувати
    • Розберетеся у типах помилок
    • Сформулюєте статистичні гіпотези
    • Перевірите прості статистичні гіпотези різними методами
  • 13 заняття
    06.01 19:30

    Аналіз якісних даних

    • Навчитеся аналізувати якісні дані
    • Зрозумієте, як будувати й аналізувати таблиці сполученості
    • Перевірите адекватність моделі за допомогою chi-square та бібліотеки stats
  • 14 заняття
    08.01 19:30

    Статистика на практиці

    • Навчитеся розпізнавати можливу помилку в аналізі та коригувати її
    • Дізнаєтеся, як проводити поправку під час перевірки множин гіпотез
  • 15 заняття
    13.01 19:30

    Регресійний аналіз

    • Сформулюєте проблему для лінійної регресії
    • Навчитеся використовувати scikit-learn для регресійного аналізу даних
    • Дізнаєтеся, як перевіряти результат регресійного аналізу на адекватність
    • Відрегулюєте свою модель різними методами в разі перенавчання
  • 16 заняття
    15.01 19:30

    Логістична регресія. Вступ до машинного навчання

    • Зрозумієте, що таке статистичне навчання
    • Навчитеся розв’язувати проблеми класифікації за допомогою логістичної регресії
    • Розберетеся, як застосовувати перехресну перевірку
    • Навчитеся використовувати scikit-learn для класифікації даних за допомогою логістичної регресії та перехресної перевірки
    • Навчитеся робити перехресну перевірку вручну
  • 17 заняття
    20.01 19:30

    Заключне заняття. Висновки

    • Дізнаєтеся, як братися за розв’язання проблем
    • Зрозумієте, як зменшити ймовірність помилок
  • 18 заняття
    22.01 19:30

    Презентація курсового проєкту

    • Презентуєте свою роботу колегам

Зареєструватися

Реєструйтеся на курс, щоб опанувати Python для аналізу даних та навчитися структурно працювати з Big Data.

 
 
 
Реєструючись, ви погоджуєтеся з умовами договору-оферти та політикою конфіденційності.