Онлайн-курс «Математика і статистика для Data Science» | robot_dreams
  • онлайн-курс
  • 18 занять
  • курсовий проєкт

МАТЕМАТИКА ТА СТАТИСТИКА ДЛЯ DATA SCIENCE

Опануйте інструменти для аналізу Big Data і прогнозування з Python, щоб за допомогою математичних методів і формул розвʼязувати задачі в напрямі Data Science

Наталія Кеес

5+ років досвіду в Data Science

Data Scientist в Airbus

про курс

  • Тривалість:

    18 занять

  • Курсовий проєкт:

    дескриптивний аналіз та візуалізація даних

Ви навчитеся проводити статистичний аналіз даних за допомогою Python та опануєте інструменти для розв’язання завдань Data Science, зокрема бібліотеки та фреймворки Pandas, NumPy, Matplotlib, Seaborn, Plotly та scikit-learn.

У фіналі курсу з математики для Data Science — презентуєте результати власного аналізу на основі одного з методів, який оберете самостійно.

ЦЕЙ КУРС ДЛЯ ВСІХ, ХТО ЗНАЄ PYTHON І ХОЧЕ

  • заповнити прогалини в знаннях математики та статистики й зрозуміти процеси, які стоять за довгими математичними формулами

  • обробляти й аналізувати дані за допомогою математичних теорій і формул

  • формувати і валідувати статистичні гіпотези, будувати регресійні моделі

  • додавати у свої проєкти фічі на основі Data Science і Machine Learning

  • розпочати карʼєру в Data Science

ЗАПИТАННЯ ВІД СТУДЕНТІВ

photo
1.Чи навчуся я правильно перевіряти гіпотези?

Так, останні заняття курсу присвячені перевірці статистичних гіпотез, що навчить правильно формулювати й перевіряти гіпотези за допомогою P-значення та інших методів​.

photo
2. Я не впевнений у використанні методів вибірки даних. Чи навчуся я обирати правильний?

Заняття з вибірки даних та центральної граничної теореми допоможуть зрозуміти, як правильно обирати метод вибірки та як уникнути помилок на цьому етапі.

photo
3. Я не можу застосовувати математичні методи на практиці — чи варто реєструватися на курс?

Так, адже практичні завдання з використанням Python, scikit-learn та інших інструментів дадуть змогу студентам навчитися одразу ж застосовувати теоретичні знання на реальних кейсах​.

photo
4. А якщо мені складно зрозуміти кореляції та залежності між даними?

Курс «Математика для Data Science» навчить аналізувати коваріацію та кореляцію між величинами, що допоможе краще зрозуміти звʼязок між різними змінними в даних.

photo
5. Чи підійде курс, якщо я маю проблеми з побудовою та інтерпретацією регресійних моделей?

Так, адже окремі заняття курсу присвячені лінійній та поліноміальній регресії, методам найменших квадратів і регуляризації. Ви навчитеся використовувати scikit-learn для побудови та перевірки регресійних моделей.

photo
6. А якщо я не знаю, як будувати прогнози на основі даних?

Заняття з випадкових величин, розподілів і математичного очікування навчать вас створювати прогностичні моделі та застосовувати їх для аналізу й передбачень​.

photo
7. Що робити, якщо я не розумію теорію ймовірності та її застосування?

Курс пояснює основи теорії ймовірності, зокрема умовні ймовірності та аксіоми Колмогорова, а також їхнє застосування в реальних бізнес-завданнях.

photo
8. Як мені подолати труднощі в роботі з великими наборами даних?

На курсі ви навчитеся використовувати бібліотеки Python для ефективної обробки та аналізу великих наборів даних, а також розвʼяжете задачі за допомогою векторів та матриць у бібліотеці NumPy.

photo
9. Як використовувати статистичні методи для аналізу даних?

Курс поступово введе в дескриптивну статистику (мода, медіана, середнє значення) та покаже, як ці методи застосовують до реальних даних за допомогою бібліотек Matplotlib і Seaborn​.

photo
10. Як почати працювати з Python для аналізу даних?

Перші заняття курсу присвячені налаштуванню середовища Python в Jupyter Notebook, знайомству зі структурами даних та основними бібліотеками (NumPy, Pandas). Це дасть змогу впевнено працювати з даними вже з самого початку навчання.

 

ДО ПРОГРАМИ КУРСУ ВХОДЯТЬ

01

МАТЕМАТИЧНА ТЕОРІЯ

Опануєте основи наукового та математичного мислення, а також засвоїте математичні методи й теорії, потрібні для обробки даних.

02

РОЗБІР ІНСТРУМЕНТІВ

На курсі «Математика для Data Science» використовуватимете бібліотеки Python, як-от NumPy, Pandas, Matplotlib, Seaborn, Plotly, scikit-learn, scipy.stats.

03

АНАЛІТИЧНА ПРАКТИКА

Навчитеся розв’язувати завдання лінійної та логістичної регресії, аналізувати й інтерпретувати дані, перевіряти гіпотези та знаходити закономірності.

04

РОЗРОБКА ПРОЄКТУ

Протягом курсу ви створите курсовий проєкт, присвячений використанню наукового методу та статистичного аналізу для розв’язання певної проблеми.

05

АПГРЕЙД СКІЛІВ

Набудете фундаментальних знань з математики, які допоможуть розвиватися в Data Science та розуміти алгоритми машинного навчання.

ЛЕКТОРКА

Наталія Кеес

Data Scientist в Airbus, 5+ років досвіду в Data Science

  • створює системи штучного інтелекту для обробки природної мови

  • будує пошукові системи та розумні асистенти для автоматизації процесів

  • працювала в Data Science проєктах у сферах науки, страхування, машинобудування

Програма

  • 01 заняття
    31.03 19:30

    Python для аналізу даних: part 1

    • Навчитеся запускати код у Jupyter Notebook
    • Проведете базові операції над числами та простими структурами даних
    • Застосуєте цикли for та while
    • Зрозумієте, як поєднання «математика + Python» допоможе вам у роботі
  • 02 заняття
    02.04 19:30

    Python для аналізу даних: part 2

    • Під’єднаєте бібліотеки Python
    • Навчитеся оперувати даними за допомогою бібліотек NumPy та Pandas
    • Візуалізуєте дані та інтерпретуєте результати за допомогою бібліотек Matplotlib та Seaborn
  • 03 заняття
    07.04 19:30

    Дескриптивна статистика

    • Застосуєте моду, медіану, середнє значення та середньоквадратичне відхилення для аналізу даних
    • Візуалізуєте результати аналізу та опишете дані
    • Навчитеся працювати з бібліотеками Matplotlib, Seaborn та Plotly
  • 04 заняття
    09.04 19:30

    Теорія множин

    • Дізнаєтеся, що таке множини та навіщо вони потрібні
    • Використаєте матриці та вектори для аналізу даних за допомогою NumPy
    • Застосуєте операції над множинами в роботі з даними
    • Навчитеся читати математичні позначення інтегрального та диференціального числення
    • Дізнаєтеся, як використовувати діаграми Венна для аналізу проблем
  • 05 заняття
    14.04 19:30

    Теорія ймовірності

    • Дізнаєтеся, що таке ймовірність та умовна ймовірність
    • Виконаєте прості завдання на ймовірність
  • 06 заняття
    16.04 19:30

    Випадкові величини та розподіли

    • Застосуєте теорему Баєса в щоденному житті під час ухвалення рішень
    • Дізнаєтеся, що таке розподіл та як він пов’язаний з імовірністю
    • Зрозумієте, що таке математичне очікування та дисперсія
    • Навчитеся аналізувати проблеми та завдання в робочому контексті
    • Опишете завдання за допомогою математичного очікування, дисперсії та коефіцієнта ексцесу
  • 07 заняття
    21.04 19:30

    Залежність між випадковими величинами

    • Зрозумієте відмінність між кореляцією та причинністю
    • Навчитеся аналізувати й використовувати в роботі діаграми розсіювання для аналізу кореляції
    • Дізнаєтеся, що таке математичне очікування, дисперсія, коваріація та кореляція
  • 08 заняття
    23.04 19:30

    Основні розподіли

    • Розглянете основні розподіли, навчитеся їх застосовувати
    • Визначите, який розподіл описує вашу проблему
    • Використаєте бібліотеку stats
  • 09 заняття
    28.04 19:30

    ДДані. Статистика. Вибірка

    • Дізнаєтеся, що таке статистика та які проблеми вона розвʼязує
    • Розглянете методи вибірки
    • Навчитеся планувати та робити збірку даних
  • 10 заняття
    14.05 19:30

    Точкова оцінка

    • Зрозумієте, що таке точкова оцінка
    • Дізнаєтеся, як працює метод максимальної вірогідності
    • Використаєте прості статистики для оцінювання пропорцій та середніх значень
  • 11 заняття
    19.05 19:30

    Інтервальна оцінка

    • Розглянете, що таке довірчий інтервал
    • Інтерпретуєте довірчий інтервал
    • Навчитеся будувати довірчі інтервали для простих проблем та зрозумієте, у яких випадках вони не працюють
  • 12 заняття
    21.05 19:30

    Перевірка статистичних гіпотез

    • Дізнаєтеся, що таке P-значення та як його інтерпретувати
    • Розберетеся у типах помилок
    • Сформулюєте статистичні гіпотези
    • Перевірите прості статистичні гіпотези різними методами
  • 13 заняття
    26.05 19:30

    Аналіз якісних даних

    • Навчитеся аналізувати якісні дані
    • Зрозумієте, як будувати й аналізувати таблиці сполученості
    • Перевірите адекватність моделі за допомогою chi-square та бібліотеки stats
  • 14 заняття
    28.05 19:30

    Статистика на практиці

    • Навчитеся розпізнавати можливу помилку в аналізі та коригувати її
    • Дізнаєтеся, як проводити поправку під час перевірки множин гіпотез
  • 15 заняття
    02.06 19:30

    Регресійний аналіз

    • Сформулюєте проблему для лінійної регресії
    • Навчитеся використовувати scikit-learn для регресійного аналізу даних
    • Дізнаєтеся, як перевіряти результат регресійного аналізу на адекватність
    • Відрегулюєте свою модель різними методами в разі перенавчання
  • 16 заняття
    04.06 19:30

    Логістична регресія. Вступ до машинного навчання

    • Зрозумієте, що таке статистичне навчання
    • Навчитеся розв’язувати проблеми класифікації за допомогою логістичної регресії
    • Розберетеся, як застосовувати перехресну перевірку
    • Навчитеся використовувати scikit-learn для класифікації даних за допомогою логістичної регресії та перехресної перевірки
    • Навчитеся робити перехресну перевірку вручну
  • 17 заняття
    09.06 19:30

    Заключне заняття. Висновки

    • Дізнаєтеся, як братися за розв’язання проблем
    • Зрозумієте, як зменшити ймовірність помилок
  • 18 заняття
    11.06 19:30

    Презентація курсового проєкту

    • Презентуєте свою роботу колегам

Реєстрація

Реєструйтеся на курс, щоб опанувати Python для аналізу даних та навчитися структурно працювати з Big Data.

 
 
 
Реєструючись, ви погоджуєтеся з умовами договору-оферти та політикою конфіденційності.