Онлайн-курс Data scientist | robot_dreams

навчіться будувати прогнозні моделі

DATA SCIENTIST

Дмитро Безущак Data Scientist / ML Engineer
5+ років досвіду

Тривалість:

4 місяці
35 онлайн-занять
щопонеділка та щосереди

Комплексний курс про магію даних. За 4 місяці ви опануєте повний стек інструментів і скілів дата-саєнтиста, а також навчитеся створювати та тренувати нейромережі, щоб допомагати бізнесу, промисловості, науці та медицині розробляти й покращувати продукти.

КУРС ПІДІЙДЕ

  • Початківцям і студентам технічних напрямів

    щоб розпочати карʼєру в ІТ із перспективного неперегрітого напряму, опанувати повний стек інструментів дата-саєнтиста, навчитися працювати з масивами даних, будувати моделі прогнозування та нейромережі під потреби бізнесу.

  • Аналітикам даних

    щоб автоматизувати рутинну роботу, навчитися працювати з Big Data без хаосу, формулювати бізнес-завдання через математичні закономірності, писати код на Python і користуватися його фреймворками для задач Data Science.

  • Розробникам, тестувальникам, CRM-менеджерам

    щоб навчитися збирати, обробляти, структурувати й читати дані, знаходити в них взаємозв’язки та інсайти для бізнесу; щоб адаптувати власні знання під новий напрям, будувати власні прогнозні моделі та свічнутися в Data Science.

  • Ритейл, фінанси, освіта, медицина, хайтек ― досвідчений дата-саєнтист сьогодні потрібен у будь-якій індустрії. Він може обробляти великі дані й будувати моделі, які дають змогу прогнозувати події та шукати неочевидні закономірності, щоб допомагати бізнесу ухвалювати рішення.

     

  • На цьому курсі ми почнемо з основ і чітко визначимо зони відповідальності дата-саєнтиста. Далі крок за кроком опануємо всі інструменти для аналізу даних і прогнозування: від Excel-таблиць і SQL-запитів до бібліотек TensorFlow, PyTorch, Keras для побудови нейромереж.

    У результаті ― ви навчитеся працювати з даними на рівні дата-саєнтиста й допомагатимете бізнесу створювати й удосконалювати продукти.

До програми курсу входять:

  1. ТЕОРІЯ

    • з нуля пройдете весь шлях професії та розберете ключові обов’язки
    • розвинете Data Scientist Mindset
    • вивчите потрібні математичні поняття та формули

  2. ІНСТРУМЕНТИ

    • писатимете SQL-запити до бази даних
    • навчитеся кодити на Python і користуватися бібліотеками NumPy, Pandas, Matplotlib, PyTorch, scikit-learn, Keras, SciPy, XGBoost, Math, Bokeh, Plotly, Seaborn тощо
    • зможете деплоїти власні моделі за допомогою Docker

  3. ПРАКТИКА

    • навчитеся правильно читати метрики та працювати з масивами даних
    • розв’язуватимете задачі класифікації й кластеризації та проводитимете Time Series Analysis
    • будуватимете моделі прогнозування та нейромережі

  4. ЗАПРОШЕНИЙ ЕКСПЕРТ

    • Владислав Яковенко, Engineering Manager в Bolt із 9-річним досвідом у Data Science
    • допоможе опанувати інструменти обробки Big Data та сформувати майндсет дата-саєнтиста

  5. КАРʼЄРА

    • навчитеся розуміти потреби бізнесу та будувати моделі, які допомагатимуть йому ухвалювати рішення
    • опануєте весь скілсет дата-саєнтиста
    • будете готовими пройти співбесіду на позицію Junior Data Scientist і відразу розв’язувати завдання

ЛЕКТОР:

Дмитро
Безущак

  • понад 5 років працює в Data Science
  • останні 2 роки обіймає посаду Data Scientist / ML Engineer у провідній IT-компанії зі списку S&P 500
  • має успішні релізи NLP- та CV-продуктів
  • разом із командою запустив стартап із розпізнавання логотипів
  • багаторазовий призер хакатонів та змагань Kaggle
  • має ступінь Master of Arts Київської школи економіки та Університету Г’юстона

Програма

  • 01

    01 модуль / заняття 1–2 / 3 години

    Вступ до професії Data Scientist і воркфлоу роботи на курсі

    Теми:

    • Що таке дані та для чого їх збирати
    • Чим відрізняються професії Data Analyst, BI Analyst, Data Engineer, Software Engineer, Data Scientist i Machine Learning Engineer
    • Стек навичок Data Scientist

    Результати:

    • Дізнаєтеся, що таке дані та які можливості є в бізнесу, якщо він правильно збирає та обробляє свої дані.
    • Зрозумієте відмінності між професіями Data Scientist, Data Analyst, BI Analyst і Data Engineer. Розберете зони відповідальності кожної.
    • Дізнаєтеся про види й типи даних.
    • Розберете ключові завдання Data Scientist у компанії.
    • Розберете стек навичок Data Scientist, виокремите власні сильні та слабкі сторони для цієї професії.
  • 02

    02 модуль / заняття 3–10 / 12 годин

    Інструменти Data Scientist

    Теми:

    • Python та Jupyter Notebook
    • Принципи ООП та їхнє застосування в програмуванні на Python
    • Базові концепти Python
    • Функціональне програмування
    • Особливості програмування на Python
    • Основні бібліотеки та фреймворки Python
    • Бібліотеки Python для Data Science

    Результати:

    • Знайомі з концептом і принципами програмування на Python.
    • Знаєте базовий синтаксис Python.
    • Вмієте користуватися Jupyter Notebook.
    • Знайомі з принципами ООП та застосовуєте їх на практиці.
    • Розумієте відмінність між обʼєктно-орієнтованим і функціональним програмуванням.
    • Вмієте використовувати код на Python для пошуку та обробки даних.
    • Розумієте, для чого потрібні бібліотеки Python, та знайомі з основними з них.
    • Знаєте, які бібліотеки Python використовують у Data Science, та вмієте працювати з ними.
  • 03

    03 модуль / заняття 11–17 / 9 годин

    Базова математика для Data Science

    Теми:

    • Основні концепти лінійної алгебри
    • Поняття вектора та операції з векторами
    • Поняття матриці та операції над матрицями
    • Векторний, нормативний та математичний простір
    • Події та ймовірність
    • Розподіл імовірностей
    • Дисперсія
    • Види розподілів

    Результати:

    • Актуалізували забуті знання з лінійної алгебри та статистики.
    • Знайомі з поняттям просторів у математиці та розумієте, для чого вони потрібні.
    • Знайомі з концептами теорії ймовірностей.
    • Знаєте формули розрахунку ймовірностей та вмієте ними користуватися.
    • Розумієте, що таке розподіл, дисперсія, кореляція, коваріація.
    • Вмієте описувати задачі математичною мовою.
    • Застосовуєте математичні формули для розв’язання задач Data Science.
  • 04

    04 модуль / заняття 18–20 / 4.5 години

    Бази даних для Data Science

    Теми:

    • Що таке дані та як їх зберігати
    • SQL для роботи з даними

    Результати:

    • Розумієте, що таке дані та як правильно їх зберігати.
    • Розбираєтесь у видах баз даних.
    • Розумієте відмінність між DB та DBMS.
    • Вмієте писати SQL-запити та користуватися операторами INSERT, DELETE, SELECT, WHERE та JOIN.
    • Знаєте, як «витягнути» потрібні дані з бази.
  • 05

    05 модуль/ заняття 21–28 / 12 годин

    Методи машинного навчання

    Теми:

    • Регресія
    • Задачі класифікації
    • Метод опорних векторів
    • Дерева ухвалення рішень
    • Задачі кластеризації
    • Методи прогнозування
    • Методи оцінки якості прогнозів
    • Поняття нейронних мереж
    • Бібліотеки та фреймворки для роботи з нейромережами
    • Метрики оцінки якості моделей Machine Learning

    Результати:

    • Вмієте будувати лінійну та поліноміальну регресію.
    • Вмієте розв’язувати задачі класифікації та кластеризації.
    • Знаєте, як провести базовий Time Series Analysis.
    • Вмієте будувати прогнози на основі отриманих даних.
    • Вмієте працювати з пакетами PyTorch, TensorFlow, Keras для побудови моделей Machine Learning.
    • Знайомі з метриками оцінки якості моделей.
    • Розумієте, який алгоритм працює «під капотом» нейромереж.
    • Побудували першу нейронну мережу вручну.
    • Вмієте користуватися нейромережами для прогнозування.
  • 06

    06 модуль / заняття 29–31 / 4.5 години

    Аналіз даних і прогнозування

    Теми:

    • Зчитування та обробка даних перед побудовою моделі
    • EDA, Feature Engineering, Feature Importance

    Результати:

    • Зчитуєте дані із CSV, JSON, XLSX, SQLite.
    • Знаєте, як працювати з Missing Data.
    • Будуєте зрозумілі візуалізації для даних.
    • Вмієте знаходити закономірності в даних.
    • Розумієте, чому так важливо правильно зібрати й обробити дані перед побудовою моделей прогнозування і чому не можна просто взяти всі дані та закинути в модель.
    • Знайомі з поняттям Feature та знаєте, що це таке в кожній моделі.
    • Розумієте, навіщо використовувати Feature Importance.
  • 07

    07 модуль / заняття 32–33 / 3 години

    Обробка Big Data та розвиток майндсету дата-саєнтиста

    Теми:

    • Обробка великих даних: парадигми, паралельне обчислення, розподілені системи
    • Компоненти Spark: Core, SQL, MlLib, Streaming, GraphX
    • Основи Spark: RDD, transformations та actions, lazy evaluations
    • Популярні API для роботи зі Spark
    • Базові операції в Databricks Notebook, синтаксис PySpark, візуалізація даних
    • Що таке майндсет дата-саєнтиста
    • Формулювання гіпотез та методи їх перевірки
    • Розуміння потреб бізнесу, поєднання вимог і математичних побажань
    • Вибір підходу та моделі, оцінка моделей
    • Поділ задачі від ПО на таски, планування
    • Презентація результатів та кінцевого рішення
    • Побудова власного профілю Data Scientist

    Результати:

    • Розумієте, що таке великі дані та знаєте принципи їх обробки.
    • Знаєте основи технології Spark та типові ситуації для її застосування.
    • Володієте базовим синтаксисом PySpark для операцій в Spark.
    • Працюєте з даними в Databricks Notebooks.
    • Застосовуєте майндсет дата-саєнтиста на практиці.
  • 08

    08 модуль / заняття 34–35 / 3 години

    Презентація фінального проєкту

    Результати:

    • Отримаєте Tabular Data і застосуєте всі скіли, опановані протягом курсу, на практиці.
    • Опрацюєте дані, побудуєте візуалізації, зберете пайплайн, побудуєте й натренуєте модель для прогнозування.
    • Представите свою модель колегам.

Реєстрація

 

 
 
 
Реєструючись, ви погоджуєтеся з умовами договору-оферти та політикою конфіденційності.