Тривалість:
4 місяці
35 онлайн-занять
щопонеділка та щосереди
Комплексний курс про магію даних. За 4 місяці ви опануєте повний стек інструментів і скілів дата-саєнтиста, а також навчитеся створювати та тренувати нейромережі, щоб допомагати бізнесу, промисловості, науці та медицині розробляти й покращувати продукти.
КУРС ПІДІЙДЕ
-
Початківцям і студентам технічних напрямів щоб розпочати карʼєру в ІТ із перспективного неперегрітого напряму, опанувати повний стек інструментів дата-саєнтиста, навчитися працювати з масивами даних, будувати моделі прогнозування та нейромережі під потреби бізнесу.
-
Аналітикам даних щоб автоматизувати рутинну роботу, навчитися працювати з Big Data без хаосу, формулювати бізнес-завдання через математичні закономірності, писати код на Python і користуватися його фреймворками для задач Data Science.
-
Розробникам, тестувальникам, CRM-менеджерам щоб навчитися збирати, обробляти, структурувати й читати дані, знаходити в них взаємозв’язки та інсайти для бізнесу; щоб адаптувати власні знання під новий напрям, будувати власні прогнозні моделі та свічнутися в Data Science.
-
Ритейл, фінанси, освіта, медицина, хайтек ― досвідчений дата-саєнтист сьогодні потрібен у будь-якій індустрії. Він може обробляти великі дані й будувати моделі, які дають змогу прогнозувати події та шукати неочевидні закономірності, щоб допомагати бізнесу ухвалювати рішення.
-
На цьому курсі ми почнемо з основ і чітко визначимо зони відповідальності дата-саєнтиста. Далі крок за кроком опануємо всі інструменти для аналізу даних і прогнозування: від Excel-таблиць і SQL-запитів до бібліотек TensorFlow, PyTorch, Keras для побудови нейромереж.
У результаті ― ви навчитеся працювати з даними на рівні дата-саєнтиста й допомагатимете бізнесу створювати й удосконалювати продукти.
До програми курсу входять:
-
ТЕОРІЯ • з нуля пройдете весь шлях професії та розберете ключові обов’язки
• розвинете Data Scientist Mindset
• вивчите потрібні математичні поняття та формули -
ІНСТРУМЕНТИ • писатимете SQL-запити до бази даних
• навчитеся кодити на Python і користуватися бібліотеками NumPy, Pandas, Matplotlib, PyTorch, scikit-learn, Keras, SciPy, XGBoost, Math, Bokeh, Plotly, Seaborn тощо
• зможете деплоїти власні моделі за допомогою Docker -
ПРАКТИКА • навчитеся правильно читати метрики та працювати з масивами даних
• розв’язуватимете задачі класифікації й кластеризації та проводитимете Time Series Analysis
• будуватимете моделі прогнозування та нейромережі -
ЗАПРОШЕНИЙ ЕКСПЕРТ • Владислав Яковенко, Engineering Manager в Bolt із 9-річним досвідом у Data Science
• допоможе опанувати інструменти обробки Big Data та сформувати майндсет дата-саєнтиста -
КАРʼЄРА • навчитеся розуміти потреби бізнесу та будувати моделі, які допомагатимуть йому ухвалювати рішення
• опануєте весь скілсет дата-саєнтиста
• будете готовими пройти співбесіду на позицію Junior Data Scientist і відразу розв’язувати завдання
ЛЕКТОР:
Дмитро
Безущак
- понад 5 років працює в Data Science
- останні 2 роки обіймає посаду Data Scientist / ML Engineer у провідній IT-компанії зі списку S&P 500
- має успішні релізи NLP- та CV-продуктів
- разом із командою запустив стартап із розпізнавання логотипів
- багаторазовий призер хакатонів та змагань Kaggle
- має ступінь Master of Arts Київської школи економіки та Університету Г’юстона
Програма
-
01
01 модуль / заняття 1–2 / 3 години
Вступ до професії Data Scientist і воркфлоу роботи на курсі
Теми:
- Що таке дані та для чого їх збирати
- Чим відрізняються професії Data Analyst, BI Analyst, Data Engineer, Software Engineer, Data Scientist i Machine Learning Engineer
- Стек навичок Data Scientist
Результати:
- Дізнаєтеся, що таке дані та які можливості є в бізнесу, якщо він правильно збирає та обробляє свої дані.
- Зрозумієте відмінності між професіями Data Scientist, Data Analyst, BI Analyst і Data Engineer. Розберете зони відповідальності кожної.
- Дізнаєтеся про види й типи даних.
- Розберете ключові завдання Data Scientist у компанії.
- Розберете стек навичок Data Scientist, виокремите власні сильні та слабкі сторони для цієї професії.
-
02
02 модуль / заняття 3–10 / 12 годин
Інструменти Data Scientist
Теми:
- Python та Jupyter Notebook
- Принципи ООП та їхнє застосування в програмуванні на Python
- Базові концепти Python
- Функціональне програмування
- Особливості програмування на Python
- Основні бібліотеки та фреймворки Python
- Бібліотеки Python для Data Science
Результати:
- Знайомі з концептом і принципами програмування на Python.
- Знаєте базовий синтаксис Python.
- Вмієте користуватися Jupyter Notebook.
- Знайомі з принципами ООП та застосовуєте їх на практиці.
- Розумієте відмінність між обʼєктно-орієнтованим і функціональним програмуванням.
- Вмієте використовувати код на Python для пошуку та обробки даних.
- Розумієте, для чого потрібні бібліотеки Python, та знайомі з основними з них.
- Знаєте, які бібліотеки Python використовують у Data Science, та вмієте працювати з ними.
-
03
03 модуль / заняття 11–17 / 9 годин
Базова математика для Data Science
Теми:
- Основні концепти лінійної алгебри
- Поняття вектора та операції з векторами
- Поняття матриці та операції над матрицями
- Векторний, нормативний та математичний простір
- Події та ймовірність
- Розподіл імовірностей
- Дисперсія
- Види розподілів
Результати:
- Актуалізували забуті знання з лінійної алгебри та статистики.
- Знайомі з поняттям просторів у математиці та розумієте, для чого вони потрібні.
- Знайомі з концептами теорії ймовірностей.
- Знаєте формули розрахунку ймовірностей та вмієте ними користуватися.
- Розумієте, що таке розподіл, дисперсія, кореляція, коваріація.
- Вмієте описувати задачі математичною мовою.
- Застосовуєте математичні формули для розв’язання задач Data Science.
-
04
04 модуль / заняття 18–20 / 4.5 години
Бази даних для Data Science
Теми:
- Що таке дані та як їх зберігати
- SQL для роботи з даними
Результати:
- Розумієте, що таке дані та як правильно їх зберігати.
- Розбираєтесь у видах баз даних.
- Розумієте відмінність між DB та DBMS.
- Вмієте писати SQL-запити та користуватися операторами INSERT, DELETE, SELECT, WHERE та JOIN.
- Знаєте, як «витягнути» потрібні дані з бази.
-
05
05 модуль/ заняття 21–28 / 12 годин
Методи машинного навчання
Теми:
- Регресія
- Задачі класифікації
- Метод опорних векторів
- Дерева ухвалення рішень
- Задачі кластеризації
- Методи прогнозування
- Методи оцінки якості прогнозів
- Поняття нейронних мереж
- Бібліотеки та фреймворки для роботи з нейромережами
- Метрики оцінки якості моделей Machine Learning
Результати:
- Вмієте будувати лінійну та поліноміальну регресію.
- Вмієте розв’язувати задачі класифікації та кластеризації.
- Знаєте, як провести базовий Time Series Analysis.
- Вмієте будувати прогнози на основі отриманих даних.
- Вмієте працювати з пакетами PyTorch, TensorFlow, Keras для побудови моделей Machine Learning.
- Знайомі з метриками оцінки якості моделей.
- Розумієте, який алгоритм працює «під капотом» нейромереж.
- Побудували першу нейронну мережу вручну.
- Вмієте користуватися нейромережами для прогнозування.
-
06
06 модуль / заняття 29–31 / 4.5 години
Аналіз даних і прогнозування
Теми:
- Зчитування та обробка даних перед побудовою моделі
- EDA, Feature Engineering, Feature Importance
Результати:
- Зчитуєте дані із CSV, JSON, XLSX, SQLite.
- Знаєте, як працювати з Missing Data.
- Будуєте зрозумілі візуалізації для даних.
- Вмієте знаходити закономірності в даних.
- Розумієте, чому так важливо правильно зібрати й обробити дані перед побудовою моделей прогнозування і чому не можна просто взяти всі дані та закинути в модель.
- Знайомі з поняттям Feature та знаєте, що це таке в кожній моделі.
- Розумієте, навіщо використовувати Feature Importance.
-
07
07 модуль / заняття 32–33 / 3 години
Обробка Big Data та розвиток майндсету дата-саєнтиста
Теми:
- Обробка великих даних: парадигми, паралельне обчислення, розподілені системи
- Компоненти Spark: Core, SQL, MlLib, Streaming, GraphX
- Основи Spark: RDD, transformations та actions, lazy evaluations
- Популярні API для роботи зі Spark
- Базові операції в Databricks Notebook, синтаксис PySpark, візуалізація даних
- Що таке майндсет дата-саєнтиста
- Формулювання гіпотез та методи їх перевірки
- Розуміння потреб бізнесу, поєднання вимог і математичних побажань
- Вибір підходу та моделі, оцінка моделей
- Поділ задачі від ПО на таски, планування
- Презентація результатів та кінцевого рішення
- Побудова власного профілю Data Scientist
Результати:
- Розумієте, що таке великі дані та знаєте принципи їх обробки.
- Знаєте основи технології Spark та типові ситуації для її застосування.
- Володієте базовим синтаксисом PySpark для операцій в Spark.
- Працюєте з даними в Databricks Notebooks.
- Застосовуєте майндсет дата-саєнтиста на практиці.
-
08
08 модуль / заняття 34–35 / 3 години
Презентація фінального проєкту
Результати:
- Отримаєте Tabular Data і застосуєте всі скіли, опановані протягом курсу, на практиці.
- Опрацюєте дані, побудуєте візуалізації, зберете пайплайн, побудуєте й натренуєте модель для прогнозування.
- Представите свою модель колегам.
Реєстрація