DATA SCIENTIST
Дмитро Безущак
Data Scientist в EPAM

25 онлайн-занять
[щопонеділка та щочетверга]
Комплексний курс про магію даних. За 3 місяці ви опануєте повний стек інструментів і скілів дата-саєнтиста, а також навчитеся будувати моделі прогнозування, щоби допомагати бізнесу, промисловості, науці та медицині створювати та покращувати продукти.
* курс викладається українською мовою
щоб автоматизувати рутинну роботу, навчитися працювати з Big Data без хаосу, формулювати бізнес-задачі через математичні закономірності, писати код на Python і користуватися його фреймворками для задач Data Science.
тестувальникам,
crm-менеджерам
щоби навчитися збирати, обробляти, структурувати та читати дані, знаходити в них взаємозвʼязки та інсайти для бізнесу; щоб адаптувати власні знання під новий напрямок, будувати власні прогнозні моделі та свічнутися в Data Science.
і студентам
технічних напрямків
щоби розпочати карʼєру в ІТ із перспективного неперегрітого напрямку, опанувати повний стек інструментів дата-саєнтиста, навчитися працювати з масивами даних, будувати моделі прогнозування та нейромережі під потреби бізнесу.

Ритейл, фінанси, освіта, медицина, хайтек ― досвідчений дата-саєнтист сьогодні потрібен у будь-якій індустрії. Він може обробляти великі дані й будувати моделі, які дозволяють прогнозувати події та шукати неочевидні закономірності, щоби допомагати бізнесу ухвалювати рішення.
На цьому курсі ми почнемо з основ і чітко визначимо зони відповідальності дата-саєнтиста. Далі крок за кроком опануємо всі інструменти для аналізу даних і прогнозування: від Excel-таблиц і SQL-запитів до бібліотек TensorFlow, PyTorch, Keras для побудови нейромереж. У результаті ― ви навчитеся працювати з даними на рівні дата-саєнтиста та допомагатимете бізнесу створювати й вдосконалювати продукти.
- з нуля пройдете весь шлях професії та розберете ключові обовʼязки
- розвинете Data Scientist Mindset
- вивчите необхідні математичні поняття та формули
- писатимете SQL-запити до бази даних
- навчитеся кодити на Python і користуватися бібліотеками NumPy, Pandas, Matplotlib, PyTorch, scikit-learn, Keras, SciPy, XGBoost, Math, Bokeh, Plotly, Seaborn тощо
- зможете деплоїти власні моделі за допомогою Docker
- навчитеся правильно читати метрики та працювати з масивами даних
- розвʼязуватимете задачі класифікації й кластеризації та проводитимете Time Series Analysis
- будуватимете моделі прогнозування та нейромережі
- навчитеся розуміти потреби бізнесу та будувати моделі, які допомагатимуть йому ухвалювати рішення
- опануєте весь скілсет дата-саєнтиста
- будете готові пройти співбесіду на позицію Junior Data Scientist і відразу реалізовувати задачі

Теми:
- Що таке дані та для чого їх збирати
- Чим відрізняються професії Data Analyst, BI Analyst, Data Engineer, Software Engineer, Data Scientist i Machine Learning Engineer
- Стек навичок Data Scientist
Результати:
- Дізнаєтеся, що таке дані і які можливості є в бізнесу, якщо він правильно збирає та обробляє свої дані.
- Зрозумієте різницю між професіями Data Scientist, Data Analyst, BI Analyst і Data Engineer. Розберете зони відповідальності кожної.
- Дізнаєтеся про види та типи даних.
- Розберете ключові задачі Data Scientist у компанії.
- Розберете стек навичок Data Scientist, виокремите власні сильні та слабкі сторони для цієї професії.
Теми:
- Python та Jupyter Notebook
- Принципи ООП та їхнє застосування в програмуванні на Python
- Базові концепти Python
- Функціональне програмування
- Особливості програмування на Python
- Основні бібліотеки та фреймворки Python
- Бібліотеки Python для Data Science
Результати:
- Знайомі з концептом і принципами програмування на Python.
- Знаєте базовий синтаксис Python.
- Вмієте користуватися Jupyter Notebook.
- Знайомі з принципами ООП та застосовуєте їх на практиці.
- Розумієте різницю між обʼєктно-орієнтованим і функціональним програмуванням.
- Вмієте використовувати код на Python для пошуку та обробки даних.
- Розумієте, для чого потрібні бібліотеки Python, та знайомі з основними з них.
- Знаєте, які бібліотеки Python використовують у Data Science, та вмієте працювати з ними.
Теми:
- Основні концепти лінійної алгебри
- Поняття вектора та операції з векторами
- Поняття матриці та операції над матрицями
- Векторний, нормативний та математичний простір
- Події та ймовірність
- Розподіл імовірностей
- Дисперсія
- Види розподілів
Результати:
- Актуалізували забуті знання з лінійної алгебри та статистики.
- Знайомі з поняттям просторів у математиці та розумієте, для чого вони потрібні.
- Знайомі з концептами теорії ймовірностей.
- Знаєте формули розрахунку ймовірностей та вмієте ними користуватися.
- Розумієте, що таке розподіл, дисперсія, кореляція, коваріація.
- Вмієте описувати задачі математичною мовою.
- Застосовуєте математичні формули для розвʼязання задач Data Science.
Теми:
- Що таке дані та як їх зберігати
- SQL для роботи з даними
Результати:
- Розумієте, що таке дані та як правильно їх зберігати.
- Розбираєтесь у видах баз даних.
- Розумієте різницю між DB та DBMS.
- Вмієте писати SQL-запити та користуватися операторами INSERT, DELETE, SELECT, WHERE та JOIN.
- Знаєте, як «витягнути» потрібні дані з бази.
Теми:
- Регресія
- Задачі класифікації
- Метод опорних векторів
- Дерева ухвалення рішень
- Задачі кластеризації
- Методи прогнозування
- Методи оцінки якості прогнозів
- Поняття нейронних мереж
- Бібліотеки та фреймворки для роботи з нейромережами
- Метрики оцінки якості моделей Machine Learning
Результати:
- Вмієте будувати лінійну та поліноміальну регресію.
- Вмієте розв'язувати задачі класифікації та кластеризації.
- Знаєте, як провести базовий Time Series Analysis.
- Вмієте будувати прогнози на основі отриманих даних.
- Вмієте працювати з пакетами PyTorch, TensorFlow, Keras для побудови моделей Machine Learning.
- Знайомі з метриками оцінки якості моделей.
- Розумієте, який алгоритм працює «під капотом» нейромереж.
- Побудували першу нейронну мережу вручну.
- Вмієте користуватися нейромережами для прогнозування.
Теми:
- Зчитування та обробка даних
- EDA, Feature Engineering, Feature Importance
Результати:
- Зчитуєте дані із CSV, JSON, XLSX, SQLite.
- Знаєте, як працювати з Missing Data.
- Будуєте зрозумілі візуалізації для даних.
- Вмієте знаходити закономірності в даних.
- Розумієте, чому так важливо правильно зібрати та обробити дані перед побудовою моделей прогнозування і чому не можна просто взяти всі дані та закинути в модель.
- Знайомі з поняттям Feature та знаєте, що це таке в кожній моделі.
- Розумієте, навіщо використовувати Feature Importance.
Теми:
- Що таке майндсет дата-саєнтиста
- Deploy моделей
Результати:
- Розумієте, як будується проєкт Data Science із нуля.
- Знаєте, як формуються припущення й гіпотези, та вмієте їх перевіряти.
- Керуєтеся потребами бізнесу під час роботи з даними та побудови прогнозів.
- Вмієте оцінювати власні моделі.
- Знаєте, як презентувати результати своєї роботи менеджменту.
- Вмієте деплоїти та редеплоїти власні моделі в Docker.
Результати:
- Отримаєте Tabular Data і застосуєте всі скіли, опановані протягом курсу, на практиці.
- Опрацюєте дані, побудуєте візуалізації, зберете пайплайн, побудуєте та натренуєте модель для прогнозування.
- Представите свою модель колегам.