Опануйте ключові інструменти дата-інженера, щоб побудувати власну систему для обробки даних.
Денис Кулемза
Big Data Engineer в Intellias
ex Grid Dynamics і N-iX
Розберете наявні рішення обробки Big Data, дізнаєтеся, на що зважати під час розробки системи та як не панікувати, коли вимоги змінюються.
Розберетеся в інтерфейсі та навчитеся користуватися Hadoop, Apache Airflow, Apache Spark, SparkSQL, HDFS.
Побудуєте два пайплайни даних для аналізу продажів на Google Cloud або PySpark і додасте кейс у своє портфоліо.
- навчитеся шукати коректні дані у масивах, застосовуючи знання Python та SQL;
- дізнаєтеся, як налаштовувати ETL-процеси й передавати інформацію між системами;
- запускатимете автоматичне оновлення дата-пайплайнів і навчитеся будувати Big Data Platforms, які здатні масштабуватися;
- опануєте 6 ключових інструментів інженера даних та зможете передавати коректні показники для ухвалення ефективних бізнес-рішень;
- розробите два пайплайни даних для аналізу продажів як курсовий проєкт.
Залишайте заявку та зростайте у роботі з великими даними.