Освойте Spark, Databricks, Kafka, dbt и Airflow, чтобы превращать большие данные в действенные решения.
Денис Кулемза
Senior Data Engineer в Intellias

которые хотят строить более эффективные пайплайны со Spark, Kafka и dbt, ищут более стабильные флоу и возможности лучшей оркестрации через Airflow
которые хотят понять, как выглядят данные за кулисами: от потоков до моделирования, а также хотят получить больше контроля над данными, с которыми работают
которые хотят перейти в data-направление, прокачать работу с логами, событиями, схемами и лучше понимать архитектуру современных data-пайплайнов
- научитесь настраивать среду в Snowflake, сможете реализовывать ELT/ETL-сценарии
- будете автоматизировать процессы с помощью Kafka и Airflow
- поймете, как интегрировать инструменты Big Data в бизнес-процессы
- будете применять лучшие практики работы с Big Data на основе реальных кейсов
Освоите Apache Spark, Databricks, Kafka, Snowflake, dbt, Airflow, AWS Athena, Power BI, чтобы проектировать стабильные системы обработки данных — от сбора до визуализации.
Построите полный цикл обработки данных: сбор, трансформация, проверка качества, сохранение и визуализация.
Узнаете, как проверять данные на точность, настраивать тесты в dbt и автоматизировать контроль качества в пайплайнах.

