Постройте собственную систему для обработки данных.
Денис Кулемза
Big Data Engineer в Intellias
ex Grid Dynamics і N-iX
Разберете существующие решения обработки Big Data, узнаете, что учитывать при разработке системы и как не паниковать, если требования изменяются.
Разберетесь в интерфейсе и научитесь воспользоваться Hadoop, Apache Airflow, Apache Spark, SparkSQL, HDFS.
Построите два пайплайна данных для анализа продаж в Google Cloud или PySpark и добавите кейс в свое портфолио.
- научитесь искать корректные данные в массивах, используя знания Python и SQL;
- узнаете, как настраивать ETL-процессы и передавать информацию между системами;
- будете запускать автоматическое обновление дата-пайплайнов и научитесь строить Big Data Platforms, которые способны масштабироваться;
- овладеете 6 ключевыми инструментами инженера данных и сможете передавать корректные показатели для принятия эффективных бизнес-решений;
- разработайте два пайплайна данных для анализа продаж как курсовой проект.
Оставляйте заявку и растите в работе с большими данными.