Курс Data Engineering: Станьте инженером данных и стройте инфраструктуру | robot_dreams
< онлайн-курс > < 19 занятий >
< 12 інструментів обробки даних >

DATA ENGINEERING

Научитесь обрабатывать большие данные и постройте собственную Data Platform, способную масштабироваться

Илья Хороших

Data Platform Engineer в Lyft
former EPAM, Luxoft

Читать дальше
Этот Data Engineering курс для:
DEVELOPERS

которые знают Python, работают с Git, хотят разобраться в архитектуре больших данных, оптимизировать ETL-процессы и SQL-запросы к БД и перейти в Data Engineering

DATA ANALYSTS

которые знают SQL, работают с небольшими объемами данных и хотят расширить стек для работы именно с Big Data, сократить время на подготовку данных к анализу и автоматизировать этот процесс

DATA ENGINEERS (BEGINNERS)

которые уже работают в сфере инженерии данных, но хотят углубить знания, автоматизировать процессы для повышения эффективности и строить надежные, масштабируемые Big Data проекты

После курса Data Engineering вы:

- сформируете целостное видение архитектуры данных и сможете декомпонировать процесс обработки Big Data

- освоите современные подходы и инструменты работы с данными: Hadoop, Apache Airflow, Apache Spark, SparkSQL, Docker, AWS

- научитесь извлекать данные из различных источников, строить ETL/ELT-процессы и настраивать инфраструктуры для их хранения и обработки

- сможете предлагать технические решения, выдерживающие большие объемы данных

- создадите собственную дата-платформу, способную к масштабированию

Зарегистрироваться
В программу курса входят:
01
РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ

Рассмотрите архитектуру современных распределенных систем и изучите готовые решения для дата-инженеров, освоите инструменты для распределенного хранения файлов и вычислений.

02
РАЗБОР ИНСТРУМЕНТОВ

Освоите ключевые инструменты Data Engineer, в частности Apache Airflow для разработки, планирования и мониторинга, Hadoop для обработки и хранения больших данных, Docker для работы с контейнерами, Amazon S3 для взаимодействия с данными в облаке.

03
КЕЙС В ПОРТФОЛИО

На практике научитесь развертывать Big Data кластеры локально и в облачной среде, разработаете пайплайн для анализа в AWS или локально, закрепите все приобретенные навыки и получите фидбек от практика.

Лектор
Илья Хороших
Data Platform Engineer в Lyft
имеет 7+ лет опыта работы с Big Data, 6+ лет — на позиции Data Engineer
работал как на аутсорсе (EPAM, Luxoft, Newxel), так и в продуктовых компаниях (Lyft)
реализовал серию пайплайнов для одного из крупнейших производителей спортивной одежды, которая обрабатывала несколько терабайт данных за 30 минут
участвует в создании решений для обработки Big Data для сервиса, имеющего более 23 млн пользователей
в настоящее время поддерживает набор библиотек и сервисов, контролирующих доступ к данным в Lyft
разрабатывал систему автоматической калибровки ML-пайплайнов для компании, занимающейся email security
руководил миграцией более 150 репозиториев на новую версию внутренней библиотеки для доступа к данным
Программа курса
Регистрация

Подключайтесь к обучению, чтобы освоить 12 ключевых инструментов Data Engineer
 
 
 
Реєструючись, ви погоджуєтесь з умовами договору-оферти та політикою конфіденційності.