СОЗДАЙТЕ PRODUCTION-READY AI-СИСТЕМУ
От данных и моделей — к LLM, MLOps и масштабирования, чтобы перейти от демо к стабильным архитектурам
Андрей Белоус
Senior AI Engineer у DataArt

О курсе
-
Цельное понимание AI Engineering
-
10 домашних заданий
-
Курсовой проект
В реальных AI-системах все быстро ломается: растет latency, выходит из-под контроля cost, а качество падает уже после релиза.
На курсе вы научитесь строить управляемый AI pipeline — от data до inference, API, monitoring и scale — и создайте production-ready проект для портфолио.
Этот курс для вас, если вы:
ПОСЛЕ КУРСА AI ENGINEERING ВЫ:
-
строите production data pipelines для AI: ingestion, подготовка, версионирование
-
интегрируете ML/DL-модели в продукт через API и model registry
-
запускаете LLM-решения в продакшене: embeddings, RAG, agents
-
деплоите AI как сервис через Docker и Kubernetes и настраиваете CI/CD для моделей
-
разрабатываете AI-системы end-to-end: от данных и моделей — до деплоя, поддержки и масштабирования

Программа
-
01 занятие30.03 19:30
AI Engineering in Real Products
- Будете понимать роль AI Engineer в бизнесе и его ответственность за результат
- Будете отличать AI Engineering от ML, Data и Backend-направлений
- Будете интегрировать AI как часть продукта, а не отдельную «фичу»
- Будете видеть полный AI-lifecycle: от данных и модели — до продакшена и поддержки
-
02 занятие02.04 19:30
Data Engineering for AI
- Будете проектировать ingestion-архитектуру под разные типы данных
- Будете работать с PDF, DOCX и HTML, в частности с OCR для неструктурированных источников
- Будете реализовывать streaming ingestion с использованием очередей и батчинга
- Будете применять data versioning для контроля изменений и воспроизводимости данных
-
03 занятие09.04 19:30
Production Data Pipelines
- Будете выполнять cleaning, normalization и deduplication данных
- Будете применять chunking для подготовки данных к обработке моделями
- Будете строить metadata pipelines для управления контекстом и происхождением данных
- Будете работать с feature stores для повторного использования и консистентности фич
-
04 занятие13.04 19:30
Classical ML in Production
- Будете строить пайплайны обучения моделей с помощью scikit-learn
- Будете организовывать training и validation для корректной оценки моделей
- Будете использовать MLflow для трекинга экспериментов и метрик
- Будете работать с model registry для управления версиями моделей и релизами
-
05 занятие16.04 19:30
PyTorch for Real Systems
- Будете запускать нейронные сети в продакшене с учетом требований к стабильности и масштабированию
- Будете оптимизировать инференс с помощью GPU и batching
- Будете хранить и загружать весы моделей для воспроизводимости и обновлений
-
06 занятие20.04 19:30
LLM Engineering (API + Self-hosted)
- Будете ориентироваться в экосистеме OpenAI, Claude и open-source моделей
- Будете оценивать tokenomics и latency под бизнес- и продуктные сценарии
- Будете развертывать и использовать self-hosted модели через Ollama
-
07 занятие23.04 19:30
Embeddings & Semantic Systems
- Будете работать с embeddings для представления текста и данных в векторном виде
- Будете применять similarity search для поиска релевантного контента
- Будете использовать базовую vector math для сравнения, кластеризации и ранжирования результатов
-
08 занятие27.04 19:30
Vector Databases in Production
- Будете работать с векторными базами данных Qdrant, FAISS и Pinecone
- Будете реализовывать hybrid search на базе BM25 и векторного поиска
- Будете настраивать filtering для точного контроля результатов поиска
-
09 занятие30.04 19:30
RAG Systems (Enterprise Level)
- Будете применять различные chunking-стратегии в зависимости от типа данных и сценария использования
- Будете настраивать retrievers для эффективного получения релевантного контекста
- Будете управлять context window моделей, чтобы балансировать качество ответов и стоимость обработки
-
10 занятие04.05 19:30
API Layer for AI Systems
- Будете разрабатывать API для AI-сервисов на FastAPI
- Будете использовать async для эффективной работы с конкурентными запросами
- Будете запускать background jobs для долгих задач без блокировки сервиса
- Будете настраивать Redis cache и rate limiting для стабильности и контроля нагрузки
-
11 занятие07.05 19:30
AI Agents & Tool Orchestration
- Будете проектировать архитектуру агентов под бизнес- и продуктные сценарии
- Будете применять подход ReAct для сочетания reasoning и действий
- Будете настраивать tool calling для взаимодействия агентов с внешними сервисами
- Будете строить агентные workflow с помощью LangGraph
-
12 занятие14.05 19:30
MLOps Foundations
- Будете использовать MLflow и model registry для управления версиями моделей и релизами
- Будете применять DVC для версионирования данных и воспроизводимости экспериментов
- Будете настраивать CI/CD-пайплайны для автоматизации обучения и деплоя моделей
- Будете запускать canary deploy для безопасного обновления моделей в продакшене
-
13 занятие18.05 19:30
Containers for AI
- ОБудете контейнеризировать AI-сервисы с помощью Docker
- Будете использовать multi-stage сборки для уменьшения размера образов и более быстрых деплой
- Будете запускать GPU-контейнеры для эффективного инференса и обучения моделей
-
14 занятие21.05 19:30
Kubernetes for AI Systems
- Будете развертывать AI-сервисы в Kubernetes
- Будете использовать Helm для управления конфигурациями и релизами
- Будете настраивать HPA для автоматического масштабирования под нагрузку
- Будете выполнять rolling updates без простоев сервиса
-
15 занятие25.05 19:30
Production AI: Monitoring & Drift
- Будете обнаруживать model drift и реагировать на деградацию качества моделей
- Будете отслеживать document drift и изменения входных данных
- Будете строить observability для AI-сервисов с использованием Prometheus и Grafana
- Будете настраивать alerting для быстрой реакции на инциденты в продакшене
-
16 занятие28.05 19:30
MCP (Model Context Protocol): AI Tools Architecture
- Будете понимать, что такое MCP (Model Context Protocol) и зачем он появился
- Будете объяснять, какую проблему MCP решает в продакшн AI-системах: хаос tools, vendor lock-in и отсутствие стандарта
- Будете ориентироваться в архитектуре MCP и ролях Host, Client и Server
- Будете отличать MCP от OpenAI function calling, LangChain tools и классических microservices
- Будете представлять, как MCP работает в реальном продукте: с локальными инструментами, корпоративными API и sandbox-средами
-
17 занятие01.06 19:30
LLM Fine-Tuning in Production
- Будете различать fine-tuning, RAG и prompting и выбирать подход под задачу
- Будете применять PEFT-подходы: LoRA, QLoRA и adapters для эффективного дообучения моделей
- Будете проектировать dataset для instruction-tuning с учетом качества и масштаба
- Будете использовать label masking (### RESPONSE:) для корректного обучения моделей
- Будете оценивать inference cost после fine-tuning и его влияние на продакшн
-
18 занятие04.06 19:30
Production LLM Inference Systems
- Будете ориентироваться в inference-движках vLLM, Triton и TGI и выбирать их под продакшн-сценарии
- Будете использовать KV cache для уменьшения задержек и стоимости инференса
- Будете настраивать dynamic batching для эффективной обработки конкурентных запросов
- Будете реализовывать token streaming для быстрого time-to-first-token
- Будете планировать latency budget и балансировать скорость, стоимость и качество ответов
-
19 занятие08.06 19:30
LLM Evaluation, Safety & Guardrails
- Будете выявлять галлюцинации моделей и уменьшать их влияние в продакшене
- Будете защищать системы от prompt injection и злонамеренных инструкций
- Будете детектировать и маскировать PII для соответствия требованиям безопасности
- Будете оценивать faithfulness и groundedness ответов относительно источников
- Будете строить LLM eval pipelines для регулярной проверки качества, безопасности и стабильности моделей
-
20 занятие15.06 19:30
System Design for AI Products + Demo Day
- Будете ориентироваться в AI-native архитектурных паттернах и применять их в продакшн-системах
- Будете проектировать AI gateway для маршрутизации запросов, политик доступа и контроля качества
- Будете разделять систему на retrieval, reasoning и memory, чтобы управлять сложностью и масштабированием
- Будете настраивать failover, fallbacks и circuit breakers для стабильной работы под инцидентами и пиками
- Представите демо финальных задач и аргументируете архитектурные решения и trade-offs
лектор
Андрій Білоус
Senior AI Engineer у DataАrt, former Javascript Fullstack Developer with AI в EPAM
-
специализируется на построении production-ready GenAI систем: RAG, multi-agent architectures, LLM copilots и document intelligence для реальных бизнес-сценариев
-
проектировал и внедрял AI-пайплайны для парсинга финансовых данных (bond deal emails) с использованием preprocessing, prompt engineering (Claude / GPT через AWS Bedrock)
-
строил agent-based решения с multi-turn памятью, function calling и интеграцией с бизнес-процессами
-
5+ лет опыта во Fullstack- и AI-разработке в продуктовых и enterprise-проектах, в общей сложности более 12 лет опыта в IT
ТРЕБОВАНИЯ ДЛЯ СТАРТА
Чтобы учиться на курсе, вам нужно знать Python или другой язык программирования на уровне написания рабочего кода. Иметь практический опыт работы с Git.
регистрация
Присоединяйтесь к курсу, чтобы освоить полный цикл создания AI-продуктов и быть конкурентным на рынке как AI Engineer.