AIOps: автоматизация IT-процессов
Освойте передовые инструменты автоматизации IT-операций с использованием AI и ML: от Prometheus и Grafana до Dynatrace и Spark
Виталий Козинский
Senior DevOps Engineer в SoftServe

Курс для:
В ПРОГРАММУ КУРСА ВХОДЯТ
-
AIOps-мониторинг и self-healing
Научитесь собирать и коррелировать метрики и логи (Prometheus, Grafana, ELK), настраивать обнаружение аномалий и автоматическое реагирование на инциденты (self-healing) чтобы сократить время простоя и MTTR.
-
AI/ML для прогнозирования и оптимизации
Освоите применение ML-алгоритмов для прогнозирования инцидентов, capacity planning и автоматического автоскейлинга, чтобы проактивно предотвращать сбои и эффективно распределять ресурсы.
-
Интеграция в DevOps и CI/CD
Сможете внедрять AIOps в пайплайны релизов и тестирования: автоматически откатывать неудачные деплои, оптимизировать пайплайны, анализировать производительность и обеспечивать стабильное развертывание в облаке.
-
Анализ эффективности
Узнаете о показателях эффективности (KPI) для AIOps, снижении затрат за счёт автоматизации, а также рассмотрите основные методы оценки результатов внедрения AIOps.
лектор
Виталий Козинский
Senior DevOps Engineer в SoftServe
-
Более 10 лет опыта в администрировании, из них 7+ — в DevOps. Работал с ведущими компаниями в сферах телекома, сетевого оборудования и кибербезопасности
-
Адаптировал monitoring solution для highload-инфраструктуры, что снизило стоимость observability в 8 раз
-
Внедрял Configuration as Code на динамической инфраструктуре с более чем 500 хостами
-
Успешно контейнеризировал легаси-монолиты, которые работали более 10 лет
-
Занимался мониторингом для ведущего eDoc-решения в ЕС
-
Провёл успешную миграцию комплексной инфраструктуры разработки с Apache Mesos на K8s
ПРОГРАММА КУРСА AIOPS
-
01 занятие
Основы AI и машинного обучения
- Поймёте различия между AI и ML
- Узнаете о видах ML (контролируемое, неконтролируемое, с подкреплением)
- Познакомитесь с базовыми алгоритмами и нейронными сетями
- Поймёте, как работают AI-модели (LLM) и как они обучаются
- Научитесь разворачивать LLM локально или в облаке и сравнивать их работу
-
02 занятие
Введение в AIOps
- Поймёте, что такое AIOps и его ключевые компоненты
- Узнаете, чем AIOps отличается от классических систем мониторинга
- Познакомитесь с преимуществами и вызовами внедрения AIOps
-
03 занятие
Технологии и инструменты AIOps
- Научитесь подбирать инструменты под задачи
- Разберётесь, какие технологии лежат в основе AIOps
- Узнаете примеры enterprise и open-source решений
- Познакомитесь с критериями выбора инструментов для разных сценариев
- Сравните традиционный и AIOps-подходы
-
04 занятие
Мониторинг IT-инфраструктуры с помощью AIOps
- Разберётесь в принципах работы с метриками, событиями и оповещениями
- Познакомитесь с инструментами Prometheus, Grafana, PagerDuty
- Научитесь настраивать процесс от сбора метрик до алертинга
- Поймёте, как ML помогает сократить alert fatigue
-
05 занятие
Логирование и управление инцидентами
- Узнаете роль логирования в анализе инцидентов
- Разберётесь в различиях классического и AIOps-подходов
- Познакомитесь с инструментами для работы с логами (Splunk, ELK)
- Научитесь собирать логи из разных источников
- Поймёте, как диагностировать сбои и автоматизировать создание инцидентов
-
06 занятие
Сбор и анализ больших данных в AIOps
- Поймёте особенности обработки больших IT-данных
- Познакомитесь с технологиями Kafka, Spark, InfluxDB, VictoriaMetrics
- Научитесь настраивать хранение и обнаружение аномалий в больших массивах метрик
- Узнаете о подходах к прогнозированию проблем (capacity planning, predictive maintenance)
-
07 занятие
Использование AI/ML для автоматизации процессов
- Разберётесь, какие рутинные DevOps-задачи можно автоматизировать
- Познакомитесь с методами классификации инцидентов и оптимизации пайплайнов
- Научитесь настраивать автоскейлинг и управление ресурсами с помощью AI-продуктов
- Поймёте, как AI помогает оптимизировать расходы в облаке
-
08 занятие
Интеграция AIOps с DevOps и CI/CD
- Узнаете, как AIOps интегрируется в CI/CD
- Освоите подходы к автоматическому откату релизов и Canary/Blue-Green deployment
- Научитесь настраивать инструменты для анализа и оптимизации пайплайнов
-
09 занятие
Облачные технологии и AIOps-инструменты
- Поймёте роль облачных сервисов в масштабировании и автоматизации
- Познакомитесь с нативными инструментами AIOps в AWS, Azure, GCP
- Научитесь настраивать мониторинг в облаке с помощью встроенных сервисов
-
10 занятие
Интеграция AIOps в реальные бизнес-процессы + Q&A
- Разберёте кейсы внедрения AIOps в Netflix, Uber, Spotify, Deutsche Bank
- Поймёте типовые шаблоны успеха и сложности внедрения
-
11 занятие
Построение устойчивой и масштабируемой IT-инфраструктуры
- Поймёте принципы устойчивости и масштабируемости
- Узнаете, как внедрять AIOps для лог-анализа
- Научитесь использовать автоматизацию для повышения надёжности систем
-
12 занятие
Управление рисками и безопасностью с помощью AIOps
- Разберётесь, как AI помогает обнаруживать аномалии и угрозы
- Познакомитесь с подходами UEBA, SIEM, SOAR в сочетании с AIOps
- Научитесь выстраивать процессы мониторинга и автоматического реагирования на инциденты безопасности
-
13 занятие
Анализ эффективности AIOps в управлении IT-операциями
- Узнаете ключевые метрики эффективности (MTTR, MTTD, SLA, ROI)
- Познакомитесь с методами оценки результатов внедрения
- Научитесь определять наиболее важные KPI для бизнеса
-
14 занятие
Итоги и перспективы развития AIOps
- Узнаете о текущих трендах AIOps
- Разберётесь в направлениях развития (AI-ассистенты, FinOps, безопасность, самообучающиеся системы)
- Поймёте, как применить знания курса в будущих проектах
-
15 занятие
Q&A
-
16 занятие
Защита курсовых проектов
Регистрация
Присоединяйтесь, чтобы интегрировать AI/ML-технологии в свою инфраструктуру и повысить надёжность и масштабируемость систем.