Курс по AIOps: обучение и автоматизация IT-операций | robot_dreams
  • онлайн-курс
  • 16 занятий
  • 25+ инструментов
  • курсовой проект

AIOps: автоматизация IT-процессов

Освойте передовые инструменты автоматизации IT-операций с использованием AI и ML: от Prometheus и Grafana до Dynatrace и Spark

Виталий Козинский

Senior DevOps Engineer в SoftServe

Курс для:

DevOps, DevSecOps и SRE

чтобы сократить время на ручной мониторинг и реагирование на инциденты, централизовать логирование, внедрять AI-управляемое self-healing и масштабировать инфраструктуру без перегрузок.

Data Engineers и ML Engineers

чтобы уменьшить ручную подготовку данных, интегрировать AI/ML в существующую инфраструктуру, быстрее строить адаптивные системы и предсказывать инциденты без задержек.

Backend и Fullstack-разработчиков, архитекторов

чтобы быстро находить узкие места в продакшене, интегрировать AI/ML для проактивного выявления проблем, оптимизировать производительность сервисов и избегать рутинной ручной работы.

Сисадминов, IT-менеджеров

чтобы минимизировать рутинные операционные задачи, централизовать аналитику, поддерживать стабильность и масштабируемость инфраструктуры и внедрять AI/ML и AIOps без высокого порога входа.

 

В ПРОГРАММУ КУРСА ВХОДЯТ

  • AIOps-мониторинг и self-healing

    Научитесь собирать и коррелировать метрики и логи (Prometheus, Grafana, ELK), настраивать обнаружение аномалий и автоматическое реагирование на инциденты (self-healing) чтобы сократить время простоя и MTTR.

  • AI/ML для прогнозирования и оптимизации

    Освоите применение ML-алгоритмов для прогнозирования инцидентов, capacity planning и автоматического автоскейлинга, чтобы проактивно предотвращать сбои и эффективно распределять ресурсы.

  • Интеграция в DevOps и CI/CD

    Сможете внедрять AIOps в пайплайны релизов и тестирования: автоматически откатывать неудачные деплои, оптимизировать пайплайны, анализировать производительность и обеспечивать стабильное развертывание в облаке.

  • Анализ эффективности

    Узнаете о показателях эффективности (KPI) для AIOps, снижении затрат за счёт автоматизации, а также рассмотрите основные методы оценки результатов внедрения AIOps.

лектор

Виталий Козинский

Senior DevOps Engineer в SoftServe

  • Более 10 лет опыта в администрировании, из них 7+ — в DevOps. Работал с ведущими компаниями в сферах телекома, сетевого оборудования и кибербезопасности

  • Адаптировал monitoring solution для highload-инфраструктуры, что снизило стоимость observability в 8 раз

  • Внедрял Configuration as Code на динамической инфраструктуре с более чем 500 хостами

  • Успешно контейнеризировал легаси-монолиты, которые работали более 10 лет

  • Занимался мониторингом для ведущего eDoc-решения в ЕС

  • Провёл успешную миграцию комплексной инфраструктуры разработки с Apache Mesos на K8s

ПРОГРАММА КУРСА AIOPS

  • 01 занятие

    Основы AI и машинного обучения

    • Поймёте различия между AI и ML
    • Узнаете о видах ML (контролируемое, неконтролируемое, с подкреплением)
    • Познакомитесь с базовыми алгоритмами и нейронными сетями
    • Поймёте, как работают AI-модели (LLM) и как они обучаются
    • Научитесь разворачивать LLM локально или в облаке и сравнивать их работу
  • 02 занятие

    Введение в AIOps

    • Поймёте, что такое AIOps и его ключевые компоненты
    • Узнаете, чем AIOps отличается от классических систем мониторинга
    • Познакомитесь с преимуществами и вызовами внедрения AIOps
  • 03 занятие

    Технологии и инструменты AIOps

    • Научитесь подбирать инструменты под задачи
    • Разберётесь, какие технологии лежат в основе AIOps
    • Узнаете примеры enterprise и open-source решений
    • Познакомитесь с критериями выбора инструментов для разных сценариев
    • Сравните традиционный и AIOps-подходы
  • 04 занятие

    Мониторинг IT-инфраструктуры с помощью AIOps

    • Разберётесь в принципах работы с метриками, событиями и оповещениями
    • Познакомитесь с инструментами Prometheus, Grafana, PagerDuty
    • Научитесь настраивать процесс от сбора метрик до алертинга
    • Поймёте, как ML помогает сократить alert fatigue
  • 05 занятие

    Логирование и управление инцидентами

    • Узнаете роль логирования в анализе инцидентов
    • Разберётесь в различиях классического и AIOps-подходов
    • Познакомитесь с инструментами для работы с логами (Splunk, ELK)
    • Научитесь собирать логи из разных источников
    • Поймёте, как диагностировать сбои и автоматизировать создание инцидентов
  • 06 занятие

    Сбор и анализ больших данных в AIOps

    • Поймёте особенности обработки больших IT-данных
    • Познакомитесь с технологиями Kafka, Spark, InfluxDB, VictoriaMetrics
    • Научитесь настраивать хранение и обнаружение аномалий в больших массивах метрик
    • Узнаете о подходах к прогнозированию проблем (capacity planning, predictive maintenance)
  • 07 занятие

    Использование AI/ML для автоматизации процессов

    • Разберётесь, какие рутинные DevOps-задачи можно автоматизировать
    • Познакомитесь с методами классификации инцидентов и оптимизации пайплайнов
    • Научитесь настраивать автоскейлинг и управление ресурсами с помощью AI-продуктов
    • Поймёте, как AI помогает оптимизировать расходы в облаке
  • 08 занятие

    Интеграция AIOps с DevOps и CI/CD

    • Узнаете, как AIOps интегрируется в CI/CD
    • Освоите подходы к автоматическому откату релизов и Canary/Blue-Green deployment
    • Научитесь настраивать инструменты для анализа и оптимизации пайплайнов
  • 09 занятие

    Облачные технологии и AIOps-инструменты

    • Поймёте роль облачных сервисов в масштабировании и автоматизации
    • Познакомитесь с нативными инструментами AIOps в AWS, Azure, GCP
    • Научитесь настраивать мониторинг в облаке с помощью встроенных сервисов
  • 10 занятие

    Интеграция AIOps в реальные бизнес-процессы + Q&A

    • Разберёте кейсы внедрения AIOps в Netflix, Uber, Spotify, Deutsche Bank
    • Поймёте типовые шаблоны успеха и сложности внедрения
  • 11 занятие

    Построение устойчивой и масштабируемой IT-инфраструктуры

    • Поймёте принципы устойчивости и масштабируемости
    • Узнаете, как внедрять AIOps для лог-анализа
    • Научитесь использовать автоматизацию для повышения надёжности систем
  • 12 занятие

    Управление рисками и безопасностью с помощью AIOps

    • Разберётесь, как AI помогает обнаруживать аномалии и угрозы
    • Познакомитесь с подходами UEBA, SIEM, SOAR в сочетании с AIOps
    • Научитесь выстраивать процессы мониторинга и автоматического реагирования на инциденты безопасности
  • 13 занятие

    Анализ эффективности AIOps в управлении IT-операциями

    • Узнаете ключевые метрики эффективности (MTTR, MTTD, SLA, ROI)
    • Познакомитесь с методами оценки результатов внедрения
    • Научитесь определять наиболее важные KPI для бизнеса
  • 14 занятие

    Итоги и перспективы развития AIOps

    • Узнаете о текущих трендах AIOps
    • Разберётесь в направлениях развития (AI-ассистенты, FinOps, безопасность, самообучающиеся системы)
    • Поймёте, как применить знания курса в будущих проектах
  • 15 занятие

    Q&A

  • 16 занятие

    Защита курсовых проектов

Регистрация

Присоединяйтесь, чтобы интегрировать AI/ML-технологии в свою инфраструктуру и повысить надёжность и масштабируемость систем.

 
 
 
Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.