Курс: Мониторинг с Prometheus и Grafana для DevOps/SRE | robot_dreams
  • онлайн-курс
  • 12 занятий
  • 13 инструментов мониторинга

Мониторинг с Prometheus и Grafana

Научитесь видеть проблемы до того, как они повлияют на продукт, благодаря инструментам мониторинга

Олег Заревич

Principal DevOps/SRE в Intellias

ДЛЯ КОГО:

DevOps

чтобы быстро выявлять и локализовать проблемы в инфраструктуре, контролировать контейнеризованные приложения и масштабируемые IT-системы

SysAdmins

чтобы настроить централизованный мониторинг, обеспечивать стабильность инфраструктуры и минимизировать время простоя из-за сбоев

Developers

чтобы визуализировать поведение ИТ-систем на проде, видеть узкие места, выявлять ошибки до релиза и оптимизировать работу сервисов

 

в программу курса входят

  • 01

    Мониторинг и observability

    Освоите Prometheus, Grafana, Alertmanager, Grafana Loki, Grafana Tempo и другие инструменты, чтобы контролировать комплексную картину состояния системы — от метрик и логов до трейсов и алертов.

  • 02

    Анализ производительности

    Научитесь собирать и анализировать метрики из приложений и инфраструктуры, выявлять узкие места, оценивать изменения после релизов и принимать обоснованные решения на основе данных.

  • 03

    Автоматизация, MLOps и масштабирование

    Освоите Thanos, VictoriaMetrics, Ansible и Terraform, чтобы масштабировать мониторинг, автоматизировать развертывание и обеспечить надежность даже в больших кластерах.

  • 04

    Практика и курсовой проект

    В ходе обучения создадите полноценную систему мониторинга Kubernetes-кластера с использованием Prometheus, Grafana и дополнительных инструментов.

лектор

Олег Заревич

Principal DevOps/SRE в Intellias

  • имеет более 12 лет опыта в ИТ-сфере, работал QA Engineer в ELEKS Software, Test Automation Engineer в Ciklum, DevOps Engineer в Edvantis

  • более 5 лет создает Cloud-based решения в качестве DevOps-инженера, занимается мониторингом и логированием для крупной enterprise-компании

  • сертифицированный эксперт в Datadog, работает над его внедрением и поддержкой

  • имеет большой опыт внедрения и поддержки решений для автоматизации с помощью Terraform, Ansible, CI/CD-пайплайнов

Программа курса Prometheus and Grafana

  • 01 занятие

    Введение в мониторинг и основные концепции

    • Поймете, что такое мониторинг и observability, и в чем их разница
    • Узнаете, как работают метрики, логи и трейсы и зачем их собирать
    • Установите Prometheus и Node Exporter, соберете первые метрики
  • 02 занятие

    Основы PromQL и настройка сбора метрик

    • Научитесь писать запросы в PromQL с использованием операторов, функций и агрегации
    • Узнаете, как добавлять новые источники метрик в Prometheus
  • 03 занятие

    Развертывание Prometheus в Kubernetes

    • Научитесь развертывать Prometheus в Kubernetes с помощью Helm и Prometheus Operator
    • Настроите мониторинг для кластера и ASP.NET-приложения
  • 04 занятие

    Визуализация с Grafana

    • Установите Grafana и подключите ее к Prometheus
    • Создайте интерактивные дашборды с метриками, переменными и оповещениями
  • 05 занятие

    Alertmanager и создание алертов

    • Создадите алерты в Prometheus с учетом USE- и RED-методологии
    • Настроите интеграцию со Slack и Email для отправки уведомлений
  • 06 занятие

    Мониторинг сторонних сервисов

    • Узнаете, как мониторить базы данных, сервисы и облачные ресурсы (PostgreSQL, Redis, Kafka и Azure)
    • Сможете использовать Blackbox Exporter для мониторинга доступности сервисов
  • 07 занятие

    High Availability для метрик

    • Поймете, как масштабировать Prometheus с помощью Federation
    • Настроите HA-решение с Thanos, Cortex или VictoriaMetrics в Kubernetes
  • 08 занятие

    Логирование с Grafana Loki

    • Разверните Loki и Promtail в Kubernetes для сбора логов
    • Научитесь просматривать, писать и анализировать логи из веб-приложений в Grafana
  • 09 занятие

    Трассировка с Grafana Tempo

    • Поймете, как работает трейсинг и для чего он нужен
    • Настроите Tempo для сбора трейсов и научитесь просматривать трассировку запросов
  • 10 занятие

    Автоматизация развертывания Prometheus

    • Научитесь использовать Ansible и Terraform для автоматизации развертывания Prometheus
    • Сможете интегрировать мониторинг в CI/CD-пайплайн
  • 11 занятие

    Воркшоп: Мониторинг MLOps с помощью Prometheus и Q&A

    • Поймете, как применять Prometheus в MLOps-сценариях для мониторинга и анализа
    • Уточните все открытые вопросы и закрепите пройденный материал
  • 12 занятие

    Защита курсового проекта

Регистрация

Подключайтесь, чтобы внедрить надежный мониторинг с Prometheus и Grafana.
СТАРТ ОБУЧЕНИЯ — В МАЕ 2026 ГОДА

 
 
 
Регистрируясь, вы соглашаетесь с условиями договора-оферты и политикой конфиденциальности.