11. Метрики бэкенда, мониторинг и алертинг - Иван Цыбулин
Вставка
- Опубліковано 5 жов 2024
- На лекции рассказывается о том, для чего нужен количественный мониторинг и какие задачи он решает.
Рассматривается, какие существуют типы метрик и для чего они используются, а также без каких метрик не может существовать система в продакшене.
Поговорим о том, чем различаются push- и pull-схема доставки данных в мониторинг, об особенностях чтения из баз данных для временных рядов и о специфических языках запросов. Обсудим, зачем нужны алерты и как лучше настраивать проверки.
В практической части вы узнаете, как добавить метрики в своё приложение с помощью библиотеки Prometheus client, как настроить их сбор в Prometheus и как визуализировать их на дашбордах с помощью Grafana.
Полезные ссылки:
sre.google/sre... - мониторинг распределённых систем
prometheus.io/... - система с открытым исходным кодом Prometheus
grafana.com/gr... - Grafana (веб-приложение для аналитики и интерактивной визуализации с открытым исходным кодом)
cloud.yandex.r... - Yandex Monitoring
Настроили систему мониторинга и метрики - это хорошо. Теперь осталось настроить, кто и как будкт реагировать на сигналы. А тут и начинается человеческий фактор. Система кричит, что места нет на дисках, а все забили
Спасибо
репо с кодом: github.com/uranix/notification-delivery-service