Введение в обсервабилити
Включено в курс
Чему вы научитесь
- Понимать, что такое observability и чем она отличается от мониторинга
- Работать с ключевыми элементами наблюдаемости: метрики, логи, трассировки
- Разбираться в SLA, SLI и SLO и применять их на практике
- Настраивать архитектуру систем наблюдаемости: сбор, агрегация, хранение, визуализация, алертинг
- Использовать Prometheus, Grafana, Alertmanager для мониторинга и оповещений
- Работать с экспортёрами метрик (node_exporter, blackbox_exporter, kube-state-metrics)
- Разбираться в решениях Netdata, Zabbix и Nagios, знать их сильные и слабые стороны
- Выбирать инструменты под задачи и масштаб инфраструктуры
Описание
Этот курс вводит в основы обсервабилити — наблюдаемости систем, которая помогает понимать, что происходит внутри приложения и инфраструктуры. Вы узнаете, почему observability шире, чем мониторинг, и разберёте её три ключевых столпа: метрики, логи и трассировки. Рассмотрите роль SLA, SLI и SLO в управлении качеством сервисов.
Вы познакомитесь с архитектурой систем наблюдаемости: сбор и агрегация данных, хранение, визуализация и алертинг. На примерах Prometheus, Loki и Jaeger разберёте, как выглядят метрики, логи и трассировки в реальной системе. На практике настроите экспортёры (node_exporter, blackbox_exporter, kube-state-metrics) и создадите алерт по загрузке CPU с использованием Alertmanager и Grafana.
Отдельные модули курса посвящены популярным инструментам: Netdata (лёгкий мониторинг «из коробки»), Zabbix (агентно-ориентированный мониторинг с шаблонами и триггерами) и Nagios (подход на основе плагинов). Для каждого инструмента вы рассмотрите архитектуру, примеры настройки и ограничения.
В финале курса вы сравните подходы Prometheus, Zabbix, Netdata и Nagios, чтобы понять, какие инструменты использовать в зависимости от задач, SLA и масштаба инфраструктуры.
Для комфортного прохождения курса рекомендуется иметь знания знание о Linux и основах администрирования.
Программа курса
-
2
Что такое Observability
Разобраться в понятии наблюдаемости, её отличиях от мониторинга и роли SLA/SLI/SLO -
3
Monitoring vs Observability
Научиться различать мониторинг и observability и понимать границы применения -
4
Архитектура систем наблюдаемости
Освоить типовую архитектуру систем: сбор, агрегация, хранение, визуализация, алертинг -
5
Метрики и Exporters
Изучить ключевые метрики, типы данных и работу экспортёров (node, blackbox, kube-state) -
8
Обзор: Zabbix
Освоить архитектуру и функционал Zabbix и понять, когда его стоит использовать -
10
Сравнение подходов
Сравнить Prometheus, Zabbix, Netdata и Nagios и научиться выбирать инструмент под задачу -
12
Дополнительные материалы
Статьи и видео, подобранные командой Хекслета. Помогут глубже погрузиться в тему курса -
&.
Продолжение следует