Уроки по тегу «observability»
Разобраться в понятии наблюдаемости, её отличиях от мониторинга и роли SLA/SLI/SLO
Научиться различать мониторинг и observability и понимать границы применения
Освоить типовую архитектуру систем: сбор, агрегация, хранение, визуализация, алертинг
Изучить ключевые метрики, типы данных и работу экспортёров (node, blackbox, kube-state)
Научиться настраивать алерты и дашборды в Alertmanager и Grafana
Познакомиться с Netdata: установка, возможности и быстрый анализ ресурсов
Освоить архитектуру и функционал Zabbix и понять, когда его стоит использовать
Изучить основы работы Nagios: плагины, проверки и ограничения
Сравнить Prometheus, Zabbix, Netdata и Nagios и научиться выбирать инструмент под задачу
Подвести итоги курса и закрепить ключевые выводы
Узнать, зачем нужна распределённая трассировка, чем она отличается от логов и метрик
Научиться создавать простые правила алертов в Prometheus
Настроить маршрутизацию алертов и интеграцию с мессенджерами и email
Научиться управлять потоком алертов: дедупликация, silencing, rate limiting
Разобраться в архитектуре OpenTelemetry: Traces, Spans, Collector, Exporters
Научиться работать с Jaeger и Zipkin, сравнить их и понять где применять
Освоить создание спанов и контекстов вручную, подключение SDK и middleware
Научиться собирать трассы в Kubernetes через sidecar или service mesh