Трассировка
Включено в курс
Чему вы научитесь
- Понимать, чем трассировка отличается от логов и метрик, и зачем она нужна
- Работать с концепциями OpenTelemetry: Traces, Spans, Context
- Настраивать OpenTelemetry Collector и Exporters для разных языков и фреймворков
- Использовать Jaeger, Zipkin и Tempo для анализа распределённых запросов
- Внедрять трассировку в код вручную или через middleware
- Настраивать трассировку в Kubernetes, включая сервисные mesh-решения (Istio, Linkerd)
- Интегрировать трассировку с Grafana Explore
- Создавать и настраивать алерты в Prometheus и Alertmanager
- Разрабатывать стратегии маршрутизации и подавления алертов
Описание
Курс знакомит с концепцией трассировки как ключевого элемента observability. Вы узнаете, почему логов и метрик недостаточно для анализа распределённых систем, и как трассировка помогает видеть полный путь запроса end-to-end в микросервисной архитектуре.
Подробно разбирается OpenTelemetry как единый стандарт: структура Traces, Spans и Context, работа Collector и Exporters, поддерживаемые языки и протоколы передачи данных (OTLP, HTTP, gRPC). Вы познакомитесь с системами Jaeger и Zipkin, научитесь их устанавливать и использовать для анализа спанов, фильтрации и работы с тегами. Также будет рассмотрено Grafana Tempo как современная альтернатива с низкой стоимостью и глубокой интеграцией в Grafana.
На практике вы внедрите трассировку в код с помощью SDK и middleware, а также подключите трассировку в Kubernetes через sidecar-паттерн и сервисные mesh-решения (например, Istio). Вы научитесь собирать и визуализировать трассы в Grafana Explore и сравните возможности Jaeger, Zipkin и Tempo.
Отдельные модули курса посвящены алертингу: создание правил в Prometheus, настройка Alertmanager, маршрутизация уведомлений в Slack, Telegram и email. Вы разберёте, как группировать и подавлять алерты, чтобы избежать «шторма уведомлений», и какие события лучше логировать, а какие выводить в алерты.
Для комфортного прохождения курса рекомендуется знание Linux и базовое понимание мониторинга и логирования. Полезно пройти курсы Мониторинг и метрики и Логирование.
Программа курса
-
2
Что такое трассировка
Узнать, зачем нужна распределённая трассировка, чем она отличается от логов и метрик -
3
OpenTelemetry: единый стандарт
Разобраться в архитектуре OpenTelemetry: Traces, Spans, Collector, Exporters -
4
Обзор Jaeger и Zipkin
Научиться работать с Jaeger и Zipkin, сравнить их и понять где применять -
5
Внедрение трассировки в код
Освоить создание спанов и контекстов вручную, подключение SDK и middleware -
6
Kubernetes + трассировка
Научиться собирать трассы в Kubernetes через sidecar или service mesh -
7
Tempo + Grafana
Разобраться в Tempo как в альтернативе Jaeger/Zipkin и интегрировать его с Grafana -
9
Alertmanager и маршрутизация
Настроить маршрутизацию алертов и интеграцию с мессенджерами и email -
10
Построение антиспам-системы алертов
Научиться управлять потоком алертов: дедупликация, silencing, rate limiting -
12
Дополнительные материалы
Статьи и видео, подобранные командой Хекслета. Помогут глубже погрузиться в тему курса -
&.
Продолжение следует