Как работать со сложными дефектами в распределенной системе?
Дефекты
Аудио-карточка · 0:42Olga·
Как работать со сложными дефектами в распределенной системе?
0:42
В сложной системе дефект может проявляться в одном месте, а причина быть в другом сервисе.
Нужно:
Проверить цепочку вызовов.
Посмотреть логи нескольких сервисов.
Использовать Trace ID, Request ID.
Проверить очереди, интеграции и тайминги.
Сравнить данные на разных этапах.
Пример:
Пользователь не получил уведомление.
Нужно проверить:
Создалось ли событие.
Ушло ли оно в брокер.
Принял ли его сервис уведомлений.
Есть ли ошибка в логах.
Отправилось ли письмо или push.