Компаниям следует выстраивать архитектуру, способную локализовать сбои и обеспечить продолжение работы даже при возникновении отказов. Об этом в преддверии конференции ЦИПР-2026 в интервью РИА Новости рассказал старший вице-президент, руководитель блока «Технологии» Сбербанка Кирилл Меньшов.
«Ключевая задача в том, чтобы выстроить архитектуру, которая локализует отказ и продолжит работать. Мы делаем ставку на бизнес-способности на микросервисах, каждая из которых управляется отдельно. Это не даст сбоям распространяться по всей системе», — сказал Меньшов.
Он пояснил, что следующим уровнем защиты является сквозная наблюдаемость. По словам Меньшова, в этом случае компания не просто фиксирует поломку, а понимает, где именно произошел сбой, по какой причине он возник и к каким последствиям может привести.
Меньшов отметил, что при возникновении инцидентов критически важной остается скорость реакции. Поэтому Сбербанк внедряет механизмы автоматического переключения трафика и системы самолечения.
«Мы вкладываемся в три вещи. Первое — платформенная инженерия: единый технологический стек, на котором стоят все ключевые сервисы, чтобы инцидент не "расползался". Второе — автономные практики наблюдаемости: ИИ-агенты, которые видят аномалии раньше человека и локализуют проблему до того, как она стала клиентской. Третье — культура разбора: каждый значимый инцидент превращается в изменение в коде или процессе за дни, а не за кварталы», — подчеркнул он.

