Мы автоматизируем работу с инцидентами в горячей фазе, создаём инструменты работы над ошибками. От нас зависит, как скоро устранят инцидент, оповестят ответственных, посчитают даунтайм и потери. Внутри Warden 10 микросервисов, включая чат-бот, которым ежедневно пользуются больше 3000 сотрудников Яндекса. Приходите, если вам интересно поработать над проектом с импактом на всю компанию. В нашей команде вы будете первыми узнавать обо всех технических сбоях в Яндексе.
Работать с алгоритмами консенсуса Ядро нашей распределённой системы использует алгоритм Raft. У нас есть задачи на повышение надёжности наших сервисов.
Работать не только над инфраструктурными задачами Мы предоставляем единый инструмент работы над стабильностью для абсолютно разных классов сервисов: Поиска, Музыки, Такси. Мы помогаем всем сервисам быть доступными 99.9999% времени, а разработчикам — узнавать о проблеме в течение 30 секунд с момента её появления. Помогаем следить как за доступностью сервисов в целом, так и за работой отдельных пользовательских сценариев: например, что в Музыке работает радио.
Мы свяжемся с вами в течение недели.