Инженер доступности сервисов

МоскваАдминистрирование Unix-систем, Python, SREМладший специалист
Сервисы Яндекса создаются для решения разнообразных задач пользователей. Но даже самый функциональный сервис не сможет принести пользы, если он не работает. Если вы хотите стать экспертом в области обеспечения надежности веб-сервисов (site reliability engineering) — приходите. Отсутствие большого опыта работы в области администрирования не станет помехой. Мы готовы обучать и наставлять нашего будущего коллегу.

Что предстоит делать вместе с нами:

  • анализировать нештатные ситуации, участвовать в решении проблем на сервисах;
  • выкладывать программы и разворачивать сервисы на «боевых» серверах;
  • придумывать и улучшать мониторинги;
  • дежурить в дневных и ночных сменах;
  • автоматизировать выполнение ежедневных процессов.

Требуются:

  • ответственность, аккуратность, умение общаться с людьми;
  • желание развиваться и работать в команде;
  • способность действовать самостоятельно;
  • готовность к быстрым изменениям окружающей среды;
  • понимание принципов работы веб-сервисов и протокола HTTP;
  • наличие опыта работы с UNIX-системами (Linux или FreeBSD) от двух лет;
  • опыт программирования на скриптовых языках (bash, Python).

Приветствуются:

  • опыт проектирования систем, работающих непрерывно и бесперебойно (24х7х365);
  • аналитические навыки предотвращения и быстрого устранения неисправностей.