Разработчик инфраструктуры машинного обучения в Такси

МоскваМашинное обучение, C++, PythonТаксиСпециалист
Вакансия закрыта
С каждым днем мы решаем всё больше прикладных задач, наше проникновение в различные сферы бизнеса и наше влияние на них растет, также растет и использование нашего сервиса машинного обучения: Machine Learning as a Service (MLaaS). Прямо сейчас MLaaS существует в виде двух реализаций: первая написана на C++ и нужна для продакшн-задач с высокими требованиями к производительности, вторая написана на Python и служит для быстрого прототипирования, а также для проектов с небольшим количеством запросов в секунду (RPS). У нас много требований к этим сервисам, мы хотим их улучшать и развивать.

Например, прямо сейчас нам необходимо следующее:

  • реализовать удобную схему обновления и версионирования моделей в продакшне;
  • создать возможность проводить внутренние A/B-эксперименты с разными ML-моделями;
  • поддержать использование CatBoost, XGBoost и других необходимых нам библиотек машинного обучения;
  • построить свою базу данных реального времени с информацией о поездках, с заранее посчитанными факторами и характеристиками пользователей и водителей и т. п.;
  • научиться пользоваться сторонними источниками данных, например, ГеоПоиском, Яндекс.Погодой, API Яндекс.Карт по построению маршрутов и т. п.;
  • сделать полноценный режим деградации: Яндекс.Такси продолжает быстро расти, и нам нужно быть готовыми к существенному увеличению нагрузки;
  • спроектировать архитектуру и дизайн сервиса с учетом продуктовых требований;
  • многое другое, о чем мы сможем рассказать лично.
Нам нужен коллега с опытом разработки средних, а еще лучше больших систем для того, чтобы с нуля построить инфраструктуру машинного обучения в Такси. Помимо большого числа интересных, сложных и амбициозных задач, мы предлагаем вам полную свободу в выборе технологий и в построении архитектуры сервиса.