Разработчик ML в отдел машинного перевода

Знаете ли вы, что Яндекс.Переводчик умеет переводить с 95 языков (включая два шуточных: эльфийский и эмодзи)? Для того чтобы улучшать качество перевода на этих языках, мы обрабатываем петабайты данных, собранные роботами Яндекса со всего интернета, и используем последние достижения в области DL (в частности, архитектуры на основе Transformer, которые показывают state-of-the-art на многих NLP-задачах). Кроме этого, мы занимаемся многими смежными задачами, связанными с применением последних достижений DL над текстами в других подразделениях Яндекса (от распознавания голоса до поиска).

Какие задачи вас ждут

  • обучать нейронные сети (перевод между различными языками и другие задачи по работе с текстами);
  • ускорять и масштабировать их обучение на многих GPU;
  • ускорять их инференс в продакшене;
  • экспериментировать с различными подходами к сбору, очистке и генерации обучающих данных;
  • масштабировать эти процессы для работы на сотне различных направлений и петабайтах данных.

Мы ждём, что вы

  • имеете отличную математическую подготовку;
  • знаете классические алгоритмы и структуры данных;
  • понимаете принципы машинного обучения;
  • имеете понимание и опыт в области глубинного обучения, обладаете опытом работы с PyTorch или TensorFlow;
  • работали с большими объемами данных;
  • хорошо знаете Python (знание С++ будет большим плюсом);
  • хорошо владеете английским языком — умеете за несколько минут просмотреть свежую статью с arXiv и понять, в чем основная идея авторов и каких результатов им удалось достичь.

Будет плюсом, если вы

  • знакомы с CUDA/cuBLAS/cuDNN;
  • работали с нейросетевыми моделями для обработки текстов на естественном языке.
Спасибо за отклик!

Мы свяжемся с вами в течение недели.

Fri Feb 09 2024 12:47:58 GMT+0300 (Moscow Standard Time)