Как всё устроено
Этапы
ML инженеры в Яндексе проходят три ключевых блока интервью: знакомство с рекрутером, технические секции и финальные встречи.
Трек собеседований
Трек собеседований у нас индивидуальный. Мы хотим подробно поговорить о вашей экспертизе, поэтому ставим секции в зависимости от вашего опыта: проводим интервью как на базовые знания в ML, так и на понимание конкретной области.
Как проходят этапы
Всего вам нужно будет пройти 3–4 технические встречи. Это можно сделать за один день или разделить на несколько. Вы получите фидбэк в течение трёх дней после интервью.
Для собеседования через Zoom вам понадобится ноутбук с камерой и клавиатурой, чтобы писать код или обсуждать задачи, связанные с машинным обучением.
2-3 недели
общая длительность всех собеседований
1 час
длительность каждого интервью
Онлайн
Встречи в Zoom с камерой и возможностью демонстрировать экран
Знакомство с рекрутером
Секция ML & Programming
- вы знакомы со стандартными алгоритмами, умеете оценивать их сложность, можете предложить пути оптимизации;
- вы свободно владеете одним из языков программирования (Python/C++/Java — основные в Яндексе), пишете код без ошибок, знаете стандартные библиотеки;
- вы знакомы с алгоритмами машинного обучения и методами оценки их качества.
Секция с написанием кода
ML инженеры в Яндексе занимаются не только исследовательскими задачами и обучением моделей, но и выводят их в продакшен, поэтому для нас важно, чтобы ML разработчики умели писать код.
- 12 алгоритмических задач отборочного раунда и их разборы
- Почему и какие алгоритмические задачи нужно уметь решать, работая в поиске
- Оценка сложности
- CodeRun — инструмент для подготовки к очному собеседованию в Яндексе. Задачи очень похожи на те, что будут на интервью.
- «Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.1»
- «Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.2»
- LeetCode: задачи уровня medium помогут подготовиться ко встречам с командами.
- Видеолекции курса «Алгоритмы и структуры данных»
- TopCoder
- Hackerrank
- CollabEdit
Секция ML Special
В выборе практической задачи для обсуждения мы исходим из вашего релевантного опыта в области ML. Мы хотим, чтобы вы успешно продемонстрировали свои знания и умения.
В зависимости от вашего опыта мы обсудим различные темы
Поговорим о современных подходах к решению NLP-задач различной сложности и об исследовании архитектур NLP-моделей, если у вас есть такой опыт: обсудим GPT-like- и BERT-модели, encoder-decoder-архитектуры, SoTA-подходы к обучению языковых моделей.
Полезные ресурсы
- Курс по NLP от Stanford
- Курс по NLP от ШАД
- Эпохальная статья про архитектуру трансформер «Attention is all you need»
- Интенсив в ШАД по обучению LLM
- LLM Scaling Week 2025 I Интенсив от ШАДа
Кандидатам с опытом архитектурных решений мы предлагаем пройти секцию ML System design, которая позволяет продемонстрировать навыки и опыт работы с продакшн системами на базе ML, широкий кругозор, умение корректно формулировать свои мысли.
Поговорим о современных подходах к решению CV-задач, а также о популярных архитектурных решениях на примерах трансформерных и сверточных моделей. Обсудим, как эффективно обучать, дебажить и применять модели.
Полезные ресурсы
Поговорим про ваш опыт использования интересных архитектур ASR/TTS: решаемая задача, данные, метрики и другое, любимые статьи по теме за последние 2 года, ваши знания по архитектурам нейронных сетей, их деплой и оптимизацию, а также метрики (online, offline, проблемы в оценке), данные и сложности, с которыми вы сталкивались при решении задач в области.
Поговорим про то как использовать алгоритмы машинного обучения и нейросети для решения задачи рекомендательной системы: верхнеуровневый дизайн общей архитектуры рексистемы, метрики, данные, различные стадии рексистем и какие модели на них можно использовать, дизайн ранжирования и генерации кандидатов. А ещё о проблемах, которые могут возникать в рамках рексистем (например, с разнообразием).
Полезные ресурсы
- Книга Recommender Systems Handbook
- Глава про рексистемы из учебника по машинному обучению
- Лекция из курса про машинное обучение от ВШЭ
- Доклад от Яндекса про применение трансформеров для рекомендаций
- Доклад от Яндекса про нейросети для ранжирования
- Статья Deep Neural Networks for YouTube Recommendations
- Статья PinnerFormer: Sequence Modeling for User Representation at Pinterest
Поговорим про то как использовать классические алгоритмы машинного обучения и стандартные архитектуры нейросетей для решения продуктовых задач: ML-постановка задачи, верхнеуровневый дизайн общей архитектуры решения, сбор обучающих выборок и таргетов, корректная обработка данных и признаков разной природы, обучение и выбор модели, формулировка офлайн- и онлайн-метрик (общих и специфичных для какого-либо кейса — например, для ранжирования или для uplift-моделирования).
Полезные ресурсы
Финалы с командами
На этом этапе вы подробнее узнаете о сервисе, задачах и проектах направления. В некоторых случаях, когда нам не хватило информации по итогам основных технических интервью, на финальной встрече мы можем задать технические задачи или вопросы. О таком формате мы обязательно предупредим заранее. На этой встрече вы с руководителем поймёте, насколько вам комфортно будет работать друг с другом в перспективе. Поэтому важно открыто рассказывать о вашем предыдущем опыте, профессиональных интересах и целях, не стесняться задавать вопросы.
Не стесняйтесь уточнять все интересующие вас моменты, чтобы сделать осознанный выбор проекта.
Офер
Как повысить шанс на успех
- Формулируйте решение вслух, нам важно знать, как именно вы думаете, решая задачу.
- Пишите читаемый код без ошибок, не усложняйте его.
- Приготовьтесь решать небольшие задачи в уме — без запуска кода в консоли. Не отдавайте решение, пока не уверены, что оно рабочее.
- Помните о краевых случаях. Напишите тест‑кейсы и проверьте их.