Как мы нанимаем ML-специалистов

Как мы нанимаем
ML-специалистов

Советы для кандидатов

2-3 недели

общая длительность всех собеседований

1 час

длительность каждого интервью

Zoom

или встречи в офисе

Об интервью

ML инженеры в Яндексе проходят три ключевых блока интервью: знакомство с рекрутером, технические секции и финальные встречи.

Трек собеседований у нас индивидуальный. Мы хотим подробно поговорить о вашей экспертизе, поэтому ставим секции в зависимости от вашего опыта: проводим интервью как на базовые знания в ML, так и на понимание конкретной области.

Как проходят этапы

Всего вам нужно будет пройти 3-4 технические встречи. Это можно сделать за один день или разделить на несколько. Вы получите фидбэк в течение трёх дней после интервью.

Для собеседования через Zoom вам понадобится ноутбук с камерой и клавиатурой, чтобы писать код или обсуждать задачи, связанные с машинным обучением.

Этапы собеседований

Знакомство с рекрутером

ML & Programming

Секция ML & Programming включает в себя разговор о базовых понятиях и концепциях в ML на примере какого-либо алгоритма машинного обучения, проверку знания offline-метрик и решение задач на программирование, которые связаны со знанием алгоритмов и структур данных.

Критерии успеха:

вы знакомы со стандартными алгоритмами, умеете оценивать их сложность, можете предложить пути оптимизации;
вы свободно владеете одним из языков программирования (Python/C++/Java — основные в Яндексе), пишете код без ошибок, знаете стандартные библиотеки;
вы знакомы с алгоритмами машинного обучения и методами оценки их качества.

Секция с написанием кода

Содержит задачи на кодинг/алгоритмы и структуры данных. Как правило, интервьюер дает две задачи. Также вас могут спросить об опыте и работе с разными технологиями (ЯП, ОС, БД). На собеседовании нужно писать код в онлайн-редакторе.

ML инженеры в Яндексе занимаются не только исследовательскими задачами и обучением моделей, но и выводят их в продакшен, поэтому для нас важно, чтобы ML разработчики умели писать код.

ML Special

Опытным кандидатам мы предлагаем пройти узкоспециализированную секцию ML Special, на которой предполагается обсуждение глубоких вопросов внутри конкретного домена или стека технологий ML: CV, NLP, RecSys, ASR/TTS, Classic ML.

В выборе практической задачи для обсуждения мы исходим из вашего релевантного опыта в области ML. Мы хотим, чтобы вы успешно продемонстрировали свои знания и умения. В зависимости от вашего опыта мы обсудим различные темы.

Кандидатам с опытом архитектурных решений мы предлагаем пройти секцию ML System design, которая позволяет продемонстрировать навыки и опыт работы с продакшн системами на базе ML, широкий кругозор, умение корректно формулировать свои мысли.

Финалы

Финал — это встреча с руководителем команды, но могут присоединиться и другие разработчики, и менеджеры из проекта.

На этом этапе вы подробнее узнаете о сервисе, задачах и проектах направления. В некоторых случаях, когда нам не хватило информации по итогам основных технических интервью, на финальной встрече мы можем задать технические задачи или вопросы. О таком формате мы обязательно предупредим заранее. На этой встрече вы с руководителем поймете, насколько вам комфортно будет работать друг с другом в перспективе. Поэтому важно открыто рассказывать о вашем предыдущем опыте, профессиональных интересах и целях, не стесняться задавать вопросы.

Не стесняйтесь уточнять все интересующие вас моменты, чтобы сделать осознанный выбор проекта.

Офер

Как повысить шанс на успех

Готовьтесь к собеседованиям:
от этого напрямую зависит результат

Формулируйте решение вслух

Нам важно знать, как именно вы думаете, решая задачу

Пишите читаемый код без ошибок

Не усложняйте его

Приготовьтесь решать небольшие задачи в уме — без запуска кода в консоли

Не отдавайте решение, пока не уверены, что оно рабочее

Помните о краевых случаях

Напишите тест‑кейсы и проверьте их

Полезные материалы

Примеры наших задач

12 алгоритмических задач отборочного раунда и их разборы Почему и какие алгоритмические задачи нужно уметь решать, работая в поиске Оценка сложности

Яндекс Coderun инструмент для подготовки к очному собеседованию в Яндексе. Задачи очень похожи на те, что будут на интервью.

Видео, в которых мы разбираем задачи Контеста:

«Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.1» «Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.2»

Полезные ресурсы:

LeetCode: задачи уровня medium помогут подготовиться ко встречам с командами. Видеолекции курса «Алгоритмы и структуры данных» TopCoder HackerRank CollabEdit

NLP

О чем поговорим на секции:

О современных подходах к решению NLP-задач различной сложности и об исследовании архитектур NLP-моделей, если у вас есть такой опыт: обсудим GPT-like- и BERT-модели, encoder-decoder-архитектуры, SoTA-подходы к обучению языковых моделей.

Материалы:

Курс по NLP от Stanford Курс по NLP от ШАД Эпохальная статья про архитектуру трансформер «Attention is all you need» Интенсив в ШАД по обучению LLM

О чем поговорим на секции:

Специализированные вопросы про базовые понятия в CV, вопросы на архитектуру и отладку нейросетей, основные подходы и архитектуры DL на примере практической задачи.

Материалы:

Deep Learning for Computer Vision, Stanford Deep learning book, Ian Goodfellow Fast.ai A ConvNet for the 2020s An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale Learning Transferable Visual Models From Natural Language Supervision Visual Instruction Tuning

ASR/TTS

О чем поговорим на секции:

Ваш опыт использования интересных архитектур ASR/TTS: решаемая задача, данные, метрики и другое, любимые статьи по теме за последние 2 года, ваши знания по архитектурам нейронных сетей, их деплой и оптимизацию, а также метрики (online, offline, проблемы в оценке), данные и сложности, с которыми вы сталкивались при решении задач в области.

RecSys

О чем поговорим на секции:

Как выглядит типичная рекомендательная система (из каких стадий и моделей состоит, какие метрики и данные для неё используют), как применять нейросети для улучшения рекомендаций, какие проблемы возникают чаще всего и как их можно решить.

Материалы:

Книга Recommender Systems Handbook Глава про рексистемы из учебника по машинному обучению Лекция из курса про машинное обучение от ВШЭ Доклад от Яндекса про применение трансформеров для рекомендаций Доклад от Яндекса про нейросети для ранжирования Статья Deep Neural Networks for YouTube Recommendations Статья PinnerFormer: Sequence Modeling for User Representation at Pinterest

Classic ML

О чем поговорим на секции:

Как использовать классические алгоритмы машинного обучения и стандартные архитектуры нейросетей для решения продуктовых задач: ML-постановка задачи, сбор обучающих выборок и таргетов, корректная обработка данных и признаков разной природы, обучение и выбор модели, формулировка офлайн- и онлайн-метрик (общих и специфичных для какого-либо кейса — например, для ранжирования или для uplift-моделирования).

Материалы:

Курс Дьяконова Прикладные задачи анализа данных Google’s Machine Learning Crash Course Industry Projects Specialization

Смотреть все