Трек собеседований у нас индивидуальный. Мы хотим подробно поговорить о вашей экспертизе, поэтому ставим секции в зависимости от вашего опыта: проводим интервью как на базовые знания в ML, так и на понимание конкретной области.
Для собеседования через Zoom вам понадобится ноутбук с камерой и клавиатурой, чтобы писать код или обсуждать задачи, связанные с машинным обучением.
Секция ML & Programming включает в себя разговор о базовых понятиях и концепциях в ML на примере какого-либо алгоритма машинного обучения, проверку знания offline-метрик и решение задач на программирование, которые связаны со знанием алгоритмов и структур данных.
Критерии успеха:
ML инженеры в Яндексе занимаются не только исследовательскими задачами и обучением моделей, но и выводят их в продакшен, поэтому для нас важно, чтобы ML разработчики умели писать код.
В выборе практической задачи для обсуждения мы исходим из вашего релевантного опыта в области ML. Мы хотим, чтобы вы успешно продемонстрировали свои знания и умения. В зависимости от вашего опыта мы обсудим различные темы.
Кандидатам с опытом архитектурных решений мы предлагаем пройти секцию ML System design, которая позволяет продемонстрировать навыки и опыт работы с продакшн системами на базе ML, широкий кругозор, умение корректно формулировать свои мысли.
На этом этапе вы подробнее узнаете о сервисе, задачах и проектах направления. В некоторых случаях, когда нам не хватило информации по итогам основных технических интервью, на финальной встрече мы можем задать технические задачи или вопросы. О таком формате мы обязательно предупредим заранее. На этой встрече вы с руководителем поймете, насколько вам комфортно будет работать друг с другом в перспективе. Поэтому важно открыто рассказывать о вашем предыдущем опыте, профессиональных интересах и целях, не стесняться задавать вопросы.
Не стесняйтесь уточнять все интересующие вас моменты, чтобы сделать осознанный выбор проекта.
12 алгоритмических задач отборочного раунда и их разборы Почему и какие алгоритмические задачи нужно уметь решать, работая в поиске Оценка сложности
Яндекс Coderun инструмент для подготовки к очному собеседованию в Яндексе. Задачи очень похожи на те, что будут на интервью.
Видео, в которых мы разбираем задачи Контеста:
«Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.1» «Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.2»Полезные ресурсы:
LeetCode: задачи уровня medium помогут подготовиться ко встречам с командами. Видеолекции курса «Алгоритмы и структуры данных» TopCoder HackerRank CollabEditО чем поговорим на секции:
О современных подходах к решению NLP-задач различной сложности и об исследовании архитектур NLP-моделей, если у вас есть такой опыт: обсудим GPT-like- и BERT-модели, encoder-decoder-архитектуры, SoTA-подходы к обучению языковых моделей.Материалы:
Курс по NLP от Stanford Курс по NLP от ШАД Эпохальная статья про архитектуру трансформер «Attention is all you need» Интенсив в ШАД по обучению LLM LLM Scaling Week 2025 I Интенсив от ШАДаО чем поговорим на секции:
О современных подходах к решению CV-задач, а также о популярных архитектурных решениях на примерах трансформерных и сверточных моделей. Обсудим, как эффективно обучать, дебажить и применять модели.
Материалы:
Deep Learning for Computer Vision, Stanford CV Week от Яндекса по диффузионным моделям Accelerating Pytorch Model Training A ConvNet for the 2020s Visual Instruction Tuning SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense FeaturesО чем поговорим на секции:
Ваш опыт использования интересных архитектур ASR/TTS: решаемая задача, данные, метрики и другое, любимые статьи по теме за последние 2 года, ваши знания по архитектурам нейронных сетей, их деплой и оптимизацию, а также метрики (online, offline, проблемы в оценке), данные и сложности, с которыми вы сталкивались при решении задач в области.
О чем поговорим на секции:
Как использовать алгоритмы машинного обучения и нейросети для решения задачи рекомендательной системы: верхнеуровневый дизайн общей архитектуры рексистемы, метрики, данные, различные стадии рексистем и какие модели на них можно использовать, дизайн ранжирования и генерации кандидатов. А ещё о проблемах, которые могут возникать в рамках рексистем (например, с разнообразием).
Материалы:
Книга Recommender Systems Handbook Глава про рексистемы из учебника по машинному обучению Лекция из курса про машинное обучение от ВШЭ Доклад от Яндекса про применение трансформеров для рекомендаций Доклад от Яндекса про нейросети для ранжирования Статья Deep Neural Networks for YouTube Recommendations Статья PinnerFormer: Sequence Modeling for User Representation at PinterestО чем поговорим на секции:
Как использовать классические алгоритмы машинного обучения и стандартные архитектуры нейросетей для решения продуктовых задач: ML-постановка задачи, верхнеуровневый дизайн общей архитектуры решения, сбор обучающих выборок и таргетов, корректная обработка данных и признаков разной природы, обучение и выбор модели, формулировка офлайн- и онлайн-метрик (общих и специфичных для какого-либо кейса — например, для ранжирования или для uplift-моделирования).Материалы:
Курс Дьяконова Прикладные задачи анализа данных Google’s Machine Learning Crash Course Industry Projects Specialization