Трек собеседований у нас индивидуальный. Мы хотим подробно поговорить о вашей экспертизе, поэтому ставим секции в зависимости от вашего опыта: проводим интервью как на базовые знания в ML, так и на понимание конкретной области.
Для собеседования через Zoom вам понадобится ноутбук с камерой и клавиатурой, чтобы писать код или обсуждать задачи, связанные с машинным обучением.
Секция ML & Programming включает в себя разговор о базовых понятиях и концепциях в ML на примере какого-либо алгоритма машинного обучения, проверку знания offline-метрик и решение задач на программирование, которые связаны со знанием алгоритмов и структур данных.
Критерии успеха:
ML инженеры в Яндексе занимаются не только исследовательскими задачами и обучением моделей, но и выводят их в продакшен, поэтому для нас важно, чтобы ML разработчики умели писать код.
В выборе практической задачи для обсуждения мы исходим из вашего релевантного опыта в области ML. Мы хотим, чтобы вы успешно продемонстрировали свои знания и умения. В зависимости от вашего опыта мы обсудим различные темы.
Кандидатам с опытом архитектурных решений мы предлагаем пройти секцию ML System design, которая позволяет продемонстрировать навыки и опыт работы с продакшн системами на базе ML, широкий кругозор, умение корректно формулировать свои мысли.
На этом этапе вы подробнее узнаете о сервисе, задачах и проектах направления. В некоторых случаях, когда нам не хватило информации по итогам основных технических интервью, на финальной встрече мы можем задать технические задачи или вопросы. О таком формате мы обязательно предупредим заранее. На этой встрече вы с руководителем поймете, насколько вам комфортно будет работать друг с другом в перспективе. Поэтому важно открыто рассказывать о вашем предыдущем опыте, профессиональных интересах и целях, не стесняться задавать вопросы.
Не стесняйтесь уточнять все интересующие вас моменты, чтобы сделать осознанный выбор проекта.
12 алгоритмических задач отборочного раунда и их разборы Почему и какие алгоритмические задачи нужно уметь решать, работая в поиске Оценка сложности
Яндекс Coderun инструмент для подготовки к очному собеседованию в Яндексе. Задачи очень похожи на те, что будут на интервью.
Видео, в которых мы разбираем задачи Контеста:
«Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.1» «Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.2»Полезные ресурсы:
LeetCode: задачи уровня medium помогут подготовиться ко встречам с командами. Видеолекции курса «Алгоритмы и структуры данных» TopCoder HackerRank CollabEditО чем поговорим на секции:
О современных подходах к решению NLP-задач различной сложности и об исследовании архитектур NLP-моделей, если у вас есть такой опыт: обсудим GPT-like- и BERT-модели, encoder-decoder-архитектуры, SoTA-подходы к обучению языковых моделей.Материалы:
Курс по NLP от Stanford Курс по NLP от ШАД Эпохальная статья про архитектуру трансформер «Attention is all you need» Интенсив в ШАД по обучению LLMО чем поговорим на секции:
Специализированные вопросы про базовые понятия в CV, вопросы на архитектуру и отладку нейросетей, основные подходы и архитектуры DL на примере практической задачи.Материалы:
Deep Learning for Computer Vision, Stanford Deep learning book, Ian Goodfellow Fast.ai A ConvNet for the 2020s An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale Learning Transferable Visual Models From Natural Language Supervision Visual Instruction TuningО чем поговорим на секции:
Ваш опыт использования интересных архитектур ASR/TTS: решаемая задача, данные, метрики и другое, любимые статьи по теме за последние 2 года, ваши знания по архитектурам нейронных сетей, их деплой и оптимизацию, а также метрики (online, offline, проблемы в оценке), данные и сложности, с которыми вы сталкивались при решении задач в области.
О чем поговорим на секции:
Как выглядит типичная рекомендательная система (из каких стадий и моделей состоит, какие метрики и данные для неё используют), как применять нейросети для улучшения рекомендаций, какие проблемы возникают чаще всего и как их можно решить.
Материалы:
Книга Recommender Systems Handbook Глава про рексистемы из учебника по машинному обучению Лекция из курса про машинное обучение от ВШЭ Доклад от Яндекса про применение трансформеров для рекомендаций Доклад от Яндекса про нейросети для ранжирования Статья Deep Neural Networks for YouTube Recommendations Статья PinnerFormer: Sequence Modeling for User Representation at PinterestО чем поговорим на секции:
Как использовать классические алгоритмы машинного обучения и стандартные архитектуры нейросетей для решения продуктовых задач: ML-постановка задачи, сбор обучающих выборок и таргетов, корректная обработка данных и признаков разной природы, обучение и выбор модели, формулировка офлайн- и онлайн-метрик (общих и специфичных для какого-либо кейса — например, для ранжирования или для uplift-моделирования).Материалы:
Курс Дьяконова Прикладные задачи анализа данных Google’s Machine Learning Crash Course Industry Projects Specialization