Трек собеседований у нас индивидуальный. Мы хотим подробно поговорить о вашей экспертизе, поэтому ставим секции в зависимости от вашего опыта: проводим интервью как на базовые знания в ML, так и на понимание конкретной области.
Для собеседования через Zoom вам понадобится ноутбук с камерой и клавиатурой, чтобы писать код или обсуждать задачи, связанные с машинным обучением.
Секция ML & Programming включает в себя разговор о базовых понятиях и концепциях в ML на примере какого-либо алгоритма машинного обучения, проверку знания offline-метрик и решение задач на программирование, которые связаны со знанием алгоритмов и структур данных.
Критерии успеха:
ML инженеры в Яндексе занимаются не только исследовательскими задачами и обучением моделей, но и выводят их в продакшен, поэтому для нас важно, чтобы ML разработчики умели писать код.
В выборе практической задачи для обсуждения мы исходим из вашего релевантного опыта в области ML. Мы хотим, чтобы вы успешно продемонстрировали свои знания и умения. В зависимости от вашего опыта мы обсудим различные темы.
Кандидатам с опытом архитектурных решений мы предлагаем пройти секцию ML System design, которая позволяет продемонстрировать навыки и опыт работы с продакшн системами на базе ML, широкий кругозор, умение корректно формулировать свои мысли.
На этом этапе вы подробнее узнаете о сервисе, задачах и проектах направления. В некоторых случаях, когда нам не хватило информации по итогам основных технических интервью, на финальной встрече мы можем задать технические задачи или вопросы. О таком формате мы обязательно предупредим заранее. На этой встрече вы с руководителем поймете, насколько вам комфортно будет работать друг с другом в перспективе. Поэтому важно открыто рассказывать о вашем предыдущем опыте, профессиональных интересах и целях, не стесняться задавать вопросы.
Не стесняйтесь уточнять все интересующие вас моменты, чтобы сделать осознанный выбор проекта.
12 алгоритмических задач отборочного раунда и их разборы Почему и какие алгоритмические задачи нужно уметь решать, работая в поиске Оценка сложности
Яндекс Coderun инструмент для подготовки к очному собеседованию в Яндексе. Задачи очень похожи на те, что будут на интервью.
Видео, в которых мы разбираем задачи Контеста:
«Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.1» «Как решать алгоритмические секции: помощь разработчикам, собеседующимся в Яндекс. Ч.2»Полезные ресурсы:
LeetCode: задачи уровня medium помогут подготовиться ко встречам с командами. Видеолекции курса «Алгоритмы и структуры данных» TopCoder HackerRank CollabEditО чем поговорим на секции:
Дискриминативные и генеративные модели, последние трансформерные архитектуры (Bert, GPT-3, T5 и их варианты), их улучшение и ускорение, large sсale обучение трансформерных моделей, transfer learning, дистилляция.Материалы:
Курс по NLP от Stanford Курс по NLP от ШАД Эпохальная статья про архитектуру трансформер «Attention is all you need»О чем поговорим на секции:
Специализированные вопросы про базовые понятия в CV, вопросы на архитектуру и отладку нейросетей, основные подходы и архитектуры DL на примере практической задачи.Материалы:
Deep Learning for Computer Vision, Stanford Deep learning book, Ian Goodfellow Fast.ai A ConvNet for the 2020s An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale Learning Transferable Visual Models From Natural Language Supervision Visual Instruction TuningО чем поговорим на секции:
Ваш опыт использования интересных архитектур ASR/TTS: решаемая задача, данные, метрики и другое, любимые статьи по теме за последние 2 года, ваши знания по архитектурам нейронных сетей, их деплой и оптимизацию, а также метрики (online, offline, проблемы в оценке), данные и сложности, с которыми вы сталкивались при решении задач в области.
О чем поговорим на секции:
Стандартные алгоритмы и/или архитектуры нейросетей для персонализации и коллаборативной фильтрации, выбор таргетов: на какие таргеты обучить модели, как собирать обучающую выборку, корректная работа с данными, зависящими от времени, ML дебаг, метрики, специфичные для онлайн-систем ранжирования.Материалы:
Deep Neural Networks for YouTube Recommendations Preserving Integrity in Online Social Networks Bag of Tricks for Efficient Text Classification Wide & Deep Learning for Recommender Systems