LLM-модели YandexGPT служат основой для ряда сервисов в Яндексе — например, Алисы и Нейро в Поиске — и используются во многих других, например в Браузере, Маркете, Рекламе и Переводчике. Качество работы этих продуктов напрямую зависит от базовых моделей, которые мы предоставляем. Кроме того, наши модели доступны для пользователей по API через Yandex Cloud.
Вам предстоит найти способ улучшить выбранный навык: это может быть как работа с данными, например сбор подходящего датасета или генерация синтетических данных, так и изменения в процессе обучения модели.
Исследование процесса обучения
Качество итоговой модели зависит во многом и от того, какая схема обучения и гиперпараметры были выбраны. Это бывает непросто, особенно для больших моделей, когда попыток может быть одна или две. Вам предстоит исследовать методы, помогающие сделать такой выбор правильно, на основе Scaling Laws, экспериментов с моделями меньшего размера и другой имеющейся информации.
Кроме того, мы сейчас вкладываемся в механистическую интерпретируемость — то есть методы, с помощью которых можно анализировать, почему LLM-модель выдаёт тот или иной ответ, и какие данные в обучении на это повлияли.
Мультимодальность
В Яндексе ведутся разработки не только текстовых LLM, но и моделей, которые работают с аудио, картинками и видео. Нам предстоит большая работа по объединению этих результатов в мультимодальный претрейн: нужно будет собрать датасет и подобрать схему обучения так, чтобы у общего претрейна качество было таким же или превосходящим специализированные модели.
Поиск новых направлений
Обучение LLM — это быстро развивающаяся область, тут постоянно выходят новые исследования и релизы от конкурентов. Важно выделять из этого потока те результаты, которые с высокой вероятностью помогут нам в достижении наших целей. Вам предстоит регулярно находить такие исследования, рассказывать о них коллегам и реализовывать у нас. Также понятно, что для технологического лидерства недостаточно воспроизводить существующие результаты. От вас, как от старшего исследователя, ожидаем предложений новых идей и подходов к сбору данных и обучению LLM.
Больше об ML в Яндексе — в канале Yandex for ML
Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев.
Мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные 20%.
В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей.
Также мы оплачиваем участие в профильных конференциях — как в качестве спикера, так и в качестве участника.
Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов.
Во всех крупных офисах Яндекса есть спортзалы со всем необходимым: тренажёрами, спортивным инвентарём, душевыми, шкафчиками для одежды и вещей.
Можете заниматься самостоятельно, а можете с корпоративным тренером.
А также скидки в фитнес-клубах, бассейнах, студиях йоги, скалодромах и других местах.
В Яндексе есть спортивный клуб и много спортивных команд. У них есть свои лидеры, чаты, программы тренировок. А ещё они регулярно участвуют в забегах, триатлонах, «Гонке героев», футбольных и других соревнованиях.
Вы сможете присоединиться к существующим командам или собрать свою.
У нас нет фиксированного времени начала и конца рабочего дня — работайте так, как удобно вам и вашей команде.
Льготная ставка на покупку жилья и улучшение жилищных условий — в зависимости от стажа, позиции и результатов ревью. Действует для сотрудников, работающих в российских офисах Яндекса.
Страхование, детские дни в офисе, подарки на рождение детей и чекапы при планировании беременности.
Все интересные вам вакансии в одном профиле
Войти и откликнуться