Data Dojo

Регистрация до 4 июня 21:00

Хочу на Data Dojo

Встреча 25 июня на Young Con в Live Arena

Участвуй в тренировке Data Dojo

Попади на Young Con
Выиграй призы

Тренировка
- Послушай лекции и подготовься к отбору на очную встречу на Young Con
- Реши задачи и попади в топ‑350
- Получи призы и приглашение на Data Dojo
Data Dojo
на Young Con
- Участвуй в закрытой программе Data Dojo для участников Тренировки и Young Con

Хочу на Data Dojo

Призы

Выдаются только зарегистрированным на Young Con

Умные колонки
с Алисой для топ‑10
Фаст-трек в Яндекс для топ‑50
Футболка Data Dojo для очных участников
Сертификаты всем, кто решит задачи
Проходка на Young Con для топ‑350

Хочу на Young Con

Таймлайн

1
19–21 мая
онлайн
Укрепи знания на лекциях, чтобы стать лучшим на Тренировке
Подробнее
Регистрируйся на Data Dojo
19 и 21 мая слушай лекции для подготовки к соревнованию
2
21 мая–4 июня
онлайн
Попробуй решить 2 ML‑задачи Тренировки и попади в топ‑350
Подробнее
21 мая мы откроем доступ к задачам
Решай их в свободном темпе до 4 июня включительно
Набери как можно больше баллов за решение
До 11 июня опубликуем итоговый рейтинг и вышлем приглашения на Data Dojo
3
25 июня
Live Арена
Приходи в пространство Data Dojo и забирай призы
Подробнее
25 июня прими участие в специальной программе Data Dojo для участников Тренировки
Зарегистрируйся на Young Con
Забери заслуженные призы

Программа Data Dojo на Young Con

12:00–12:25
- Роман Горб
  Руководитель команды
  ускорения инференса Alice AI
Эффективный инференс для агентского сценария
Общее введение и специфика сценария

Проблема замеров скорости и её решения

Ключевые методы ускорения
12:25–12:50
- Даниил Яковлев
  Руководитель отдела
  Core & Agentic Search
Агентный поиск: чем отличается поиск для агентов?
Овервью, как работает поиск и в чём отличия пайплайнов для людей и моделей

ИК и Context Engineering: как мы решаем задачу

Отличия в ранжированиях и их сигналах
12:50–13:15
- Сергей Ким
  Руководитель группы детекторного претрейна Автономного транспорта
Как мы готовим претрейны детекторов
Компоненты автономной машины

Модуль восприятия

Контуры претрейна и алайна

Претрейны в текстах

Претрейны в зрении

Общие свойства претрейнов

Претрейны в автономках

Onboard и offboard-модели
13:15–13:40
- Владислав Носивской
  Руководитель группы инференса больших языковых моделей Yandex Cloud
Эффективно запускаем действительно большие языковые модели
Рассмотрим проблемы запуска действительно больших языковых моделей, когда умещаться на одном сервере становится невозможно/неэффективно (на примере DeepSeek)

Изучим современные подходы распределения инференса одной модели по нескольким серверам: параллелизмы и Prefill-Decode разделение

Вызовы агентских нагрузок и как эффективно с ними справляться: KV‑кеши и оптимизации работы с ними
13:40–14:05
- Филипп Ульянкин
  Руководитель группы
  технологий безопасности
Это была авария или просто кочка?
У каждого водителя в телефоне есть акселерометр и гироскоп. По данным с них можно понимать, какие маневры водитель делает за рулём. А ещё можно понять, не попало ли такси в ДТП, найти его в первые минуты и вмешаться в ситуацию. В докладе узнаете, как мы это делаем с помощью машинного обучения и зачем оно тут вообще нужно.
14:05–14:30
- Александр Сафронов
  Руководитель отдела ML
  и AI в Фантехе
Как Моя волна работает без интернета
Обзор задачи музыкальных рекомендаций при нестабильном подключении интернета

Устройство движка локальных рекомендаций

Алгоритм проактивной закачки треков
14:30–14:35
Награждение топ‑10 участников Тренировки Data Dojo
14:35–15:00
- Радослав Нейчев
  Руководитель группы ML‑разработки Лаборатории ИИ Яндекса
Разбор задач Тренировки Data Dojo
Как решать задачу перевода для малоресурсных языков.

Обсуждение решений участников

Примеры хороших подходов

Разбор вопросов аудитории

FAQ

Что такое Data Dojo?
Data Dojo — это сообщество ML‑экспертов. На встречах сообщества мы обсуждаем трендовые направления машинного обучения и разбираем задачи с ML‑соревнований.
Для кого Data Dojo?
Пространство Data Dojo будет интересно тем, у кого уже есть базовые знания в ML и желание развиваться дальше.
Как принять участие?
Заполни форму регистрации и участвуй в Тренировке. На основе её рейтинга сформируем список приглашённых. Подробнее читай в правилах Тренировки.
Нужно ли регистрироваться на Young Con?
В Тренировке можно принять участие без регистрации на фест. Но она обязательно потребуется, если вы хотите получить призы.
Кто сможет попасть в ML‑пространство Data Dojo на Young Con?
Вход в пространство будет по приглашениям: мы пришлём их 11 июня.

Проявляйся в том, что делаешь

Хочу на Young Con

Яна Плужникова
Была стажёром 4 месяца
—> перешла в команду
HR-маркетинга и бренда работодателя
«Проявляюсь в наведении красоты в экселе и креативах для разработчиков»
Никита Абаев
Стажировался 6 месяцев, а теперь — в Яндекс Еде
«Проявляюсь в заботе о пользователях, команде и балансе работы и отдыха»
Матвей Щербаков
В Яндексе 4 месяца, сейчас — фронтендер в Спорте Кинопоиска
«Проявляюсь в наведении красоты в интерфейсах, улучшении процессов и битых ссылках»