Data Dojo

Регистрация до 4 июня 21:00
Встреча 25 июня на Young Con в Live Arena

Участвуй в тренировке Data Dojo

  • Попади на Young Con
  • Выиграй призы
  • Тренировка
    • Послушай лекции и подготовься к отбору на очную встречу на Young Con
    • Реши задачи и попади в топ‑350
    • Получи призы и приглашение на Data Dojo
  • Data Dojo
    на Young Con
    • Участвуй в закрытой программе Data Dojo для участников Тренировки и Young Con

Призы

Выдаются только зарегистрированным на Young Con
  • Умные колонки
    с Алисой
    для топ‑10
  • Фаст-трек в Яндекс для топ‑50
  • Футболка Data Dojo для очных участников
  • Сертификаты всем, кто решит задачи
  • Проходка на Young Con для топ‑350

Таймлайн

  • 1
    19–21 мая
    онлайн
    Укрепи знания на лекциях, чтобы стать лучшим на Тренировке
    Подробнее
  • 2
    21 мая–4 июня
    онлайн
    Попробуй решить 2 ML‑задачи Тренировки и попади в топ‑350
    Подробнее
    • 21 мая мы откроем доступ к задачам
    • Решай их в свободном темпе до 4 июня включительно
    • Набери как можно больше баллов за решение
    • До 11 июня опубликуем итоговый рейтинг и вышлем приглашения на Data Dojo
  • 3
    25 июня
    Live Арена
    Приходи в пространство Data Dojo и забирай призы
    Подробнее
    • 25 июня прими участие в специальной программе Data Dojo для участников Тренировки
    • Зарегистрируйся на Young Con
    • Забери заслуженные призы

Программа Data Dojo на Young Con

  • 12:00–12:25
    • Роман Горб
      Роман Горб
      Руководитель команды
      ускорения инференса Alice AI
    Эффективный инференс для агентского сценария
    • Общее введение и специфика сценария
    • Проблема замеров скорости и её решения
    • Ключевые методы ускорения
  • 12:25–12:50
    • Даниил Яковлев
      Даниил Яковлев
      Руководитель отдела
      Core & Agentic Search
    Агентный поиск: чем отличается поиск для агентов?
    • Овервью, как работает поиск и в чём отличия пайплайнов для людей и моделей
    • ИК и Context Engineering: как мы решаем задачу
    • Отличия в ранжированиях и их сигналах
  • 12:50–13:15
    • Сергей Ким
      Сергей Ким
      Руководитель группы детекторного претрейна Автономного транспорта
    Как мы готовим претрейны детекторов
    • Компоненты автономной машины
    • Модуль восприятия
    • Контуры претрейна и алайна
    • Претрейны в текстах
    • Претрейны в зрении
    • Общие свойства претрейнов
    • Претрейны в автономках
    • Onboard и offboard-модели
  • 13:15–13:40
    • Владислав Носивской
      Владислав Носивской
      Руководитель группы инференса больших языковых моделей Yandex Cloud
    Эффективно запускаем действительно большие языковые модели
    • Рассмотрим проблемы запуска действительно больших языковых моделей, когда умещаться на одном сервере становится невозможно/неэффективно (на примере DeepSeek)
    • Изучим современные подходы распределения инференса одной модели по нескольким серверам: параллелизмы и Prefill-Decode разделение
    • Вызовы агентских нагрузок и как эффективно с ними справляться: KV‑кеши и оптимизации работы с ними
  • 13:40–14:05
    • Филипп Ульянкин
      Филипп Ульянкин
      Руководитель группы
      технологий безопасности
    Это была авария или просто кочка?

    У каждого водителя в телефоне есть акселерометр и гироскоп. По данным с них можно понимать, какие маневры водитель делает за рулём. А ещё можно понять, не попало ли такси в ДТП, найти его в первые минуты и вмешаться в ситуацию. В докладе узнаете, как мы это делаем с помощью машинного обучения и зачем оно тут вообще нужно.

  • 14:05–14:30
    • Александр Сафронов
      Александр Сафронов
      Руководитель отдела ML
      и AI в Фантехе
    Как Моя волна работает без интернета
    • Обзор задачи музыкальных рекомендаций при нестабильном подключении интернета
    • Устройство движка локальных рекомендаций
    • Алгоритм проактивной закачки треков
  • 14:30–14:35
    Награждение топ‑10 участников Тренировки Data Dojo
  • 14:35–15:00
    • Радослав Нейчев
      Радослав Нейчев
      Руководитель группы ML‑разработки Лаборатории ИИ Яндекса
    Разбор задач Тренировки Data Dojo

    Как решать задачу перевода для малоресурсных языков.

    • Обсуждение решений участников
    • Примеры хороших подходов
    • Разбор вопросов аудитории

FAQ

  • Что такое Data Dojo?

    Data Dojo — это сообщество ML‑экспертов. На встречах сообщества мы обсуждаем трендовые направления машинного обучения и разбираем задачи с ML‑соревнований.

  • Для кого Data Dojo?

    Пространство Data Dojo будет интересно тем, у кого уже есть базовые знания в ML и желание развиваться дальше.

  • Как принять участие?

    Заполни форму регистрации и участвуй в Тренировке. На основе её рейтинга сформируем список приглашённых. Подробнее читай в правилах Тренировки.

  • Нужно ли регистрироваться на Young Con?

    В Тренировке можно принять участие без регистрации на фест. Но она обязательно потребуется, если вы хотите получить призы.

  • Кто сможет попасть в ML‑пространство Data Dojo на Young Con?

    Вход в пространство будет по приглашениям: мы пришлём их 11 июня.

Проявляйся в том, что делаешь

  • Яна Плужникова
    Была стажёром 4 месяца
    —> перешла в команду
    HR-маркетинга и бренда работодателя
    «Проявляюсь в наведении красоты в экселе и креативах для разработчиков»
  • Никита Абаев
    Стажировался 6 месяцев, а теперь — в Яндекс Еде
    «Проявляюсь в заботе о пользователях, команде и балансе работы и отдыха»
  • Матвей Щербаков
    В Яндексе 4 месяца, сейчас — фронтендер в Спорте Кинопоиска
    «Проявляюсь в наведении красоты в интерфейсах, улучшении процессов и битых ссылках»