ML и аналитика в Яндекс Картах

ML и аналитика в Яндекс Картах

Наша задача — с помощью технологий помогать пользователям решать их задачи в реальном мире

Наша команда занимается машинным обучением и аналитикой в Яндекс Картах. Мы помогаем пользователям находить места, куда они хотят добраться, и выбирать, где провести время. Также мы работаем с пользовательским контентом, например с отзывами и фотографиями, чтобы показывать ключевые особенности каждой организации. А ещё мы оцифровываем реальный мир — автоматически собираем карту из спутниковых снимков, панорам и фотографий.

С использованием машинного обучения мы стремимся сделать наши подходы масштабируемыми и решить задачи, которые раньше были под силу только человеку. Например, советовать хорошие места по очень сложным пользовательским запросам или автоматически описывать интересующее пользователя место.

Кого мы ищем?

ML-разработчики
В нашей команде проводят разработку full stack — от идеи решения задачи до внедрения в продакшен: разбор проблем в ответах нашего обучения моделей, проверку работоспособности методов на офлайн- и онлайн-метриках качества, имплементацию обученной модели для работы в рантайме или в регулярном пайплайне.
Аналитики-разработчики
Занимаются схожими задачами. Но в ответственности аналитиков очень важное место занимает построение метрик качества и поиск точек роста сервиса. Соответственно, аналитики реже разработчиков касаются имплементации своего решения в рантайм (особенно если оно требует существенной разработки), но чаще занимаются созданием метрик, анализом экспериментов и поиском точек роста.

Наш стек

ML
  • Классические модели Catboost
  • Модели-трансформеры для NLP-задач BERT, YaLM (Зелибоба), YandexGPT
  • Модели сегментации, детекции, векторизации и NeRF для CV-задач
  • Инструменты разработки Python, С++
Аналитика
  • Big data YTsaurus, Python + SQL для обработки данных
  • Инструменты аналитики Yandex DataLens, Jupyter для моделирования и визуализации (NumPy, pandas, Scikit-learn, Plotly)
  • Инструменты разработки Python
  • Теоретическая база Математическая статистика, A/B-тестирование, проверка гипотез, замер качества пользовательского продукта и ML-систем

Наши команды

Геопоиск

Ежедневно люди делают миллионы запросов про разные места: ищут организации в Яндекс Картах и Навигаторе, пользуются приложением Такси, задают запросы в поиске Яндекса. Часть запросов достаточно конкретна, например «Яндекс на Льва Толстого». Но люди не всегда точно знают, чего хотят, поэтому используют наш сервис для поиска более релевантного ответа, например «ресторан с красивым видом на город» или «грузовой шиномонтаж». Далеко не всегда запрос задают на русском языке, ведь существенная часть наших пользователей находится за границей. Команда геопоиска работает над тем, чтобы ответы на поисковые запросы пользователей были качественными, а выдача — полезной и удобной для использования.

Монетизация Яндекс Карт

Яндекс Карты — это не только удобный сервис, которым пользуются миллионы, но и площадка, где организации могут рассказать о себе широкой аудитории. Мы создаём продукт для продвижения офлайн-организаций: компании получают преимущества в поиске и визуализации, а мы — дополнительный доход.

UGC и Discovery

Команды UGC (User Generated Content) и Discovery собирают и трансформируют неструктурированную информацию об организациях из текстов отзывов и фотографий, чтобы помочь пользователю найти на карте новые места и впечатления, быстро и осознанно выбрать нужную компанию. Карты извлекают ключевую информацию об организациях, будь то самые вкусные бургеры в городе, бары с самыми зажигательными танцами или клиники с самыми компетентными врачами, и помогают пользователям сделать выбор на основе этих данных.

ML для производства карт

Наша команда занимается автоматизацией создания детализированных карт с использованием машинного обучения и компьютерного зрения. Финальный вариант карт, к которому мы планируем прийти, можно посмотреть на YouTube. Такие карты создаются на основе панорамных и аэрофотоснимков со сверхвысоким разрешением. Создание таких карт требует огромных усилий от картографов, поэтому их труд важно автоматизировать.

Условия работы

Работа в сильной команде
Возможность работать с сильными специалистами, решать сложные задачи для многомиллионных сервисов и влиять на процесс и результат
Хорошая зарплата и гибкий график
Удобный график. Зарплата на уровне рынка и выше. Премии каждые полгода при условии эффективной работы
Социальный
пакет
Расширенная программа ДМС, оплата 80% стоимости ДМС для супругов и детей. Оплата питания на территории офиса. Спортзал, тренажёрный зал, йога в офисе. Льготы на ипотеку
Бесплатное
обучение
Возможность проходить курсы, тренинги и участвовать в конференциях
Процесс отбора
ML
Аналитика

Как подготовиться?

Собеседования в наших командах различаются в зависимости от специализации — они могут включать в себя вопросы и решение задач по алгоритмам, машинному обучению, аналитике и математической статистике. К таким собеседованиям обязательно стоит подготовиться, с наскока без подготовки результат может быть ниже, чем хотелось бы.
Материалы для подготовки к секциям с кодом
Материалы для подготовки к ML
Пример задачи по теории вероятностей
Примеры задач по матстату и терверу из ШАД
Thu Mar 07 2024 10:22:31 GMT+0300 (Moscow Standard Time)