Привет! На этой странице вы узнаете про Data Science направление в Маркете, наш стек технологий, этапы собеседований и материалы, которые могут пригодиться.
Наши направления
Поиск на Маркете
Ключевые задачи:
занимаемся ранжированием товаров на Маркете и встраиванием полезных для пользователя элементов (статей) в поисковую выдачу;
ранжирование как контекстное (при запросе), так и безусловное (при навигации по категориям);
придумываем новые факторы (текстовые, нейросети, статистические и пользовательские), обучаем ранжирующие модели. Улучшаем текущие и придумываем новые ML-системы;
разрабатываем метрики качества поисковой выдачи и удовлетворенности пользователей, как на основе исторических данных, так и на результате разметок асессоров;
мониторинг качества поиска и других систем, за которые мы ответственны;
работаем с big data из разных источников (внутренние логи, Яндекс.Метрика, внутренние сервисы Яндекса).
Инструменты: Python, CatBoost.
Рекомендательные системы
Улучшаем рекомендации на Маркете при помощи технологий
машинного обучения. Интегрируем Маркет в другие сервисы Яндекса
(Поиск, Картинки, Алиса).
Аналитика рекомендаций — это:
применение машинного обучения для созданий лучших решений
на рынке e-commerce в области персональных рекомендаций;
прозрачное влияние наших фич на бизнес-метрики всего сервиса:
счастье пользователя и выручку сервиса;
разработка метрик качества рекомендательных систем;
проведение большого количества экспериментов,
влияющих на бизнес Маркета;
Занимаемся построением прогноза спроса на товары, который используется
для пополнения складов Яндекс.Маркета, и построением моделей эластичности по цене и времени доставки,
используемых в ценообразовании в реальном времени.
Отличительные особенности направления:
специфика e-com, большое число источников данных
с различными сигналами, которых нет в offline retail;
прогнозные модели строят не просто оценку среднего или оценку
нескольких квантилей, а прогнозируют распределения при условии
ценовой политики и позиции на рынке;
Никаких ограничений на используемый стек и возможность
использовать внушительные вычислительные мощности;
Технологии для работы с данными: Python, Apache Spark, Yandex Tables, Hive, GitHub.
Технологии для построения моделей: Python, CatBoost, PyTorch.
Рекламная платформа
Ключевые задачи:
улучшаем модели для расчёта вероятности заказа, релевантности и CTR;
предлагаем идеи по внедрению ML-решений в другие рекламные продукты;
придумываем механики рекламных аукционов на разных местах размещения;
принимаем участие в улучшении алгоритмов по выбору лучшего предложения в байбоксе;
Строим алгоритмы, которые работают в трёх направлениях:
для пользователей - помогают выбирать товары по структурированному каталогу и фильтровать их по параметрам;
для аналитиков рынка - сравнивают внешние транзакции с каталогом товаров Маркета и строят отчёты по объёмам продаж в различных сегментах рынка и оптимизации процессов ценообразования собственного ассортимента;
для внутренних процессов Маркета - оптимизируют и ускоряют процессы модерации контента за счёт саджестов и рекомендаций, снижают порог входа на Маркет для продавцов.
Ключевые задачи:
улучшаем качество работы инструментов для систематизации знаний и расширяем их функциональность;
исследуем данные Маркета и делаем на их основе выводы;
пишем код на Java для сервисов в продакшене;
ставим офлайн-эксперименты и анализируем их результаты;
разрабатываем пайплайны подготовки данных для использования в процедурах ML;
Работа с внутренними инструментами,
аналогами Hive, Hadoop, GitHub
Как мы будем общаться
Предварительная встреча (~40 мин)
Встреча, на которой мы знакомимся, обсуждаем ваш предыдущий опыт и пожелания к будущим направлениям работы;
Решаем аналитические задачи: по базовой математической
статистике и теории вероятностей,
бизнес-кейсы, метрики, базовый ML.
Написание кода на Python.
Секция на ML (~1 ч)
Аналитические вопросы (математическая статистика и теория вероятностей, логика, A/B тесты, метрики);
ML задачи (модели и алгоритмы обучения, loss-ы и метрики качества).
Алгоритмическая секция (~1,15 ч)
Предлагаем решить 2 задачи с использованием базовых алгоритмов и структур данных в редакторе с подсветкой кода. Задачи не требуют знания конкретных известных алгоритмов или редких структур данных, но вам поможет подготовиться практика на Leetcode (уровень easy/meduim, например).
Ждем, что вы сможете придумать алгоритм, который позволяет решить эту задачу и написать код, реализующий придуманный алгоритм. Для написания кода можно использовать любой язык программирования.
Технический финал (~1 ч)
На этой встрече мы спрашиваем
про опыт, обсуждаем кейсы,
решаем ещё несколько задач
Рассказываем про себя,
про наши проекты, задачи, стек,
технологии и процессы
Несколько полезных советов:
Потренируйтесь в решении подобных задач на LeetCode;
Во время решения задач проговаривайте свои мысли вслух - это поможет вам не запутаться в собственных мыслях, и даст возможность интервьюеру следить за ходом ваших размышлений и дать верную подсказку, если она потребуется;
Не забывайте проверять код на наличие ошибок перед тем, как сдать его интервьюеру;
Не бойтесь спрашивать непонятные для вас моменты и коммуницировать с интервьюером.
Среднее время прохождения всех этапов: 1–2 недели. Но если вы ограничены по срокам или хотите больше времени на подготовку — предупредите, пожалуйста, рекрутера,
мы очень постараемся подстроиться.
Когда мы даем фидбек:
промежуточный после технических секций: через 1–3 дня;
финальный после всех секций: через 1–2 дня (иногда немного дольше).
После успешного прохождения всех этапов мы предложим заполнить анкету соискателя и запустим процесс согласования оффера.
ДМС со стоматологией, лазерной коррекцией зрения, чекапами и другими услугами. Для сотрудников компенсация всей стоимости, для семьи — 80% стоимости.
Жилищная программа (после 1-го года работы)
Два вида займов: краткосрочный — на 3 года под 0% годовых, долгосрочный — на 10 лет под 3% годовых. Можно приобрести квартиру, дом или апартаменты
в городах России, где расположены офисы Яндекса.
Мощное оборудование
В первый рабочий день выдаем железо на Mac/Windows/Linux.
Компенсация питания
Бейджиком можно оплачивать еду на территории офиса, недалеко от него в партнерских кафе
и ресторанах, в Лавке и Еде при заказе на адрес офиса.
Комфортный офис на Новом Арбате
Для тех, кто захочет сменить обстановку. Множество разных мест для работы, спортзал, йога-класс, летняя веранда и вид на старую Москву — смотрите фотографии в статье.
Бесплатная парковка
Для автомобилей, велосипедов, самокатов и моноколес. Кроме того, машины можно парковать на территории других офисов Яндекса.
Премия каждые полгода по итогам ревью
Ревью — это регулярное подведение итогов работы и вознаграждение сотрудников по его результатам. Проходит два раза в год: весной и осенью. По результатам ревью возможно увеличение оклада, повышение грейда, получение премии.
Посмотреть по теме:
Ревью в Яндексе с Андреем Стыскиным, бывшим руководителем Поискового портала
Обучение
Онлайн-курсы на внутренней платформе, тренинги, внешние программы. Есть возможность посмотреть записи лекций или стать слушателем на новых потоках программ Академии Яндекса: Школа анализа данных, Школа разработки интерфейсов, Школа мобильной разработки, Школа менеджеров Яндекса и др.
Развитие
Мы поддерживаем сотрудников, которые хотят рассказывать о своих проектах вне Яндекса: помогаем готовить выступления и презентации, писать статьи
на Хабр
или vc.ru. Еще мы организовываем свои митапы, здесь можно посмотреть запись нашего Market Java Meetup.
Культура открытости
Мы открыто обсуждаем проекты, принимаем критику
и сами критикуем, без страха перед руководством или коллегами. Лучше высказать противоположное мнение, чем из вежливости промолчать, и говорить честно, даже если речь о сложностях.
Fri Jun 16 2023 14:10:20 GMT+0300 (Moscow Standard Time)