Краудсорсинг — это способ организации процессов, когда большая задача разбивается на несколько маленьких, которые передаются исполнителям. Пример такой задачи — разметка изображений для обучения ML-модели. В этом процессе участвуют две стороны: заказчик, который хочет разметить гигабайты изображений, и исполнители, готовые выполнять простые задания за сравнительно небольшую плату. Crowd-платформа — это маркетплейс, позволяющий свести эти две стороны друг с другом.
Отдел внутреннего краудсорсинга (Crowd) помогает сервисам Яндекса решать бизнес-задачи. Мы размечаем данные, занимаемся тестированием, поддержкой пользователей и продажами, модерируем контент, готовим тексты, графику и дизайн, пишем документацию и переводим тексты. Чтобы эффективно решать эти задачи, наша команда разрабатывает дополнительную инфраструктуру.
Один из наших сервисов — Bilim — позволяет строить базу знаний для операторов внутри Яндекса (например, в колл-центре) и платформу документации для внешних пользователей. Сервис красиво презентует документацию внешним пользователям и упрощает работу с контентом внутренних пользователей.
Второй крупный сервис — Crew — является WFM-системой. К примеру, обращения внешних пользователей в службу поддержки необходимо обрабатывать в строго определённый срок. Для этого нужно гарантировать, что в любой момент времени операторы не перегружены. Crew призван решить эту задачу. Мы умеем прогнозировать нагрузку, автоматически составлять расписание работы операторов и в целом управлять группами людей (профилями пользователей, структурами ролей, навыков и т. д.).
Третий крупный сервис — Танкер, это инфраструктура для локализации, которой пользуются почти все сервисы Яндекса. Сервис состоит из хранилища интерфейсных ключей (которое позволяет эффективно управлять ключами как разработчикам, так и менеджерам) и инфраструктуры для переводчиков (интерфейса для переводчика, памяти переводов и т. п.).
Для решения любой задачи Crowd, будь то поддержка пользователей, продажа, тестирование или разметка, используются различные внутренние сервисы, в каждом из которых хранится своя специфичная информация. Для аналитики этих данных мы развиваем ещё один сервис — Crowd DWH. Он предоставляет инфраструктуру для быстрого создания data lake любого сервиса Crowd, а в перспективе позволит пользователям настраивать агрегацию, алерты и многое другое.
Наш стек технологий: