Как устроена Яндекс.Толока

Для размещения задания в Яндекс.Толоке надо создать три разных сущности: проект, пул и загрузить сами задания. Каждая из этих сущностей отвечает за свой блок настроек задания. Этот раздел объяснит, почему Толока устроена так и какие преимущества это дает.

Проект

Проект содержит инструкцию, настройки интерфейса задания и спецификацию входных и выходных данных. Также вы можете настроить правила контроля качества, которые будут действовать для всего проекта.

Благодаря проектам вам будет проще размещать похожие задания в будущем — не придется заново настраивать интерфейс. Также вы сможете смотреть объединенную статистику по всем заданиям в проекте.

Пул

Пул — это набор заданий, которые будут выданы исполнителям одновременно. Основные настройки пула: ценообразование, отбор исполнителей, перекрытие и контроль качества.

Разделение заданий по пулам позволит вам:
  • Отбирать разных исполнителей для заданий.

    Например, текст в заданиях по модерации комментариев может быть на разных языках: одни комментарии на русском, другие на английском. Такие комментарии можно разделить по разным пулам, а в фильтрах указать язык, который должен знать исполнитель.

  • Выставлять цену, перекрытие и настраивать контроль качества в зависимости от сложности заданий.

    Например, задания по расшифровке аудио длительностью в 10-20 секунд и в 50-60 секунд должны оплачиваться по-разному.

  • Управлять приоритетом заданий, выдавая один пул раньше другого.

  • Группировать задания, чтобы смотреть отдельную статистику по каждой группе.

Задание

Задания — это ваши данные, которые надо разметить. Каждая картинка или комментарий — это отдельное задание.

Задания бывают разных типов: обычные, контрольные (с ответами) и обучающие (с подсказками).

В Толоку вы загружаете задания в виде TSV-файла. Структура файла должна соответствовать спецификации входных и выходных данных, которую вы настроили в проекте.

Совет. Чтобы задание выполнило несколько исполнителей, необязательно дублировать его во входных данных — задайте перекрытие в настройках пула.

Страница заданий

Исполнителям задания отдаются постранично. На странице может быть одно или несколько заданий. Количество вы указываете при загрузке заданий в пул.

Важно.
  • Ответ исполнителя будет записан только после выполнения всех заданий на странице.
  • Цену вы указываете за страницу заданий. Оплачивается только выполненная страница целиком.

У некоторых исполнителей медленный интернет, поэтому добавление нескольких заданий позволит им реже обновлять страницу, а значит быстрее выполнять ваши задания.

Но не делайте слишком много заданий на странице: качество будет хуже, а исполнители будут уставать. Размещайте на странице 5-10 простых заданий или 1-4 сложных.

Совет. Вы можете самостоятельно разделить задания на странице — это позволит сгруппировать задания, например отдать на разметку все похожие фотографии одновременно. В этом случае количество заданий на каждой странице может быть разным.

Как это выглядит у исполнителей

Когда вы запускаете пул, он становится виден исполнителям в разделе Задания. Исполнители выбирают пул, читают инструкцию и выполняют задания.

Каждое задание на странице представляет собой фрагмент веб-страницы, в котором могут быть размещены различные объекты: картинки, текст, поля ввода.

Примечание. У исполнителей нет разделения на пулы, задания и страницы заданий. Всё это они могут называть словом «задание».

Подробнее см. Как исполнители видят пулы.

API Яндекс.Толоки

Если вам надо часто размещать похожие задания, автоматизируйте это с помощью API Яндекс.Толоки.

Если вам не хватает гибкости при размещении заданий, то в API Толоки есть дополнительные возможности, которых еще нет в интерфейсе. Например, через API вы сможете указывать перекрытие для отдельных заданий и добавлять несколько правильных ответов на контрольные задания.