Расшифровка аудиозаписей

Вы можете публиковать задания для расшифровки небольших аудиозаписей. Желательно, чтобы в одном пуле записи были одинаковой длины. Задания на расшифровку удобнее запускать для выполнения в веб-версии Толоки, чтобы исполнитель мог набирать текст на клавиатуре.

Предположим, вам нужно расшифровать стихи с детского утренника. Для этого создадим такое задание: исполнителю будет предложена аудиозапись во встроенном плеере, и он должен набрать текст, который услышит на записи.

Пример готового задания

Чтобы запустить задания и получить ответы:

Создайте проект

Проект определяет, как будет выглядеть задание у исполнителя.

  1. Нажмите кнопку + Создать проект и выберите шаблон Транскрипция аудио.

  2. Дайте проекту понятное название и краткое описание. Их увидят исполнители в списке доступных заданий.

  3. Напишите краткую и ясную инструкцию (см. советы).

  4. Определите, какие объекты будете передавать исполнителю и получать от него в ответ. Для этого необходимо создать поля входных и выходных данных в блоке Спецификации.
    Что такое входные и выходные данные?

    Входные данные — типы объектов, которые будут подаваться исполнителю для выполнения задания. Например, текст, картинка, географические координаты.

    Выходные данные — типы объектов, которые будут получены после выполнения задания. Например, один из нескольких вариантов ответа, введенный текст или загруженный файл.

    Подробнее о полях входных и выходных данных.

    Шаблон включает в себя поля:

    • Поле входных данных — ссылка audio на аудиофайл.

      Измените тип данных на строку, чтобы загружать аудиофайлы, хранящиеся на Яндекс.Диске.

    • Поле выходных данных — строка output, в которую будет записан текст, введенный исполнителем.
  5. Создайте интерфейс задания в блоке HTML. Он описывает, как будут расположены элементы задания.

    В HTML-интерфейсе можно использовать стандартные теги HTML и специальные выражения в двойных фигурных скобках для полей входных и выходных данных.

    <div>
      <audio src={{proxy audio}} controls controlsList="nodownload">
        Невозможно воспроизвести
      </audio><br/><br/>
    </div>
    <div>
      <div>Текст стихотворения</div>
      {{field type="textarea" name="output" width="300px" rows="6"}}
    </div>
    Эта запись означает, что задание будет выглядеть так:
    • аудиозапись в плеере;
    • поле для ввода текста.

    Очистите блок CSS.

    Блок JavaScript оставьте без изменений. В нем настроена проверка воспроизведения записи в плеере. Исполнитель не сможет отправить задание без прослушивания всех аудиозаписей в нем.

  6. Нажмите кнопку Предпросмотр, чтобы увидеть получившееся задание.
    Примечание. В предварительном просмотре проекта отображается четыре задания со стандартными данными. Количество заданий на странице вы сможете настроить далее.
  7. Сохраните проект.

Добавьте пул заданий

Пул — это набор оплачиваемых заданий, которые одновременно выдаются исполнителям.

  1. Откройте проект и нажмите Добавить пул → Добавить пул.
  2. Дайте пулу любое удобное название и описание. Они доступны только вам, исполнитель будет видеть только название и описание проекта.
  3. Установите цену за страницу заданий, например, $0.05. Цена зависит от длительности аудиозаписи.
    Что такое страница заданий?

    На одной странице может отображаться одно или несколько заданий. Если задания простые, то можно добавлять 10–20 заданий на одну страницу. Не рекомендуем создавать длинные страницы, поскольку это снизит скорость загрузки данных у исполнителя.

    Исполнитель получит оплату, только если выполнил все задания на странице.

    Количество заданий на странице вы определите при загрузке заданий.

    Как определить справедливую цену?

    Общее правило формирования цены — чем больше времени исполнитель тратит на выполнение, тем выше цена.

    Вы можете зарегистрироваться в Толоке как исполнитель и узнать, сколько платят другие заказчики за задания.

  4. Укажите Время на выполнение страницы заданий. Его должно быть достаточно, в том числе для чтения инструкции, загрузки задания, прослушивания аудиозаписи и набора текста. Например, 1200 секунд.
  5. Установите Перекрытие — количество исполнителей, которые должны выполнить задание. Для расшифровки речи, как правило, 1.
  6. Включите опцию Отложенная приемка и укажите количество дней на проверку Дедлайн. Например, 7.
    Что такое отложенная приемка?

    Отложенная приемка позволяет вам просматривать выполненные задания перед тем, как принять их и заплатить исполнителю. Задания, выполненные в несоответствии с инструкцией, можно отклонять. Максимальный срок проверки устанавливается в поле Дедлайн.

  7. Добавьте Фильтры для отбора исполнителей. Чтобы ваше задание было доступно только исполнителям, владеющим русским языком, выберите набор Русскоязычные исполнители.
  8. Сохраните пул.

Загрузите задания

  1. Скачайте Пример загрузочного файла (tsv) в пуле.
    Что такое TSV?
    TSV-файл — это представление электронной таблицы в виде текстового файла, в котором столбцы разделены знаком табуляции.
    Вы можете работать с ним как в редакторе электронных таблиц, так и в текстовом редакторе, а затем сохранить в нужный формат. Подробнее о работе с TSV-файлом.
    Примечание. Перед загрузкой файла убедитесь, что он сохранен в кодировке UTF-8.
  2. Добавьте в него входные данные — относительные ссылки на аудиофайлы. Заголовок столбца с входными данными содержит слово INPUT. Остальные столбцы оставьте пустыми.
  3. Загрузите задания, выбрав Указать вручную и установив, например, 4 задания на странице. Это значит, что на одной странице будет 4 аудиозаписи, под каждой аудиозаписью текстовое поле для расшифровки.

Настройте контроль качества

Блоки контроля качества позволяют отсеивать невнимательных исполнителей. Контроль качества можно настраивать как в проекте, так и в пуле.

  1. Перейдите в проект и нажмите Действия над проектомНастроить контроль качества.
  2. Добавьте блок Быстрые ответы и укажите следующие значения:

    Это означает, что если исполнитель выполнит хотя бы одну страницу заданий быстрее чем за 20 секунд, он будет заблокирован и не сможет больше выполнять ваши задания 10 дней.

  3. Добавьте блок Отложенная приемка и укажите следующие значения:

    Это означает, что если 35% и более ответов исполнителя будут отклонены, он будет заблокирован и не сможет больше выполнять ваши задания 15 дней. Правило начинает действовать после проверки 3 ответов исполнителя.

  4. Создайте навык. Для этого перейдите на страницу Навыки, нажмите кнопку + Добавить навык и укажите название навыка, например «Расшифровщик».
    Что такое навык?
    Навык — это оценка какого-либо аспекта работы исполнителя (число от 0 до 100). Навык может начисляться исполнителю за правильные ответы на контрольные задания, а также назначаться произвольно.

    Вы можете использовать значение навыка при отборе исполнителей.

  5. Добавьте блок Выполненные задания и укажите следующие значения:

    Это означает, что если исполнитель выполнил хотя бы одно задание и результат был принят, то ему устанавливается навык.

Запустите пул и получите результаты

  1. Запустите пул, нажав кнопку .
  2. Следите за выполнением в блоке Статистика пула.
  3. Как только получены первые результаты, вы можете начинать проверку. По истечении установленного срока все ответы будут автоматически приняты вне зависимости от их качества.

    Чтобы проверить задания, откройте пул и нажмите Проверить задания.

Поручите проверку исполнителям

Отдайте результаты на проверку исполнителям в качестве задания. Чтобы это задание было доступно исполнителям, которые не расшифровывали аудиозаписи, установите фильтр.

  1. Откройте пул и нажмите Скачать результаты.
  2. Создайте проект с типом классификация.
    Пример готового задания
  3. Создайте интерфейс задания, чтобы исполнитель увидел:
    • аудиозапись в аудиоплеере;
    • расшифровка записи;
    • переключатель с вариантами ответов:
      • Текст полностью соответствует аудиозаписи.
      • В тексте допущены незначительные ошибки.
      • Аудиозапись расшифрована не полностью.
      • Текст не соответствует аудиозаписи.
  4. Добавьте пул и укажите в нем Перекрытие — 3.
  5. Добавьте фильтр для отбора исполнителей без навыка:
  6. Загрузите в пул задания и запустите его.
  7. Когда пул будет полностью выполнен, запустите агрегацию результатов.
  8. Примите задания расшифровки, в которых нет ошибок. Остальные отклоните, указав причину.
  9. Отклоненные задания вы можете отдать на повторное выполнение.