Превратить аудио в текст (расшифровка аудио)

Вы можете публиковать задания для расшифровки небольших аудиозаписей. Желательно, чтобы в одном пуле записи были одинаковой длины. Задания на расшифровку удобнее запускать для выполнения в веб-версии Яндекс.Толоки, чтобы исполнитель мог набирать текст на клавиатуре.

Возможно, для вашего задания нужны дополнительные проекты, например предварительная проверка датасета или проверка ответов исполнителей. Подробнее об этом читайте в разделе Декомпозиция задания.

Предположим, вам нужно расшифровать стихи с детского утренника. Для этого создадим такое задание: исполнителю будет предложена аудиозапись во встроенном плеере, и он должен набрать текст, который услышит на записи.

Пример готового задания

Чтобы запустить задания и получить ответы:

Создайте проект

Проект определяет, как будет выглядеть задание у исполнителя.

  1. Нажмите кнопку + Создать проект и выберите шаблон Транскрипция аудио.

  2. Дайте проекту понятное название и краткое описание. Их увидят исполнители в списке доступных заданий.

  3. Напишите краткую и ясную инструкцию (см. советы).

  4. Определите, какие объекты будете передавать исполнителю и получать от него в ответ. Для этого необходимо создать поля входных и выходных данных в блоке Спецификации.
    Что такое входные и выходные данные?

    Входные данные — типы объектов, которые будут подаваться исполнителю для выполнения задания. Например, текст, картинка, географические координаты.

    Выходные данные — типы объектов, которые будут получены после выполнения задания. Например, один из нескольких вариантов ответа, введенный текст или загруженный файл.

    Подробнее о полях входных и выходных данных.

    Шаблон включает в себя поля:

    • Поле входных данных — ссылка audio на аудиофайл.

      Измените тип данных на строку, чтобы загружать аудиофайлы, хранящиеся на Яндекс.Диске.

    • Поле выходных данных — строка output, в которую будет записан текст, введенный исполнителем.
  5. Создайте интерфейс задания в блоке HTML. Он описывает, как будут расположены элементы задания.

    В HTML-интерфейсе можно использовать стандартные теги HTML и специальные выражения в двойных фигурных скобках для полей входных и выходных данных.

    <div>
      <audio src="{{proxy audio}}" controls controlsList="nodownload">
        Невозможно воспроизвести
      </audio><br/><br/>
    </div>
    <div>
      <div>Текст стихотворения</div>
      {{field type="textarea" name="output" width="300px" rows="6"}}
    </div>
    Эта запись означает, что задание будет выглядеть так:
    • аудиозапись в плеере;
    • поле для ввода текста.

    Очистите блок CSS.

    Блок JavaScript оставьте без изменений. В нем настроена проверка воспроизведения записи в плеере. Исполнитель не сможет отправить задание без прослушивания всех аудиозаписей в нем.

  6. Нажмите кнопку Предпросмотр, чтобы увидеть получившееся задание.
    Примечание. В предварительном просмотре проекта отображается одно задание со стандартными данными. Количество заданий на странице вы сможете настроить далее.
  7. Сохраните изменения. Чтобы выйти на страницу Проекты, нажмите Завершить редактирование.

Добавьте пул заданий

Пул — это набор оплачиваемых заданий, которые одновременно выдаются исполнителям.

  1. Откройте проект и нажмите Добавить пул.
  2. Дайте пулу любое удобное название и описание. Они доступны только вам, исполнитель будет видеть только название и описание проекта.
  3. Установите цену за страницу заданий, например, $0.05. Цена зависит от длительности аудиозаписи.
    Что такое страница заданий?

    На одной странице может отображаться одно или несколько заданий. Если задания простые, то можно добавлять 10–20 заданий на одну страницу. Не рекомендуем создавать длинные страницы, поскольку это снизит скорость загрузки данных у исполнителя.

    Исполнитель получит оплату, только если выполнил все задания на странице.

    Количество заданий на странице вы определите при загрузке заданий.

    Как определить справедливую цену?

    Общее правило формирования цены — чем больше времени исполнитель тратит на выполнение, тем выше цена.

    Вы можете зарегистрироваться в Яндекс.Толоке как исполнитель и узнать, сколько платят другие заказчики за задания.

  4. Добавьте Фильтры для отбора исполнителей. Чтобы ваше задание было доступно только исполнителям, владеющим русским языком, выберите набор Русскоязычные исполнители.
  5. Включите опцию Отложенная приемка и укажите количество дней на проверку для параметра Срок проверки. Например, 7.
    Что такое отложенная приемка?

    Отложенная приемка позволяет вам просматривать выполненные задания перед тем, как принять их и заплатить исполнителю. Задания, выполненные в несоответствии с инструкцией, можно отклонять. Максимальный срок проверки устанавливается в поле Срок проверки.

  6. Установите Перекрытие — количество исполнителей, которые должны выполнить задание. Для расшифровки речи, как правило, 1.
  7. Укажите Время на выполнение страницы заданий. Его должно быть достаточно, в том числе для чтения инструкции, загрузки задания, прослушивания аудиозаписи и набора текста. Например, 1200 секунд.
  8. Сохраните пул.

Загрузите задания

  1. Скачайте Пример загрузочного файла (tsv) в пуле.
    Что такое TSV?
    TSV-файл — это представление электронной таблицы в виде текстового файла, в котором столбцы разделены знаком табуляции.
    Вы можете работать с ним как в редакторе электронных таблиц, так и в текстовом редакторе, а затем сохранить в нужный формат. Подробнее о работе с TSV-файлом.
    Примечание. Перед загрузкой файла убедитесь, что он сохранен в кодировке UTF-8.
  2. Добавьте в него входные данные — ссылки на файлы на Яндекс.Диске в формате <уникальное имя>/image1.jpg, где уникальное имя — название вашего прокси (подробности). Заголовок столбца с входными данными содержит слово INPUT.

    Ссылка должна иметь такой вид: <уникальное имя>/audio1.jpg. Уникальное имя — это название вашего прокси. Подробнее об использовании файлов с Яндекс.Диска.

  3. Загрузите задания, выбрав Указать вручную и установив, например, 4 задания на странице. Это значит, что на одной странице будет 4 аудиозаписи, под каждой аудиозаписью текстовое поле для расшифровки.
  4. Нажмите кнопку Добавить — ваши задания загружены в пул.

Настройте контроль качества

Блоки контроля качества позволяют отсеивать невнимательных исполнителей. Контроль качества можно настраивать как в проекте, так и в пуле.

Внимание.

Настройки контроля качества в проекте будут действовать во всех пулах проекта, и изменить их настройку в одном из пулов будет невозможно.

    Перейдите к редактированию пула (кнопка Редактировать в верхнем правом углу страницы) и нажмите Добавить блок контроля качества.

    Вы можете скопировать настройки контроля качества из другого пула. Для этого в разделе Исполнители нажмите кнопку Скопировать настройки из....

  1. Добавьте блок Быстрые ответы и укажите следующие значения:

    Это означает, что если исполнитель выполнит хотя бы одну страницу заданий быстрее чем за 20 секунд, он будет заблокирован и не сможет больше выполнять ваши задания 10 дней.

  2. Добавьте правило контроля качества Результаты проверки и укажите следующие значения:

    Это означает, что если 35% и более ответов исполнителя будут отклонены, он будет заблокирован и не сможет больше выполнять ваши задания 15 дней. Правило начинает действовать после проверки 3 ответов исполнителя.

  3. Создайте навык. Для этого перейдите на страницу Навыки, нажмите кнопку +Добавить навык и укажите название навыка, например «Расшифровщик».
    Что такое навык?
    Навык — это оценка какого-либо аспекта работы исполнителя (число от 0 до 100). Навык может начисляться исполнителю за правильные ответы на контрольные задания, а также назначаться произвольно.

    Вы можете использовать значение навыка при отборе исполнителей.

  4. Добавьте блок Выполненные задания и укажите следующие значения:

    Это означает, что если исполнитель выполнил хотя бы одно задание и результат был принят, то ему устанавливается навык.

Запустите пул и получите результаты

  1. Запустите пул, нажав кнопку .
  2. Следите за выполнением в блоке Статистика пула.
  3. Как только получены первые результаты, вы можете начинать проверку. По истечении установленного срока все ответы будут автоматически приняты вне зависимости от их качества.

    Чтобы проверить задания, откройте пул и нажмите Проверить задания.

Поручите проверку исполнителям

Отдайте результаты на проверку исполнителям в качестве задания. Чтобы это задание было доступно исполнителям, которые не расшифровывали аудиозаписи, установите фильтр.

  1. Откройте пул и нажмите Скачать результаты.
  2. Создайте проект с типом классификация.
    Пример готового задания
  3. Создайте интерфейс задания, чтобы исполнитель увидел:
    • аудиозапись в аудиоплеере;
    • расшифровка записи;
    • переключатель с вариантами ответов:
      • Текст полностью соответствует аудиозаписи.
      • В тексте допущены незначительные ошибки.
      • Аудиозапись расшифрована не полностью.
      • Текст не соответствует аудиозаписи.
  4. Добавьте пул и укажите в нем Перекрытие — 3.
  5. Добавьте фильтр для отбора исполнителей без навыка:
  6. Загрузите в пул задания и запустите его.
  7. Когда пул будет полностью выполнен, запустите агрегацию результатов.
  8. Примите задания расшифровки, в которых нет ошибок. Остальные отклоните, указав причину.
  9. Отклоненные задания вы можете отдать на повторное выполнение.