Сначала запустите проект в песочнице. Так вы сможете избежать ошибок и потраченных средств, если окажется, что ваше задание не работает.
В этом туториале вы узнаете, как создать проект для расшифровки аудиозаписей в Яндекс Заданиях. Мы будем использовать пресет, разработанный специально для этого типа проектов.
Транскрипция аудио — это тип задач для разметки медиафайлов. Исполнители слушают аудиозапись и вводят текст, который они слышат. Аудиозаписи и текстовые расшифровки можно использовать для обучения моделей распознавания речи.
Пример
Предположим, вам нужно расшифровать аудиозапись. Создадим задание, в котором исполнителю нужно прослушать аудиозапись и ввести текст, который он услышит.
Пополните свой счет на странице Профиль. Если вы не уверены в том, какой бюджет потребуется, вы можете рассчитать это позже в процессе работы над проектом.
Создайте проект
Мы рекомендуем использовать пресет проекта, чтобы упростить настройку и получить хорошие результаты.
Нажмите Создать проект на странице Проекты.
Скриншот
Выберите пресет Расшифровка аудиозаписей.
Нажмите Использовать решение.
В разделе Общая информация заполните поля:
Название для исполнителей — название, которое будет отображаться в списке заданий для исполнителей.
Описание для исполнителей — краткое описание, которое будет отображаться в списке заданий для исполнителей.
Скриншот
В разделе Интерфейс задания настройте внешний вид задания.
Примечание
В этом туториале для создания интерфейса задания используется конструктор шаблонов, но вы можете использовать редактор HTML/JS/CSS для той же цели.
Для этого проекта воспользуйтесь готовым шаблоном, где уже настроена валидация, горячие клавиши и внешний вид задания. Исполнитель не сможет отправить задание, если не выберет варианта ответа.
Чтобы определить, какие данные вы будете передавать исполнителю и получать в ответ, необходимо создать поля входных и выходных данных.
Чтобы увидеть поля входных и выходных данных, нажмите Показать спецификации.
Входные и выходные данные соответствуют интерфейсу задачи, настроенному в конструкторе шаблонов. Убедитесь, что все входные и выходные поля настроены правильно.
В редакторе Инструкция для исполнителей введите инструкцию, которую увидят исполнители, когда начнут выполнять ваше задание. Вы можете добавлять в инструкцию текст, таблицы и изображения.
Вы можете подготовить инструкцию в формате HTML и вставить ее в редактор. Чтобы переключиться в режим HTML, нажмите <>.
Совет
При написании инструкции помните, что исполнители заранее ничего не знают о ваших заданиях. Убедитесь, что инструкция понятна, но не слишком многословна.
Нажмите кнопку Сохранить справа вверху.
Подробнее о настройке проекта читайте в разделе Создание проекта.
Добавьте пул заданий
Пул — это набор оплачиваемых заданий, которые одновременно выдаются исполнителям.
Нажмите Создать новый пул на странице проекта.
Скриншот
Заполните поле Название пула. Название пула будет видно только вам на странице проекта.
При необходимости отключите опцию Использовать описание проекта и заполните поле Публичное описание. В этом случае в списке заданий для исполнителей будет отображаться описание пула вместо описания проекта.
Нажмите + Приватный комментарий, чтобы добавить описание, которое будет видно только вам на странице проекта.
В блоке Аудитория добавьте фильтры для отбора исполнителей:
Чтобы ваше задание было доступно только исполнителям, владеющим русским языком, установите язык и страну по номеру телефона.
Скриншот
Задания в пулах по умолчанию будут доступны для веб-версии Яндекс Заданий и мобильного приложения. Если вы хотите изменить настройки по умолчанию и ограничить видимость задачи для любой из версий, добавьте фильтр Клиент и выберите нужное значение: Веб-версия Яндекс Заданий или Мобильные Яндекс Задания.
Отключите опцию В моих заданиях может содержаться шокирующий или порнографический контент, если ваш пул их не содержит.
С помощью настройки Соотношение скорости и качества вы можете установить количество исполнителей, которые увидят ваши задания. Переместите ползунок вправо, чтобы заблокировать доступ к заданиям для исполнителей с недостаточно высоким рейтингом.
В блоке Цена установите цену за страницу заданий и перекрытие.
В поле Цена за страницу заданий, ₽ установите цену за страницу заданий.
Обратите внимание на индикатор Интерес исполнителей к цене. Он показывает, насколько цена за страницу заданий соответствует ожиданиям исполнителей. Если интерес невелик, вы можете повысить цену, чтобы привлечь больше исполнителей. Если интерес высокий, вы можете снизить цену, чтобы сэкономить деньги.
Как определить справедливую цену
Общее правило формирования цены — чем больше времени исполнитель тратит на выполнение, тем выше цена.
Вы можете зарегистрироваться в Яндекс Заданиях как исполнитель и узнать, сколько платят другие заказчики за задания.
Включите опцию Отложенная приемка заданий и укажите количество дней на проверку в поле Срок проверки в днях.
Что такое отложенная приемка?
Отложенная приемка позволяет вам просматривать выполненные страницы заданий перед тем, как принять их и заплатить исполнителю. Задания, выполненные в несоответствии с инструкцией, можно отклонять. Максимальный срок проверки устанавливается в поле Срок проверки.
Нажмите Показать расширенные настройки и укажите Время на страницу заданий, с в разделе Дополнительные настройки.
Указанного времени должно быть достаточно, в том числе для чтения инструкции и загрузки задания. Например, 600 секунд.
Нажмите кнопку Создать пул.
Настройте контроль качества
Блоки контроля качества позволяют отсеивать невнимательных исполнителей. Контроль качества можно настраивать как в проекте, так и в пуле.
Внимание
Настройки контроля качества в проекте будут действовать во всех пулах проекта, и изменить их настройку в одном из пулов будет невозможно.
Пул
Проект
Перейдите к редактированию пула (кнопка в верхнем правом углу страницы) и в блоке Контроль качества нажмите Добавить правило контроля качества.
Вы можете скопировать настройки контроля качества из другого пула. Для этого в разделе Аудитория нажмите Скопировать настройки другого пула.
Откройте страницу проекта, перейдите на вкладку Контроль качества и нажмите кнопку Настроить контроль качества. Далее нажмите + Добавить блок контроля качества.
Правила будут действовать во всех пулах проекта, и изменить их настройку в одном из пулов будет невозможно.
Значение параметра Минимальное время на страницу зависит от двух характеристик: количества заданий на этой странице и длины записей. В примере мы задаем 4 задания, а длина записей неизвестна. Прикидываем адекватный порог для правила.
Делаем скидку на технические ошибки, например, не загрузилось и не проигралось несколько записей. Исполнитель быстро отправит ответы к такому заданию и это не будет ошибкой. Давайте добавим два правила:
Одно — чтобы блокировать ботов. Задаем 10–15 секунд на ответ. Блокируем после 2-х быстрых ответов.
Скриншот
Это означает, что если исполнитель выполнит 2 и более страницы с заданиями быстрее, чем за 10 секунд, он будет заблокирован и не сможет больше выполнять ваши задания 10 дней.
Со вторым правилом будем исключать тех, кто несерьезно относится к заданию, невнимательно перепечатывает текст, допускает ошибки или пропускает слова. Параметр Минимальное время на страницу заданий тут зависит от длины записей и от того, сколько их на странице, а также от того, насколько сложно записать текст (плохо слышно, есть термины, особенности записи транскрипции и т.п.). Блокируем, как минимум, после 3-х быстрых ответов.
Скриншот
Это означает, что если исполнитель даст минимум 3 ответа быстрее, чем за 30 секунд, он будет заблокирован и не сможет больше выполнять ваши задания 5 дней.
Добавьте правило Результаты проверки и заполните его параметры.
Скриншот
Если более 50% ответов исполнителя будут отклонены, он будет заблокирован и не сможет выполнять ваши задания в течение 15 дней.
Если по результатам отложенной приемки ответ исполнителя отклонен, то задание будет отправлено на повторное выполнение другому исполнителю.
Создайте навык. Это пригодится в том случае, если вы будете создавать отдельный проект для проверки ответов другими исполнителями. Перейдите на страницу Навыки, нажмите кнопку + Добавить навык и укажите название навыка, например «Расшифровщик».
Что такое навык?
Навык — это оценка какого-либо аспекта работы исполнителя (число от 0 до 100). Навык может начисляться исполнителю за правильные ответы на контрольные задания, а также назначаться произвольно.
Вы можете использовать значение навыка при отборе исполнителей.
Добавьте правило Выполненные задания и заполните его параметры.
Скриншот
Это означает, что если исполнитель выполнил хотя бы одно задание, то ему устанавливается навык.
Загрузите задания
Скачайте пример загрузочного файла. Его можно найти на странице пула. На его основе подготовьте собственный файл с заданиями .
Нажмите кнопку Загрузить. В открывшемся окне вы можете скачать шаблон файла с заданиями.
Добавьте в файл входные данные. Заголовок столбца с входными данными содержит слово INPUT. В качестве значений укажите URL-ссылки на свои файлы. Подробнее об использовании своих файлов см. в разделе Где разместить файлы.
Выберите способ распределения заданий по страницам Указать вручную и укажите количество заданий на странице (например, 1).
Нажмите кнопку Разделить задания на страницы.
Нажмите кнопку Предпросмотр, чтобы убедиться, что ваши задания отображаются правильно.
Используйте контрольные задания, чтобы повысить качество выполнения заданий исполнителями.
Совет
Для больших пулов (более 1000 задач) мы рекомендуем добавлять в пул не менее 1% от общего числа заданий, то есть на 1000 заданий нужно добавить минимум 10 контрольных. Для небольших пулов (около 100 задач) вам нужно контролировать 10% задач.
Примите задания расшифровки, в которых нет ошибок. Остальные отклоните, указав причину.
Решение проблем
Ошибки при загрузке заданий в пул
Как посмотреть лог обработки
Чтобы посмотреть лог обработки, нажмите Подробнее об ошибках загрузки. Лог обработки записан в формате JSON. Объекты внутри result соответствуют номеру строки загружаемого файла. Строки, обработанные с ошибкой, имеют статус "success": false.
Совет
Работать с большим логом удобнее, если скопировать его в текстовый редактор.
Ошибки в заголовках столбцов
Если заголовки столбцов некорректны, файл будет полностью отклонен. В остальных случаях указано количество заданий с ошибками обработки.
Таблица ошибок обработки
"parsing_error_of":"https://tlk.s3.yandex.net/wsdm2020/photos/2d5f63a3184919ce7e3e7068cf93da4b.jpg\t\t","exception_msg":"the nameMapping array and the sourceList should be the same size (nameMapping length = 1, sourceList size = 3)"
Описание
Как исправить
Лишние знаки табуляции.
Если в загружаемом файле после данных или ссылки стоит количество разделителей столбцов \t больше, чем задано число столбцов во входных данных, то появится сообщение об ошибке.
Например, когда во входных определен 1 столбец, а в файле после ссылки прописано еще два знака табуляции \t\t, то получится 3 столбца, 2 из которых лишние.
Удалите лишние разделители столбцов, в приведенном выше примере ошибки — оба знака (\t\t).
"exception_msg":"the nameMapping array and the sourceList should be the same size (nameMapping length = 4, sourceList size = 6)"
Описание
Как исправить
Не совпадает количество полей в заголовке и в строке.
Проверьте, что:
указано верное количество знаков табуляции в структуре файла;
строковые значения, содержащие знак табуляции, заключены в кавычки" ".
"code":"VALUE_REQUIRED","message":"Value must be present and not equal to null"
Описание
Как исправить
Не указано значение обязательного поля входных данных.
Проверьте, что заполнены все столбцы с обязательными полями входных данных.
"code":"INVALID_URL_SYNTAX","message":"Value must be in valid url format"
Описание
Как исправить
Данные в поле с типом «ссылка» («url») некорректны.
Проверьте, что все ссылки начинаются с префикса http://, https:// или www.
"exception_msg":"unexpected end of file while reading quoted column beginning on line 2 and ending on line 4"
Количество заданий зависит от сложности и длительности выполнения. Не делайте страницы заданий слишком большими: они неудобны для исполнителей (например, при сбоях в соединении с интернетом) и не пользуются спросом.
Как определить время на выполнение задания?
Попробуйте выполнить задания сами, попросите своих друзей и коллег. Найдите среднее время выполнения и добавьте к нему 50%.
Инструкция к заданию, которую видит исполнитель при выборе и выполнении задания. От четкости и полноты инструкции зависит качество ответов, которые вы получите, и рейтинг проекта. Хорошая инструкция поможет исполнителям правильно выполнить задание.
Файл, содержащий данные, которые нужно разметить. Заказчики используют эти файлы для загрузки заданий. В Яндекс Заданиях поддерживаются файлы в формате TSV.
Группа из нескольких заданий, ответы на которые должен отправить исполнитель за один раз.
Tab-separated values — текстовый формат файла, в котором данные разделены знаком табуляции, а строки — знаком перевода строки.
Человек, выполняющий задания в Яндекс Заданиях и получающий за это оплату. Все вместе исполнители обычно называются «крауд» (коллектив, толпа).
Количество исполнителей, которые должны выполнить каждое задание пула. Перекрытие используется для того, чтобы убедиться, что результатам можно доверять.
Определенная цель для разметки. Например, модерация комментариев, классификация изображений, транскрипция аудиозаписей или еще что-то.
Внешний вид задания для исполнителя и логика обработки ответов. Чаще всего настраивается с помощью конструктора шаблонов.
Правило контроля качества, которое ограничивает количество страниц заданий, которые может выполнить один исполнитель (с учетом перекрытия). Это позволяет выбрать большее количество исполнителей.