Проект 2. Найти похожий объект в интернет-магазине

Напишите нам, если не нашли ответ в Справке. Вы можете приложить скриншоты или видео, чтобы ускорить помощь:

Написать в чат  Написать в Telegram

Примечание

Описание этого проекта является частью примера декомпозиции Поиск фотографий товаров (пример с декомпозицией).

В этом проекте исполнители будут искать в интернет-магазине обувь, похожую на заданную. В качестве исходных изображений используйте результаты из первого проекта.

Перед началом

Создайте проект

Мы рекомендуем использовать пресет проекта, чтобы упростить настройку и получить хорошие результаты.

  1. Нажмите Создать проект на странице Проекты.

    Скриншот

  2. Выберите пресет Поиск фотографий товаров в разделе Обогащение данных.

  3. Нажмите Использовать решение.

  4. В разделе Общая информация заполните поля:

    • Название для исполнителей — название, которое будет отображаться в списке заданий для исполнителей. Например, вы можете указать такое название: Найти такую же или похожую обувь в интернет-магазине.

    • Описание для исполнителей — краткое описание, которое будет отображаться в списке заданий для исполнителей. Например, вы можете указать такое описание: Зайдите в интернет-магазин и найдите такую же или похожую пару обуви.

    Скриншот

  5. В разделе Интерфейс задания настройте внешний вид задания.

    Примечание

    В этом туториале для создания интерфейса задания используется конструктор шаблонов, но вы можете использовать редактор HTML/JS/CSS для той же цели.

    Воспользуйтесь готовым кодом для этого проекта, где уже настроена валидация и внешний вид задания.

    Исполнитель не сможет отправить задание, если:

    • не перейдет по кнопке в интернет-магазин;
    • не добавит ссылку на найденный товар;
    • не загрузит изображение товара.

    Подробнее о настройке интерфейса читайте в Справке конструктора шаблонов.

  6. Чтобы определить, какие данные вы будете передавать исполнителю и получать в ответ, необходимо создать поля входных и выходных данных.

    Чтобы увидеть поля входных и выходных данных, нажмите Показать спецификации.

    Входные и выходные данные соответствуют интерфейсу задачи, настроенному в конструкторе шаблонов. Убедитесь, что все входные и выходные поля настроены правильно.

    Подробнее читайте в разделе Создание спецификации.

    В этом проекте:

    • Поле входных данных: image — ссылка для загрузки картинки.

    • Поля выходных данных:

      • found_link — для ссылки на товар, найденный исполнителем в интернет-магазине;
      • found_image — для загрузки изображения этого товара.

    Входные данные
    {
      "image": {
        "type": "url",
        "hidden": false,
        "required": true
      }
    }
    
    Выходные данные

    Примечание

    Если вы хотите выбрать другой интернет-магазин, измените строку с "pattern": "https://www.asos.com/.*" на "pattern": "your_store.*".

    {
      "button": {
        "type": "boolean",
        "hidden": false,
        "required": true,
        "allowed_values": [
          true
        ]
      },
      "found_link": {
        "type": "string",
        "hidden": false,
        "pattern": "https://www.asos.com/.*",
        "required": true
      },
      "found_image": {
        "type": "file",
        "hidden": false,
        "required": true
      }
    }
    
  7. В редакторе Инструкция для исполнителей введите инструкцию, которую увидят исполнители, когда начнут выполнять ваше задание. Вы можете добавлять в инструкцию текст, таблицы и изображения.

    Вы можете подготовить инструкцию в формате HTML и вставить ее в редактор. Чтобы переключиться в режим HTML, нажмите <>.

    Совет

    При написании инструкции помните, что исполнители заранее ничего не знают о ваших заданиях. Убедитесь, что инструкция понятна, но не слишком многословна.

  8. Нажмите кнопку Сохранить справа вверху.

Подробнее о настройке проекта читайте в разделе Создание проекта.

Добавьте пул заданий

Пул — это набор оплачиваемых заданий, которые одновременно выдаются исполнителям.

  1. Нажмите Создать новый пул на странице проекта.

    Скриншот

  2. Заполните поле Название пула. Название пула будет видно только вам на странице проекта.

  3. При необходимости отключите опцию Использовать описание проекта и заполните поле Публичное описание. В этом случае в списке заданий для исполнителей будет отображаться описание пула вместо описания проекта.

    1. Нажмите + Приватный комментарий, чтобы добавить описание, которое будет видно только вам на странице проекта.

  4. В блоке Аудитория добавьте фильтры для отбора исполнителей:

    1. Чтобы ваше задание было доступно только исполнителям, владеющим русским языком, установите язык и страну по номеру телефона.

      Скриншот

    2. Задания в пулах по умолчанию будут доступны для веб-версии Яндекс Заданий и мобильного приложения. Если вы хотите изменить настройки по умолчанию и ограничить видимость задачи для любой из версий, добавьте фильтр Клиент и выберите нужное значение: Веб-версия Яндекс Заданий или Мобильные Яндекс Задания.

    3. Отключите опцию В моих заданиях может содержаться шокирующий или порнографический контент, если ваш пул их не содержит.

    4. С помощью настройки Соотношение скорости и качества вы можете установить количество исполнителей, которые увидят ваши задания. Переместите ползунок вправо, чтобы заблокировать доступ к заданиям для исполнителей с недостаточно высоким рейтингом.

  5. В блоке Цена установите цену за страницу заданий и перекрытие.

    1. В поле Цена за страницу заданий, ₽ установите цену за страницу заданий.

      Обратите внимание на индикатор Интерес исполнителей к цене. Он показывает, насколько цена за страницу заданий соответствует ожиданиям исполнителей. Если интерес невелик, вы можете повысить цену, чтобы привлечь больше исполнителей. Если интерес высокий, вы можете снизить цену, чтобы сэкономить деньги.

      Как определить справедливую цену

      Общее правило формирования цены — чем больше времени исполнитель тратит на выполнение, тем выше цена.

      Вы можете зарегистрироваться в Яндекс Заданиях как исполнитель и узнать, сколько платят другие заказчики за задания.

      Вы также можете настроить динамическое ценообразование.

    2. Задайте перекрытие в поле Перекрытие. Для этого проекта достаточно перекрытия, равного 3.

      Вы также можете настроить динамическое перекрытие.

  6. Включите опцию Отложенная приемка заданий и укажите количество дней на проверку в поле Срок проверки в днях.

    Что такое отложенная приемка?

    Отложенная приемка позволяет вам просматривать выполненные страницы заданий перед тем, как принять их и заплатить исполнителю. Задания, выполненные в несоответствии с инструкцией, можно отклонять. Максимальный срок проверки устанавливается в поле Срок проверки.

  7. Нажмите Показать расширенные настройки и укажите Время на страницу заданий, с в разделе Дополнительные настройки.

    Указанного времени должно быть достаточно, в том числе для чтения инструкции и загрузки задания. Например, 600 секунд.

  8. Нажмите кнопку Создать пул.

Настройте контроль качества

  1. Нажмите Добавить правило контроля качества.

  2. Найдите в списке блок Правила и выберите пункт Обработка отклоненных и принятых заданий.

  3. Задайте правило для отклоненного задания: если задание становится отклоненным, то увеличить перекрытие на 1. А также включите опцию Открыть пул, если закрыт:

    Если по результатам отложенной приемки ответ исполнителя отклонен, то задание будет отправлено на повторное выполнение другому исполнителю.

Загрузите задания

  1. Откройте в редакторе текста или электронных таблиц файл, полученный после агрегации результатов в первом проекте.

  2. Выберите строки со значением OK в поле OUTPUT:result. Эти строки соответствуют фотографиям, на которых есть обувь.

  3. Скопируйте столбец с выделенными ссылками на новый лист или в новый документ.

  4. Задайте имя столбца INPUT:image. Если вы хотите задать другое имя, переименуйте столбец и в исходном файле с результатами.

  5. Сохраните файл.

  6. Нажмите кнопку Загрузить данные на странице пула.

  7. Прикрепите файл с заданиями.

  8. Нажмите кнопку Продолжить.

  9. Выберите способ распределения заданий по страницам Указать вручную и укажите 1 в поле Заданий на странице.

  10. Нажмите кнопку Разделить задания на страницы.

  11. Нажмите кнопку Предпросмотр, чтобы убедиться, что ваши задания отображаются правильно.

Запустите пул

  1. Убедитесь, что вы пополнили свой счет.

  2. Нажмите кнопку Запустить разметку. Пул станет доступным для исполнителей.

  3. Отслеживайте статистику на страницах пула и проекта по мере выполнения заданий.

Что дальше

  • Создайте Проект 3 для сравнения исходного изображение с результатами из второго проекта.

Решение проблем

Ошибки при загрузке заданий в пул
Как посмотреть лог обработки

Чтобы посмотреть лог обработки, нажмите Подробнее об ошибках загрузки. Лог обработки записан в формате JSON. Объекты внутри result соответствуют номеру строки загружаемого файла. Строки, обработанные с ошибкой, имеют статус "success": false.

Совет

Работать с большим логом удобнее, если скопировать его в текстовый редактор.

Ошибки в заголовках столбцов

Если заголовки столбцов некорректны, файл будет полностью отклонен. В остальных случаях указано количество заданий с ошибками обработки.

Таблица ошибок обработки

"parsing_error_of": "https://tlk.s3.yandex.net/wsdm2020/photos/2d5f63a3184919ce7e3e7068cf93da4b.jpg\t\t", "exception_msg": "the nameMapping array and the sourceList should be the same size (nameMapping length = 1, sourceList size = 3)"

Описание

Как исправить

Лишние знаки табуляции. Если в загружаемом файле после данных или ссылки стоит количество разделителей столбцов \t больше, чем задано число столбцов во входных данных, то появится сообщение об ошибке.

Например, когда во входных определен 1 столбец, а в файле после ссылки прописано еще два знака табуляции \t\t, то получится 3 столбца, 2 из которых лишние.

Удалите лишние разделители столбцов, в приведенном выше примере ошибки — оба знака (\t\t).

"exception_msg": "the nameMapping array and the sourceList should be the same size (nameMapping length = 4, sourceList size = 6)"

Описание

Как исправить

Не совпадает количество полей в заголовке и в строке.

Проверьте, что:

  • указано верное количество знаков табуляции в структуре файла;
  • строковые значения, содержащие знак табуляции, заключены в кавычки" ".
"code": "VALUE_REQUIRED", "message": "Value must be present and not equal to null"

Описание

Как исправить

Не указано значение обязательного поля входных данных.

Проверьте, что заполнены все столбцы с обязательными полями входных данных.

"code": "INVALID_URL_SYNTAX", "message": "Value must be in valid url format"

Описание

Как исправить

Данные в поле с типом «ссылка» («url») некорректны.

Проверьте, что все ссылки начинаются с префикса http://, https:// или www.

"exception_msg": "unexpected end of file while reading quoted column beginning on line 2 and ending on line 4"

Описание

Как исправить

В строке стоит непарная кавычка.

Проверьте, что все кавычки экранированы.

Как определить время на выполнение задания?

Попробуйте выполнить задания сами, попросите своих друзей и коллег. Найдите среднее время выполнения и добавьте к нему 50%.

Написать в службу поддержки

Определенная цель для разметки. Например, модерация комментариев, классификация изображений, транскрипция аудиозаписей или еще что-то.

Подробнее

Преднастроенный проект, содержащий описание, инструкцию, предопределенные поля входных и выходных данных и интерфейс задания, которые можно редактировать.

Инструкция к заданию, которую видит исполнитель при выборе и выполнении задания. От четкости и полноты инструкции зависит качество ответов, которые вы получите, и рейтинг проекта. Хорошая инструкция поможет исполнителям правильно выполнить задание.

Формат входных и выходных данных, описываемых в поле Спецификации блока Интерфейс задания при настройке проекта.

Подробнее

Набор данных, которые нужно разметить в проекте. Можно использовать настройки пула для выбора исполнителей, установки цены за задание и добавления правил контроля качества. Задания в пуле объединены общими свойствами (например, настройки отбора исполнителей, плата за страницу заданий) и отправляются на выполнение единовременно.

Правило контроля качества, которое ограничивает количество страниц заданий, которые может выполнить один исполнитель (с учетом перекрытия). Это позволяет выбрать большее количество исполнителей.

Файл, содержащий данные, которые нужно разметить. Заказчики используют эти файлы для загрузки заданий. В Яндекс Заданиях поддерживаются файлы в формате TSV.

Добавление правильных ответов и подсказок в задания, а также изменение типов заданий.

Подробнее

Группа из нескольких заданий, ответы на которые должен отправить исполнитель за один раз.

Подробнее

Разделение одного крупного проекта на несколько небольших. После декомпозиции задания становятся проще и выполняются быстрее, а качество ответов возрастает. Подробнее

Вопрос или задача, которое требует ответа от исполнителя в Яндекс Заданиях.

Подробнее

Человек, выполняющий задания в Яндекс Заданиях и получающий за это оплату. Все вместе исполнители обычно называются «крауд» (коллектив, толпа).

Количество исполнителей, которые должны выполнить каждое задание пула. Перекрытие используется для того, чтобы убедиться, что результатам можно доверять.

Внешний вид задания для исполнителя и логика обработки ответов. Чаще всего настраивается с помощью конструктора шаблонов.