Решение заданий с помощью GPT

Вы можете загрузить входные значения и промпты в модель GPT. Для этого выберите в настройках пула Решение с помощью GPT. Модель выполнит разметку данных в соответствии с предоставленной инструкцией.

Создать разметку с помощью GPT

  1. При создании пула:

    1. Нажмите Показать расширенные настройки.
    2. Включите опцию Помощь GPTРешение с помощью GPT.
  2. Выберите модель из выпадающего списка:

    • yagpt_32b — основная языковая модель;
    • yagpt_8b — более быстрая языковая модель.
  3. Опишите задачу для модели в поле Промпт.

    Промпт — это текст или запрос, который служит инструкцией или описанием задачи для модели и может содержать ключевые слова или фразы.

    Скриншот — пример промпта

    promt-example1.png

    Для оформления промпта воспользуйтесь примером. Он определяет структуру и задает требования к формату входных и выходных данных.

    Пример промпта
    Представь, что ты аналитик, который занимается классификацией текстовой информации.
    Тебе нужно определить язык в написанном предложении.
    Список языков:
    Тег "RU" — русский язык
    Тег "EN" — английский
    Тег "CH" — китайский
    
    предложение:{input_values.query}
    
    Ответ предоставь в формате json следующего вида:{{"category":"тег"}}
    
    Подробное описание примера

    Промпт состоит из 4-х частей:

    • формулировка задания:

      Представь, что ты аналитик, который занимается классификацией текстовой информации. Тебе нужно определить язык в написанном предложении
      
    • объявление/описание возможных ответов по тегам (классам), если они известны заранее:

      Список языков:
      Тег "RU" — русский язык
      Тег "EN" — английский
      Тег "CH" — китайский
      
    • спецификация входных полей — указание на расположение поля с предложением в структуре входных данных:
      предложение:{input_values.query};

    • спецификация выходных полей — указание формата выходных данных: Ответ предоставь в формате json следующего вида {{"category":"тег"}}.

    Для корректной обработки данных необходимо, чтобы входной и выходной JSON полностью соответствовали шаблону входной и выходной спецификации в настройках проекта. Если ответ модели не совпадает с требованиями выходной спецификации, он не будет принят.

  4. Для улучшения качества работы модели рекомендуется добавить примеры.

    Нажмите + Добавить пример, чтобы создать новый пример и заполните поля:

    • input_values — входные данные, которые модель будет анализировать и на основе которых она будет генерировать ответ.

      Пример заполнения
      {"query":"Приложение очень удобное"}
      
    • Класс — категория или метка, которая определяет тип или класс входных данных.

    • Ответ — ожидаемый результат, который модель должна сгенерировать на основе входных данных.

      Пример заполнения
      {"category":"RU"}
      

      Примечание

      Для одного примера можно добавить несколько вариантов ответов модели, для этого нажмите + Добавить ответ.

      Скриншот — пример заполнения

      input-example1.png

    Для загрузки TSV-файла с входными значениями нажмите на load.png. После этого поле input_values в созданном примере заполнится автоматически. Поля Класс и Ответ заполните вручную.

  5. Укажите количество заданий для разметки и время работы модели:

    • Заданий в пуле — процент заданий, которые направляются на автоматическую разметку. Например, если в поле указать значение 50, то 50% заданий будут размечены автоматически, а остальные 50% — вручную.

    • Время ожидания — максимальное время ожидания, за которое модель должна закончить разметку. После истечения этого времени пул закрывается, даже если не достигнут процент решенных заданий, указанный в поле Заданий в пуле.

      Справа от поля Время ожидания выберите единицу измерения времени для этого параметра:

      • сек. — секунды.
      • мин. — минуты.
      • час. — часы.
  6. Нажмите Создать пул.

  7. Загрузите задания и запустите разметку.

    Модель начнет размечать задания в пуле.

Примечание

Чтобы не блокировать поток разметки трудоемкими проектами, введен базовый механизм балансировки. Он позволяет обрабатывать несколько проектов параллельно.

Посмотреть статистику

Вы можете отслеживать выполнение заданий и просматривать статистику за любой период времени.

Чтобы проверить задания и скачать приложенные файлы, откройте пул и нажмите Скачать результатыСкачать вложения.

Примечание

В статистике отображаются общие данные о времени выполнения и качестве разметки как для модели, так и для исполнителя. Чтобы оценить работу только модели, установите в поле Заданий в пуле значение 100.

Подробнее см. в разделе Статистика по пулу.

У меня остались вопросы

Если у вас есть вопросы по GPT разметке, обратитесь в службу поддержки. Выберите тему GPT разметка и опишите свою проблему.

Написать в службу поддержки

Tab-separated values — текстовый формат файла, в котором данные разделены знаком табуляции, а строки — знаком перевода строки.