Решение заданий с помощью GPT
Вы можете загрузить входные значения и промпты в модель GPT. Для этого выберите в настройках пула Решение с помощью GPT. Модель выполнит разметку данных в соответствии с предоставленной инструкцией.
Создать разметку с помощью GPT
-
При создании пула:
- Нажмите Показать расширенные настройки.
- Включите опцию Помощь GPT → Решение с помощью GPT.
-
Выберите модель из выпадающего списка:
- yagpt_32b — основная языковая модель;
- yagpt_8b — более быстрая языковая модель.
-
Опишите задачу для модели в поле Промпт.
Промпт — это текст или запрос, который служит инструкцией или описанием задачи для модели и может содержать ключевые слова или фразы.
Скриншот — пример промпта
Для оформления промпта воспользуйтесь примером. Он определяет структуру и задает требования к формату входных и выходных данных.
Пример промпта
Представь, что ты аналитик, который занимается классификацией текстовой информации. Тебе нужно определить язык в написанном предложении. Список языков: Тег "RU" — русский язык Тег "EN" — английский Тег "CH" — китайский предложение:{input_values.query} Ответ предоставь в формате json следующего вида:{{"category":"тег"}}
Подробное описание примера
Промпт состоит из 4-х частей:
-
формулировка задания:
Представь, что ты аналитик, который занимается классификацией текстовой информации. Тебе нужно определить язык в написанном предложении
-
объявление/описание возможных ответов по тегам (классам), если они известны заранее:
Список языков: Тег "RU" — русский язык Тег "EN" — английский Тег "CH" — китайский
-
спецификация входных полей — указание на расположение поля с предложением в структуре входных данных:
предложение:{input_values.query}
; -
спецификация выходных полей — указание формата выходных данных:
Ответ предоставь в формате json следующего вида {{"category":"тег"}}
.
Для корректной обработки данных необходимо, чтобы входной и выходной JSON полностью соответствовали шаблону входной и выходной спецификации в настройках проекта. Если ответ модели не совпадает с требованиями выходной спецификации, он не будет принят.
-
-
Для улучшения качества работы модели рекомендуется добавить примеры.
Нажмите + Добавить пример, чтобы создать новый пример и заполните поля:
-
input_values — входные данные, которые модель будет анализировать и на основе которых она будет генерировать ответ.
Пример заполнения
{"query":"Приложение очень удобное"}
-
Класс — категория или метка, которая определяет тип или класс входных данных.
-
Ответ — ожидаемый результат, который модель должна сгенерировать на основе входных данных.
Пример заполнения
{"category":"RU"}
Примечание
Для одного примера можно добавить несколько вариантов ответов модели, для этого нажмите + Добавить ответ.
Скриншот — пример заполнения
Для загрузки TSV-файла с входными значениями нажмите на
. После этого поле input_values в созданном примере заполнится автоматически. Поля Класс и Ответ заполните вручную.
-
-
Укажите количество заданий для разметки и время работы модели:
-
Заданий в пуле — процент заданий, которые направляются на автоматическую разметку. Например, если в поле указать значение 50, то 50% заданий будут размечены автоматически, а остальные 50% — вручную.
-
Время ожидания — максимальное время ожидания, за которое модель должна закончить разметку. После истечения этого времени пул закрывается, даже если не достигнут процент решенных заданий, указанный в поле Заданий в пуле.
Справа от поля Время ожидания выберите единицу измерения времени для этого параметра:
- сек. — секунды.
- мин. — минуты.
- час. — часы.
-
-
Нажмите Создать пул.
-
Загрузите задания и запустите разметку.
Модель начнет размечать задания в пуле.
Примечание
Чтобы не блокировать поток разметки трудоемкими проектами, введен базовый механизм балансировки. Он позволяет обрабатывать несколько проектов параллельно.
Посмотреть статистику
Вы можете отслеживать выполнение заданий и просматривать статистику за любой период времени.
Чтобы проверить задания и скачать приложенные файлы, откройте пул и нажмите Скачать результаты → Скачать вложения.
Примечание
В статистике отображаются общие данные о времени выполнения и качестве разметки как для модели, так и для исполнителя. Чтобы оценить работу только модели, установите в поле Заданий в пуле значение 100.
Подробнее см. в разделе Статистика по пулу.
У меня остались вопросы
Если у вас есть вопросы по GPT разметке, обратитесь в службу поддержки. Выберите тему GPT разметка и опишите свою проблему.
Tab-separated values — текстовый формат файла, в котором данные разделены знаком табуляции, а строки — знаком перевода строки.