Дано: набор диалогов операторов с клиенами из чата (как есть)
Требуется: создать датасет интентов и ответов к ним для чат-бота
Идея: создать эмбединги для вопросов пользователей, кластеризовать, вручную почистить содержимое кластеров и, если нужно, подкорректировать количество кластеров так, чтобы каждый кластер представлял один единственный интент.
Проблема: делать все руками не хочется, хочется найти готовый инструмент, а руками только провести чистку содержимого кластеров и их разметку.
Возможно есть какие-то готовые инструменты с подобным функционалом?