Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Подскажите, есть ли хорошие инструменты для автоматизированной разметки текста?

Дано: набор диалогов операторов с клиенами из чата (как есть)
Требуется: создать датасет интентов и ответов к ним для чат-бота
Идея: создать эмбединги для вопросов пользователей, кластеризовать, вручную почистить содержимое кластеров и, если нужно, подкорректировать количество кластеров так, чтобы каждый кластер представлял один единственный интент.
Проблема: делать все руками не хочется, хочется найти готовый инструмент, а руками только провести чистку содержимого кластеров и их разметку.
Возможно есть какие-то готовые инструменты с подобным функционалом?
Data scienceМашинное обучение+3
  · 1,0 K
кандидат физико-математических наук, математик, исследователь, data scientist, предпринима...  · 11 сент 2021  · novikovlabs.ru
Лучше всего предусмотреть какую-то разметку уже при сборе данных.
Если же речь идёт о рубрицировании - попробуйте латентное размещение Дирихле и иерархический процесс Дирихле.