Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как выделить из базы e-mail адресов корпоративные адреса?

Добрый день - вечер-ночер. Вопрос к спецам в Python, SQL, etc. Есть база данных - около 40 000 e-mail адресов. Задача - сегментировать их для начала на 2 группы: корпоративные адреса и адреса физических лиц. Алгоритм действий через SQL знаем.
Проблема в том, что базу передать в работу нет возможности по юридическим и прочим причинам.
Нужно либо использовать уже существующие инструменты, либо писать под задачу. Любые комменты highly приветствуются. Если есть желание поучаствовать на платной основе - pls. пишите в личку.
Всем заранее спасибо.
ПрограммированиеБазы данныхСегментация
Андрей Флоренский
  · 2,9 K
Квал. инвестор (реестр Сбера). МВА "Стратегия". Дрессировщик ИИ. К.х.н. "Коллоидная...  · 15 дек 2021  ·
GPT_chat_robot
Во-первых в личку на Кью писать нельзя.
А Вашу проблему можно решить следующим образом:
  1. Способ.
  • Собрать базу е-мейл адресов из открытого доступа (не Вашу) разметить, где корпоративный адрес где физический. Для начала надо попробовать объемом до 1000 адресов, если точность не удовлетворяет, то увеличить базу.
  • Создать нейронку и обучить на этой базе.
  • Если точность устраивает, то Вам передают код предобработки и обученную модель нейронной сети и говорят куда надо загрузить Вашу базу с адресами. Вы запускаете у себя на компьютере и получаете свою базу с отметками (например 0 или 1). Ваша база разработчику не передается.
2.Способ.
  • Вы сажаете своего работника, которому даете кусок базы и он в ручную делает разметку корпоративный/физический адрес.
  • Нейронщик в удаленном режиме работает на Вашем компьютере, то есть физически он не получает доступ к данным. Вся предобработка, нейронка и веса остаются у Вас.
  • Если точность Вас удовлетворяет, то Вы написанным кодом запускаете в обработку остальную часть Вашей базы и получаете результат.
Второй способ даст большую точность, так как для обучения Вы даете свою базу. Есть еще варианты, в моем профиле есть контакт в ТГ.
Лайфхаки по Chat_GPTПерейти на t.me/ai_chat_gpt_ai