Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как бы вы создали эту таблицу из 10 миллионов таблиц данных на первом месте?

Как бы вы выполняли кластеризацию на миллион уникальных ключевых слов, при том, что у вас есть 10 миллионов точек данных — каждая из двух ключевых слов, и метрика, оценивающая, насколько похожи два этих ключевых слова?
ПрограммированиеData science+3
Анонимный вопрос
Data Science
  · 1,4 K
Кандидат филологических наук, лингвист, читатель, мечтатель, работник нефтегазового...  · 18 нояб 2021
Ваш вопрос весьма запутан. Во-первых, определитесь с терминами: 10 миллионов таблиц или точек данных (в 1 таблице)? Что такое "ключевое слово"? Что такое здесь "кластеризация"? Задача просто выделить уникальные точки данных или сгруппировать их по какому-то критерию?