Как бы вы создали эту таблицу из 10 миллионов таблиц данных на первом месте?
Как бы вы выполняли кластеризацию на миллион уникальных ключевых слов, при том, что у вас есть 10 миллионов точек данных — каждая из двух ключевых слов, и метрика, оценивающая, насколько похожи два этих ключевых слова?
Кандидат филологических наук, лингвист, читатель, мечтатель, работник нефтегазового... · 18 нояб 2021
Ваш вопрос весьма запутан. Во-первых, определитесь с терминами: 10 миллионов таблиц или точек данных (в 1 таблице)? Что такое "ключевое слово"? Что такое здесь "кластеризация"? Задача просто выделить уникальные точки данных или сгруппировать их по какому-то критерию?