Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Если все сайты хранятся на разных серверах, с разными провайдерами, то как при введении запроса в Гугл, он так быстро находит результаты?

Где то имеется центральная база данных, где находится копия всей информации с разных серверов? Если нет, то можете объяснить, как всё это работает простыми, но не слишком, словами или подсказать, где можно быстро узнать, как работает поисковая система?
ТехнологииПрограммирование+2
Лок Эрстед
SEO
  · 4,1 K
Лучший
software & security engineer  · 22 нояб 2021  · kalaver.in
Да, грубо говоря любая полнотекстовая поисковая система это — краулеры, которые ходят по всей сети и посещают как можно больше страниц, они передают полученную информацию службе индексации, там если на пальцах — отбрасывается информация не подлежащая индексации (размётка текста, шрифты, и так далее), передаётся в токенизатор, который разделяет текст на лексемы, а далее POS теггер — на части речи.
Это всё сохраняется в очень большую и сложную базу данных, поэтому да, когда вы выполняете запрос к поисковой системе — она выполняет, грубо говоря, запрос в свою СУБД и отдаёт вам результаты из своей базы данных.
Естественно, что я рассказал обо всём очень примитивно, в действительности отличаются лишь масштабы данных и уже от них — применяемые алгоритмы и технологии. Гугл при появлении был устроен примитивнее даже того, что сейчас описал я. Сейчас внутри находится магия машинного обучения и сторонние-сервисы помощники, все библиотеки человечества, и так далее.
Каждый может с минимальнейшими знаниями о программировании поиграть с настоящими алгоритмами самостоятельно, очень рекомендую книгу Тоби Сегарана «Программируем коллективный разум», у неё есть отличный перевод на русский язык, она подходит для любой подготовки, а по возрасту — я бы её смело рекомендовал даже ученикам средней школы.
1 эксперт согласен
Всё верно, простыми словами.