Если все сайты хранятся на разных серверах, с разными провайдерами, то как при введении запроса в Гугл, он так быстро находит результаты?

Где то имеется центральная база данных, где находится копия всей информации с разных серверов? Если нет, то можете объяснить, как всё это работает простыми, но не слишком, словами или подсказать, где можно быстро узнать, как работает поисковая система?

ТехнологииПрограммирование+2

Лок ЭрстедSEO

21 ноября 2021 · 4,1 K

Лучший

Alex Kalaverin

software & security engineer · 22 нояб 2021 · kalaver.in

Да, грубо говоря любая полнотекстовая поисковая система это — краулеры, которые ходят по всей сети и посещают как можно больше страниц, они передают полученную информацию службе индексации, там если на пальцах — отбрасывается информация не подлежащая индексации (размётка текста, шрифты, и так далее), передаётся в токенизатор, который разделяет текст на лексемы, а далее POS теггер — на части речи.

Это всё сохраняется в очень большую и сложную базу данных, поэтому да, когда вы выполняете запрос к поисковой системе — она выполняет, грубо говоря, запрос в свою СУБД и отдаёт вам результаты из своей базы данных.

Естественно, что я рассказал обо всём очень примитивно, в действительности отличаются лишь масштабы данных и уже от них — применяемые алгоритмы и технологии. Гугл при появлении был устроен примитивнее даже того, что сейчас описал я. Сейчас внутри находится магия машинного обучения и сторонние-сервисы помощники, все библиотеки человечества, и так далее.

Каждый может с минимальнейшими знаниями о программировании поиграть с настоящими алгоритмами самостоятельно, очень рекомендую книгу Тоби Сегарана «Программируем коллективный разум», у неё есть отличный перевод на русский язык, она подходит для любой подготовки, а по возрасту — я бы её смело рекомендовал даже ученикам средней школы.

1 эксперт согласен

Марк Сафронов

подтверждает

24 ноября 2021

Всё верно, простыми словами.

1 ответ скрыт(Почему?)