Да, грубо говоря любая полнотекстовая поисковая система это — краулеры, которые ходят по всей сети и посещают как можно больше страниц, они передают полученную информацию службе индексации, там если на пальцах — отбрасывается информация не подлежащая индексации (размётка текста, шрифты, и так далее), передаётся в токенизатор, который разделяет текст на лексемы, а далее POS теггер — на части речи.
Это всё сохраняется в очень большую и сложную базу данных, поэтому да, когда вы выполняете запрос к поисковой системе — она выполняет, грубо говоря, запрос в свою СУБД и отдаёт вам результаты из своей базы данных.
Естественно, что я рассказал обо всём очень примитивно, в действительности отличаются лишь масштабы данных и уже от них — применяемые алгоритмы и технологии. Гугл при появлении был устроен примитивнее даже того, что сейчас описал я. Сейчас внутри находится магия машинного обучения и сторонние-сервисы помощники, все библиотеки человечества, и так далее.
Каждый может с минимальнейшими знаниями о программировании поиграть с настоящими алгоритмами самостоятельно, очень рекомендую книгу Тоби Сегарана «Программируем коллективный разум», у неё есть отличный перевод на русский язык, она подходит для любой подготовки, а по возрасту — я бы её смело рекомендовал даже ученикам средней школы.