Клуб о поиске Яндекса

Индексирование содержимого онлайн-просмотрщиков

Саша Черных
4 февраля 2016, 23:35

Здравствуйте, к сожалению, на многих научных сайтах материалы выложены только в форматах .pdf , .djvu и др.; доступ к ним предоставляется на том же сайте через онлайн-вьювер. Произвольный пример: http://kvant.ras.ru/1977/04/p50.htm .

Как краулер Яндекса индексирует содержимое книг и статей, размещённых в таком виде?

Спасибо.

1 комментарий
Подписаться на комментарии к посту
Робот индексирует только pdf-документы (djvu-файлы в чистом виде не поддерживает), если в них содержится доступный для робота текст. Если текст оформлен в виде изображения (как в примере), то его содержимое проиндексировано не будет.