Клуб Яндекс.Поиска для сайта

Автоматическая индексация и поиск по документам DOC, PDF

VotapilD
18 марта 2015, 10:43

Планируется использовать MODX Revo или Drupal. Модератор будет выкладывать документы в форматах (TXT, HTML, XML, DOC, RTF, XLS, PPT, PDF) и при поиске на сайте нужно производить поиск так же и внутри этих документов. Есть ли такая поддержка?


3 комментария
Подписаться на комментарии к посту
firstlena.pershina
18 марта 2015, 12:58

Добрый день!
Да, мы работаем с разными форматами документов, главное, чтобы текст там был представлен в виде текста (был распознан как текст), а не в виде изображения (как, например, иногда бывает с pdf). Форматы, которые мы можем индексировать, представлены в разделе «Уточнения» - «Формат документов»: https://yadi.sk/i/FzMFUHdrfLApE
Там же вы можете дать возможность вашим пользователям фильтровать поисковую выдачу по типу документов.

Меня интересует вопрос: Поиск и выдача файлов DOC и PDF будет в одной выдаче с html файлами или в разных?Новый Завет

Главное чтоб книги не участвовали в основном поиске с сайтами, как сайт и книга по количеству текста отличается. Послание к Евреям