Клуб о поиске Яндекса

Полнотекстовый поиск в pdf

patrik-a
5 июля 2012, 13:22

Мы планируем сделать на сайте библиотеку из pdf текстов. Может ли Яндекс-поиск искать внутри них и как быстро они будут проиндексированы? Сайт делается на Битриксе.

6 комментариев
Подписаться на комментарии к посту

Может.
Настройте "Уточнения" в результатах поиска, чтобы при поиске можно было выбирать тип документа и фильтровать PDF.

На самом деле если вы сделаете внутри текстов нормальную навигацию и документы будут довольно уникальны, то в любом случае будет участвовать (если не закроите от индексации)

По моему опыту документы попадут в поиск через 2-3 недели только. Ивопрос еще такой - есть ли способ документы показывать, но не дават копировтаь к себе на компьютер?

это уже к программистам, но на своем опыте скажу - что все что может проиндексировать поисковой робот я могу скопировать к себе

Если вы воспользуетесь функцией "индексирование по запросу" для вашего поиска по сайту, то быстрее.

Насчет защиты от копирования посмотрите справку Adobe, возможно, там есть ответ на ваш вопрос. И поисковые системы вам в помощь.

Set permissions to restrict document usage

A single dialog box lets you block access to document features, including printing, editing, and commenting, as well as copying, extracting, or modifying content. In addition, you can control whether users can fill in form fields and sign existing signature fields.

Никакая защита от копирования не защитит от распознавания PDF и конвертирования в редактируемый формат из которого можно копировать и вообще делать с текстом все что угодно