Клуб о поиске Яндекса

Какие санкции применяются к сайту в случае наличия большого числа ошибок индексирования?

englishon-line
28 апреля 2011, 13:07

У меня на сайте много файлов PDF, как я считаю, полезных для пользователя. Однако Яндекс не умеет их распознавать, не верит моим описаниям этих файлов и маркирует их как страницы с ошибкой (страницы с ошибкой "нераспознанная кодировка").

Например: englishon-line.ru/text/1who.pdf

В исследовании топэксперт.рф наличие ошибок кодировки по негативному влиянию на ранжирование сайта приравнивается к наличию на страницах невидимого для пользователя содержания. Садовский согласился с результатами этого исследования в общем виде.

Это означает, что  мой сайт будет наказан Яндексом за то, что он  PDF-файлы считает страницами с ошибкой?
Кроме того, может ли наличие таких страниц стать фактором признания Яндексом главным зеркалом пиратского клона моего сайта, у которого на сайте этих файлов нет, он на них только ссылается ? Получается, что, с точки зрения робота, у сайта-клона нет этих многочисленных и нехороших страниц с ошибками.

14 комментариев
Подписаться на комментарии к посту

Добрый день!

Из-за наличия таких ошибок никаких санкций не применяется.

А из-за обилия 404? У нас очень много страниц в индексе и есть один большой раздел с кучей динамики (объявления с постмодерацией) — сокращение 404 каким-то образом может сказаться положительно на ранжировании или индексации?

Все указанные вами ошибки возникают из-за того, что pdf документы не содержат никакого текста, а только картинки. Мы такие не индексируем, тут http://help.yandex.ru/webmaster/?id=1111857 об этом есть. "В документах PDF индексируется только текстовое содержимое. Текст, представленный в виде картинок, не индексируется."


Если вы не можете представить их в нужном нам формате, то можно запретить их в файле robots.txt и робот не будет к ним обращаться.

На выбор главного зеркала эти ошибки также никак не влияют.

о каком поиске и индексации вообще речь идёт.. я не пойму.... яндекс - поисковая машина??  да вы что  - это смешно... в яндексе давно цензура и обман.... а лозунг "яндекс зеркало интернета" звучит точно так же как "Гитлер друг детей".

марш писать свой собственный поисковик

englishon-line
3 мая 2011, 08:36

У Яндекса столько добровольных адвокатов! Вы уверены, что он в них нуждается? Ещё и вашей квалификации?

Никто никому ничего не обязан только в обществе, где царит правовое и нравственное беззаконие. Не надо думать, что если вы хотите жить в таком обществе, то и для прочих - это идеал общественного устройства.

Фразой "не нравится - пошел вон" на неконструктивную критику уместно отвечать в сельпо, мы же на территории крупной компании. Учитывайте это, когда в следующий раз будете примерять роль адвоката на общественных началах.

если вы строите свой бизнес из предположения что вы создадите сайт, проделайте на сайтом некие манипуляции, яндекс высоко отранжирует ваш сайт, пользователи поисковика пойдут толпой и вы заживете припиваючи, то вы глупый и наивный человек. 

у меня есть совесть - мне что-то мешает внутри заниматься поисковой оптимизацией, что-то говорит что это не есть тру занятие для специалиста в области информационных технологий. может быть это как раз проявление совести.

на счет "обманывает" сказать могу только следующие: у всех компаний есть громкие миссии, но цель одна: увеличение прибыли

а голову мне и так оторвало. ведь пришла чумачечая весна :)

не могу похвастаться что я в москве. мы оба за мкадом. так что мне абсолютно не хочется ссориться. я не  обожествляю яндекс или гугл. но то что производят эти технологические гиганты не может оставлять наблюдателя равнодушным. в отличии от всяких продвигаторских контор. 

Удалённый пользователь
8 мая 2011, 14:28
Наблюдатель, в большинстве своём, равнодушен к происходщим событиям. Не хвастаясь своим происхождением "столичного розлива", могу это доказать. С Вашей оценкой деятельности Яндекс и Google полностью согласен.
Удалённый пользователь
9 мая 2011, 17:38
Неужели Вы так низко пали, Ваше Величество?

Яндекс не индексирует (или в поиск не пропускает) и pdf с текстом. Например, файл  по адресу englishon-line.ru/text/Tools.pdf был в поиске, его можно было просмотреть через Яндекс, но позже документ из поиска был удалён.

Почему? Место экономите? Или есть другие причины, по которым Яндексу так не нравятся упражнения на усвоение английской лексики?

------------------------------------

Гугл прекрасно индексирует, цитирую:

[PDF] Упражнение на английском языке: «Инструменты для профессий»

englishon-line.ru/text/Tools.pdfФормат файлов: PDF/Adobe Acrobat - Быстрый просмотр

Упражнение на английском языке: «Инструменты для профессий». (напишите названия
предметов, которыми пользуются люди разных профессий) 

Сейчас посмотрела, что Яндекс и в формате doc тексты не индексирует или в поиск не включает. Текст детской песни (http://englishon-line.ru/text/colours.doc) "Red, yellow and blue" Яндексу не известен. Тем не менее, файл с ее текстом  в поиске не участвует. 

Так что дело не в pdf, видимо.