Как избавиться от повторяющего URLа?

Дмитрий К.

15 мая 2013, 11:41

Постоянно появляются в результатах поиска с датой не соответствующей действительности.

http://www.site.ru/news/*/http://site.ru/news/*/

10 комментариев

Авторизуйтесь, чтобы оставить комментарий

Дмитрий Вульбрун

28 января 2016, 01:02

Насколько я понял, в результатах поиска повторяются результаты с www и без www? Если это так, то скорее всего мы скоро это поправим. Если нет - приведите примеры, чтобы было понятнее, о чем речь (желательно со ссылками).

Дмитрий К.

28 января 2016, 01:02

Вот результат поиска:

http://www.site.ru/search/?searchid=2046576&text=ыбица&web=0

Вот не правильные ссылки в результатах поиска:

http://www.site.ru/news/80407/http:%2F%2Fkomiinform.ru%2Fnews%2F80407%2F

http://www.site.ru/news/89614/http:%2F%2Fkomiinform.ru%2Fnews%2F89614%2F

http://www.site.ru/news/82078/http:%2F%2Fkomiinform.ru%2Fnews%2F82078%2F

Дмитрий Вульбрун

28 января 2016, 01:02

Хм.. документ был проиндексирован именно с таким адресом. Значит, как-то робот такую ссылку обнаружил. Значит, такая ссылка где-то есть. Я попрбую найти источник этого, но советую вам тоже поискать.

Вообще вы можете сделать редирект с таких вот адресов на правильные адреса (только обязательно ставьте статус HTTP 301). Тогда робот будет индексировать документы с правильным адресом.

А еще можете логировать referer для таких документов и таким образом найти источник проблемы.

Дмитрий Вульбрун

28 января 2016, 01:02

Нам пока не удается найти источник проблемы.

Что следует сделать вам в этом случае:

Эти ошибочные документы стоит исключить из индекса. Воспользуйтесь интрументов delurl в Яндекс.Вебмастере (http://webmaster.yandex.ru/delurl.xml).

Сделайте редирект (301) с неправильных адресов на правильные, чтобы эта проблема больше не повторялась (http://help.yandex.ru/webmaster/?id=995305#995378), либо запретите индексацию таких документов а robots.txt (http://help.yandex.ru/webmaster/?id=996567)

Дмитрий К.

28 января 2016, 01:02

Спасибо за совет, но вот с robot.txt не разу не приходилось сталкиваться.

Как правильно сделать запись

Disallow: /news/*/*

Так?

Будет ли в таком случае индексироваться /news ?

Дмитрий Вульбрун

28 января 2016, 01:02

По большому счету тут http://help.yandex.ru/webmaster/?id=996567#996571 все написано про директивы robots.txt. В сервисе Яндекс.Вебмастер есть валидатор файла robots.txt. Если у вас будут затруднения с этим, вы можете связаться со службой поддержки сервиса Яндекс.Вебмастер.

Дмитрий К.

28 января 2016, 01:02

Проверка robots.txt в Яндекс.Вебмастере очень грамоно реализована, жаль раньше туда не заглядывал.

Спасибо все изменения внес, жду переиндексации сайта.

Дмитрий К.

28 января 2016, 01:02

Переиндексировалось, теперь все работает как правильно.

Спасибо

Дмитрий Вульбрун

28 января 2016, 01:02

Обращайтесь :)

Комментарий удалён

Дмитрий Вульбрун

28 января 2016, 01:02

Посмотрите нашу переписку с по этой проблеме, может быть вам этот же способ поможет? :)