Платон Щукин

Несколько советов интернет-магазинам по настройкам индексирования

Многие вебмастера, работая над оптимизацией интернет-магазинов для индексирующих роботов, задаются одними и теми же вопросами. В этом посте я постараюсь осветить наиболее часто встречающиеся из них, которые поступают ко мне:

     1. Использовать ли ЧПУ-адреса на сайте?

Индексирующий робот посетит и включит в результаты поиска и страницу по адресу сайт.рф/?категория=1&подкатегория=6 , и по адресу сайт.рф/ромашки/крупные вне зависимости от формата их URL-адресов, но стоит задуматься, какой тип адресов лучше подойдёт для удобного ориентирования ваших покупателей, по какой ссылке пользователи форумов или социальных сетей будут чаще переходить и делиться ею со своими знакомыми. Понятная и читаемая структура URL-адресов не только позволит посетителям быстрее ориентироваться на сайте, но и поможет роботу сформировать корректные навигационные цепочки , что сделает сайт более заметным в результатах поиска.

     2. Что делать со страницами пагинации и сортировки товаров?

Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel="canonical" тега <link> на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска.
Например, страница сайт.рф/ромашки/1 - каноническая, с неё начинается каталог, а страницы вида сайт.рф/ромашки/2 и сайт.рф/ромашки/3 - неканонические, в поиск их можно не включать. Это не только предотвратит возможное дублирование контента, но и позволит указать роботу, какая именно страница должна находиться в выдаче по запросам. При этом ссылки на товары, которые находятся на неканонических страницах, также будут известны индексирующему роботу.
Часто вместо пагинации сайты используют динамическую прокрутку, когда для посетителя, пролиставшего каталог до определённого момента, с помощью JavaScripts загружаются другие товары в данной категории. В такой ситуации необходимо проследить, чтобы весь контент таких страниц отдавался индексирующему роботу (например, с помощью инструмента в Яндекс.Вебмастере), либо чтобы роботу становилась доступна статическая пагинация товаров.


Вторая часть вопроса связана со страницами сортировки, например, по цене, популярности или характеристикам. Чтобы разобраться с этой частью, необходимо понять, нужны ли такие страницы в результатах поиска, отвечают ли они в полной мере на запросы пользователей. Если страницы не отвечают на запросы пользователей поисковой системы, их лучше закрыть с помощью соответствующих правил в Вашем robots.txt, оставив для посещения роботом только действительно необходимые страницы.

     3. Один товар в нескольких категориях, как исключить дублирование?

С такой ситуацией сталкиваются вебмастера, если один и тот же товар логично разместить в нескольких категориях. Например, ромашки могут находиться в категории "Полевые цветы" или "Необычные цветы". Для подобных ситуаций я советую использовать атрибут rel="canonical" тега <link>: укажите с помощью него канонический адрес, например тот, что находится в наиболее популярной категории, именно он будет индексироваться и участвовать в результатах поиска. Это позволит предотвратить дублирование контента в выдаче, и вы всегда будете знать, какая страница должна находиться по запросам. Посетители же всегда смогут найти обе страницы при заходе на сайт, а перелинковка между собой этих страниц может быть полезна в этом случае.

     4. Товар с выбором цвета\размеров, как предотвратить дублирование?

Когда один и тот же товар представлен в вашем магазине в различном исполнении, самое правильное решение для подобных случаев - сделать выбор характеристик товара без изменения URL-адреса с динамическим обновлением контента на странице (например, при смене выбранного цвета изменяется изображение). Но часто по каким-либо причинам (например, из-за технических ограничений используемой CMS) это невозможно сделать. Тогда для робота остаются несколько практически идентичных страниц с товаром, которые или могут находиться в поиске независимо друг от друга, или которые робот посчитает дублирующими, оставив в выдаче только один адрес на своё усмотрение.
Я советую вам решить, нужны ли все страницы с вариантами исполнения товара в поиске, или будет достаточно только одной версии страницы. Для первого случая на такие страницы можно добавить больше различающегося контента (отзывы покупателей, комментарии или обсуждения, рекомендуемые к просмотру товары),а во втором случае - использовать вышеуказанный атрибут rel="canonical", выбрав в качестве канонического адреса наиболее популярную модификацию товара.

     5. Товар закончился на складе, что делать?

Если товар стал кратковременно недоступен в вашем интернет-магазине, но в скором времени ожидается его поступление, я рекомендую оставить страницу с ним доступной для робота (возвращать индексирующему роботу HTTP-код ответа 200), это предотвратит её исключение из результатов поиска. Чтобы поддерживать интерес пользователя на такой странице можно отображать информацию о скором поступлении товара на склад, возможность предзаказа, а также рекомендуемые и похожие товары, которые есть в наличии, что часто позволяет сохранить посетителя сайта и заинтересовать его другой продукцией. При длительном отсутствии товара на складе лучше настроить HTTP-код ответа 404, чтобы удалить недоступные для заказа товары. Саму страницу «заглушки» не оставлять стандартной, а разнообразить дополнительной интересной и полезной информацией.

     6. Что нужно добавить в robots.txt ?

Обязательно к закрытию в файле robots.txt:

- страницы действий (добавление в корзину, сравнение товаров, перенос в список "Избранное"),
- корзины с товарами,
- встроенный поиск на сайте,
- служебные каталоги с конфиденциальными документами (адреса доставки, контактные телефоны),
- идентификаторы сессии, utm-метки с помощью директивы "Clean-param".

Дополнительно, как и для всех сайтов, указать в robots.txt необходимо:

- директиву Host с адресом главного зеркала сайта,
- директиву Sitemap с адресом актуального файла sitemap .

103 комментария

Спасибо! Платон, совсем недавно мне отвечал суппорт Яндекса на вопрос, почему индексируется мобильная версия сайта, на которой установлен canonical на каждой странице на соотв. версию обычной версии сайта, что canonical не строгая директива. Да и у вас написано так в хелпе

В итоге где правда? Неканоническая страница точно не будет участвовать в поиске? 

Робот считает ссылку с атрибутом rel="canonical" не строгой директивой, а предлагаемым вариантом, который учитывается, но может быть проигнорирован.

Да, иногда атрибут rel="canonical" может не учитываться роботом, например, если в качестве канонического адреса указан другой домен\поддомен, а также если каноническая страница недоступна для робота. В большинстве остальных случаев робот следует указаниям.

У вас поддомен для мобильной версии, наверное?! Обязательно закройте метатегом noindex nofollow. Я вообще преподчитаю адаптивную верстку и не вижу агрументов для создания отдельной версии на поддомене. Кроме того, в вашем случае, поддомен это дубликат основного сайта.

Закрывать мобильную версию на поддомене совсем не нужно, если она должна участвовать в поиске. Достаточно на страницах основной версии указать наличие мобильной версии с помощью конструкции вида http://m.site.com/page.html"/> . Актуальные рекомендации по мобильным версиям уже есть на странице Помощи.

Вы правы, я поторопился! А что с обратными ссылками будет - люди очень часто делятся линками на мобильную версию. Яндекс склеит если будет такой тег?

Ссылки на мобильную версию, размещённую на отдельном поддомене, не будут учитываться для основного домена. При этом показатель тИЦ основного домена будет включать тИЦ всех доступных поддоменов.

Ну вот, лучше адаптивную сделать!

Лучше оно-то, лучше, но не всегда есть возможность технически, а иногда уже готова отдельная мобильная версия у клиента и тут ничего не попишешь. А закрывать от индексации нельзя, иначе Гугл не будет её "видеть"

Платон спасибо, с alternate понятно, но не будет проблемы с тем, что контент мобильной версии будет дублировать контент основной версии? В рекомендациях Гугл, например, как раз используется каноникал на мобильной версии, чтобы она не попадала в индекс, но робот её видел. Как быть с Яндексом? Закрывать от индексации нельзя, каноникал не работает... Достаточно альтернейт и чтобы в индексе были обе версии? Проблемы с дублированным контентом не будет? Мобильная версия не сможет (теоретически) показывать в поиске пользователям с десктопов?

Нет, проблем с дублированием контента не возникнет, при корректных настройках alternate мобильная версия не будет участвовать в основном поиске.

А как робот будет обрабатывать инструкции rel="prev" rel="next" тега ?

Робот эти указания не поддерживает и проигнорирует при индексировании страницы.

"Вторая часть вопроса связана со страницами сортировки, например, по цене, популярности или характеристикам. Чтобы разобраться с этой частью, необходимо понять, нужны ли такие страницы в результатах поиска, отвечают ли они в полной мере на запросы пользователей. Если страницы не отвечают на запросы пользователей поисковой системы, их лучше закрыть с помощью соответствующих правил в Вашем robots.txt, оставив для посещения роботом только действительно необходимые страницы."

И даже если вы решите что страницы сортировки вам нужны, то сайт получит очень сильные пинальтии потому-то и потому-то... Что за бред вы пишите?! Это же люди читаю и верят вам! :-(

Сергей Зорин
28 января 2016, 11:46

Правильно ли я понимаю, что наличие или отсутствие ЧПУ не влияет на ранжирование сайта?

Не влияет на индексирование, но влияет на ранжирование

Задать вопрос об этом Вам лучше через форму обратной связи.

"Обязательно к закрытию в файле robots.txt:
- служебные каталоги с конфиденциальными документами (адреса доставки, контактные телефоны)"

- Правильно ли я понимаю, что страница "Контакты", "Адеса доставки", "Офисы компании", а также "Реквизиты организации" (если они есть) по вашей логике считаются конфиденциальной информацией, хотя по сути таковыми не являясь (если нет об этом специальных документов у компании) и обязательно должны быть закрыты в robots.txt от индексации?

Почему это нужно закрывать, если это является навигационной информацией, которая даёт людям и поисковикам информацию о месте нахождения компании, её контактных телефонах и дополнительной информации для юридических лиц?

Мало того, микроразметкой, которую вы тоже рекомендуете применять, как раз отмечаются такие данные: schema.org/Organization и schema.org/LocalBusiness, и если их закрыть от индексации это ухудшит представление организации в поиске (и мы говорим не только про поиск Яндекс)

Речь в данном случае идёт о пользовательских данных, например, которые посетители сайта размещают при регистрации или оформлении заказа в интернет-магазине. Чтобы такая информация не попала в результаты поиска, её лучше запретить к обходу роботом. Закрывать приведённые же Вами разделы на сайте не нужно.

Удалённый пользователь
28 января 2016, 11:46

"Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel="canonical" тега на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска."


Почему, в таком случае, не использовать метатег robots с атрибутом content="noindex, follow"? Почему вы сделали выбор именно в сторону canonical?


Сложно назвать контент страниц пагинации, например, в интернет-магазине во многом идентичным, потому что каждая страница пагинации содержит уникальный набор товаров в рамках цепочки пагинации. Именно это содержимое является основным контентом для страницы пагинации.

Мета-тег "noindex" запрещает индексирование страниц, в то время как атрибут rel="canonical" указывает на каноническую страницу и позволяет передавать ей некоторые показатели неканонических адресов. Для пользователей сайта, несомненно, страницы пагинации нужны, но посетителям сайта из поисковой выдачи удобнее попадать сразу в начало каталога - как раз на первую страницу, поэтому я советую оставлять для робота только её.
Удалённый пользователь
28 января 2016, 11:46

С точки зрения попадания пользователей на страницу и noindex, и canonical будут работать одинаково, ведь в выдаче останется одна первая страница из цепочки пагинации.

 

Получается, основная суть как раз в передаче "некоторых показателей неканонических адресов". Не вызовет ли возможность передачи этих показателей проблем с индексацией и повторной индексацией карточек товаров?

Лучше указать каноническую страницу для дубликатов, для глубины и скорости переиндексации пс сайта. В крайнем случае метатегами ноуиндекс ноуфоловую.

По поводу уникальности страниц пагинации каталога за счет смены названия товаров, вы ошибаетесь, дубликаты бывают разные и в данном случае ни как не упирается только в названия товаров. Платоны, как раз наоборот указали, что названия товаров будут дублироватся в разных разделах. Ну и наверное будут дублироватся и с карточкой товара 

Удалённый пользователь
28 января 2016, 11:46

Спасибо за ваше мнение, но я понимаю, что может быть/не быть дублями и в какой степени. Именно потому и хочу получить ответ из официального источника.

 

 

Нет, проблем не будет, страницы с товарами будут индексироваться в общем порядке.

Что подразумевается под 

некоторые показатели неканонических адресов

Увы, прокомментировать, какие именно факторы передаются каноническим адресам, я не могу.

platon,
"Для пользователей сайта, несомненно, страницы пагинации нужны, но посетителям сайта из поисковой выдачи удобнее попадать сразу в начало каталога - как раз на первую страницу, поэтому я советую оставлять для робота только её." я правильно понимаю, что яндексбот не разбирается в нафигации сайта, не может найти где начало и ему нужен каноникал для этого? :)
Явтушенко Александр
28 января 2016, 11:46

 

И еще вопросы по этой рекомендации.
«Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel="canonical" тега на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога,»

Представители Google говорили, что такое использование канонических адресов, является ошибочным. Информация здесь.
https://googlewebmastercentral.blogspot.ru/2013/04/5-common-mistakes-with-relcanonical.html

Я понимаю, что Яндекс не Google.  Но в итоге разработчики попадают в двоякую ситуацию…


1.Буду благодарен, если прокомментируете эту ситуацию.

2.Второй вопрос. Нет ли в планах учитывать атрибуты rel="next" и rel="prev" ?

1. По указанной Вами ссылке речь идёт не о страницах пагинации с товаром в интернет магазине, о текстовой статье, содержимое которой разбито на несколько частей. В такой ситуации применять атрибут rel="canonical" не нужно. 2. В ближайшей перспективе таких планов нет.
Явтушенко Александр
28 января 2016, 11:46

Спасибо за комментарий.

13.01.16 (вчера) была видеовстреча с веб-мастерами Google. Там задал этот же вопрос.

Сказали, что не рекомендуют и в случае интернет-магазинов
https://www.youtube.com/watch?v=pyt9PgSt4jo (смотреть с 15.30)

Вы правы, момент с наличием страницы, на которой собран весь товар раздела, я упустил. Если такая страница присутствует на сайту, действительно, лучше указывать в качестве канонической именно её.

Удалённый пользователь
9 февраля 2016, 00:06
platon,
вообще говоря это как-то странно - что это за такая отдельная страница со всем товаром раздела (ее конечно можно специально создать) - нам же все-таки нужно, чтобы пользователь пришел на первую страницу раздела, а не на страницу, где полностью весь товар (его может очень много - да и не очень-то это целесообразно по-моему целиком весь его на одну страницу грузить).
mail@alphaseo.ru
24 июня 2016, 00:42
Black Friday,
у сайтов на 1С Битрикс есть такая страница по-умолчанию, вызывается параметром /?SHOWALL_1=1. У нас было несколько проектов, которые приходили с проставленным rel="canonical" именно на эти страницы.
Удалённый пользователь
18 марта 2020, 01:31
mail@alphaseo.ru,
Здравствуйте подскажите как избавились от ?SHOWALL_1=1 в canonical? Для примера сейчас так на странице Дизельных электростанций и их подкатегориях https://cnminsk.by/dizelnye-elektrostantsii/

Добрый день и спасибо за рекомендации. 

Не могли бы вы ответить на вопрос? 

и 

Это одно и тоже?

Если речь об индексирующем роботе, то вид кавычек значения не имеет.
Добрый день. Вы не могли бы все таки до конца осветить вопрос по поводу страниц пагинации/canonical?
Явтушенко Александр здесь уже спрашивал по поводу данных страниц. В том видео что он скинул Google не рекомендует использовать тег canonical на страницах пагинации. Я имею в виду:
site.ru/sumki - первая страница раздела
site.ru/sumki/2 - вторая страница раздела
site.ru/sumki/3 - третья страница раздела
Вы же говорите, что canonical со второй/третьей и т.д. указывать на первую нужно.
Предположим, что страницы где собраны ВСЕ товары раздела - НЕТ.
Как быть вебмастерам?
Спасибо
Будет ответ на мой вопрос? Уже две недели прошло
watsonia,
Прошу прощения, что так долго не отвечал. Если страницы со всеми товарами нет, на страницах пагинации атрибут rel="canonical" можно не устанавливать.
platon,
Как тогда быть, какой код вставить?

В интернете советуют поставить на все страницы пагинации (кроме первой) тег
<meta name=»robots» content=»noindex,follow»>

Будет ли это правильным решением?

Хотелось бы чтобы все-таки яндекс поддерживал атрибуты атрибуты rel="next" и rel="prev"
Вопрос по геотаргетированию: будет интернет-магазин, он же сайт компании, компания имеет множество филиалов по России, домен отнесен к региону "Россия", нужно ли делать статические страницы (главная, контакты, доставка) для каждого региона и загонять их в индекс отдельно например урл http://mysite.ru/spb/ или можно сделать для всех один урл с динамическим региональным контентом отображаемым по привязке к местному ip?
Подпишусь на комментарии :)
Спасибо Платон, за интересную стратью. Но у меня появился вопрос. Касательно отображения одного товара в разных категориях. А что если в разных категориях у одного товара одинаковые адреса. К вашему примеру "Например, ромашки могут находиться в категории "Полевые цветы" или "Необычные цветы"." и имеют адрес формата сайт-цветов.рф/Полевые-цветы и  сайт-цветов.рф/Необычные-цветы. С обоих групп имеется ссылка, на карточку товара, имеющую такой адрес: сайт-цветов.рф/ромашка-полевая. Что делать в такой ситуации?
Прочитал всю ветку и по п.2. все в итоге свелось к "можете делать, можете не делать".. хотелось бы все же рекомендацию получить "как лучше". Вот, например, страница раздела с товарами, на которой 300 товаров (с пагинацией, само собой) и с ссылкой "Показать все".

1. Ставим rel="canonical" на "Показать все" - загрузка страницы с 300 товарами займет значительно время и не уложится в хорошие показатели для поисковой системы, а следовательно этот фактор окажется проигрывающим сайтам конкурентов, которые не заморачивались с этой темой?

2. Ставим rel="canonical" на первую страницу пагинации - не будет ли это логической ошибкой при наличии "Показать все"? Надо ли в таком случае "Показать все" закрыть от индексации?

По п.6. вопрос:

С robots.txt все понятно, а в коде сайта ссылки фильтров типа "Показать", "Сбросить", ссылки у товаров "Добавить к сравнению", "В корзину" и т.п. их снабжать атрибутами rel="nofollow" и помещать в тег noindex?
Евгений,


по пункту 2:
Есть страницы пагинации и есть страница "показать все". Со всех страниц кроме первой стоит canonical на первую страницу пагинации (!). Но... яндекс по некоторым запросам отдает именно страницу "показать все" как наиболее релевантную (она не закрыта от индексации и более того, с нее тоже настроен canonical на первую страницу пагинации).
И тут возвращаемся к пункту 1. Действительно, с кол-вом товаров 300+ она грузится не очень быстро.


Так что присоединяюсь к вопросу, как сделать логически более верно?
Платон, подскажите, а если при удалении товаров/объявлений делать не 404, а 301-редирект на заглавную страницу категории -  допустим ли такой вариант?


Это поидее, это будет более полезно пользователю чем страница заглушка с ошибкой - будет листинг релевантных товаров/объявлений по его теме.
Павел,
допустим, но это не будет более полезным. Ваша страница с ошибкой пропадет из поиска достаточно быстро. При этом, если человек ищет конкретный товар - очень сложно оставить его на сайте, чтобы он выбрал аналог.
На сайте имеются группы статей.
/некоторая-группа/ - ведет на первую страницу статей из группы

/некоторая-группа/?page=1 - тоже ведет на первую страницу статей из группы

/некоторая-группа/?page=2 - ведет на вторую страницу статей из группы

... и т.д.


Правильно я понял, что если есть GET параметр ?page=1, то в заголовке, для таких страниц, надо написать:
<link rel="canonical" href="/некоторая-группа"/>  

?
Евгений Б.,
и еще спрошу: в этом тэге ссылка может быть относительной (как я нарисовал) или только абсолютные ссылки (полный урл) использовать?
Евгений Б.
10 ноября 2016, 14:02
Отвечать здесь больше не будут?
Тоже интересно!
Продублирую вопрос, который остался без ответа и интересен:


Спасибо Платон, за интересную стратью. Но у меня появился вопрос. Касательно отображения одного товара в разных категориях. А что если в разных категориях у одного товара одинаковые адреса. К вашему примеру "Например, ромашки могут находиться в категории "Полевые цветы" или "Необычные цветы"." и имеют адрес формата сайт-цветов.рф/Полевые-цветы и сайт-цветов.рф/Необычные-цветы. С обоих групп имеется ссылка, на карточку товара, имеющую такой адрес: сайт-цветов.рф/ромашка-полевая. Что делать в такой ситуации?
Огромное спасибо, крайне широко и доступно раскрыт вопрос про дубли страниц. 
Здравствуйте Платон, подскажите пожалуйста. Делаю сайт Авто запчастей для одной компании. Руководитель компании, пожелал чтоб на сайте, в каждой странице была таблица с прайс листом продукции, с фильтром и пагинацией. А прайс листы с таблицами получаются огромными, и тошнота страницы зашкаливает, хотелось чтоб стр. не попали под фильтр. Что можно сделать??? Просто опыт маловат у меня в программирование, вот решил у вас специалистов проконсультироваться)))
Платон, спасибо за подробный и развёрнутый ответ rel="canonical"!
Есть странный вопрос.
Возможно ли указание страницы с данным тегом саму на себя? 
Мэтт Каттс в своём интервью говорит, цитирую: "Абсолютно нормально, если страница ссылается сама на себя с rel=canonical, и абсолютно нормально, во всяком случае, для Google, чтобы rel=canonical стоял на каждой странице сайта".
А как к такой инициативе относится Яндекс?

С уважением.
Здравствуй, Платон.

Вопрос по поводу 3-его пункта вашей статьи. Нигде не могу найти конкретного ответа, как лучше для продвижения сделать структуру URL адресов товаров и категорий для интернет-магазина.  

Учитывая, что один и тот же товар может находиться в разных категориях интернет-магазина, то нужно ли этот товар вообще привязывать к этим категориям и заморачиваться с атрибутами rel="canonical" ?
 
Вот есть у нас, допустим, товар "стильная зажигалка", которая относится к категориям "подарки для мужчин" и "подарки на 23 февраля", и есть 2 варианта сделать url адреса: 

ВАРИАНТ 1 (привязываем товар к каждой категории, где он находится и делаем атрибут rel="canonical"):
►mysite.ru/podarki-dlya-muzhchin/stilnaya-zazhigalka
►mysite.ru/podarki-na-23-fevralya/stilnaya-zazhigalka (и в этой категории "подарки на 23 февраля" делаем атрибут rel="canonical" на категорию "подарки для мужчин", типа как на более популярную)

ВАРИАНТ 1 (вообще не привязываем товар к какой бы то ни было категории): ►mysite.ru/stilnaya-zazhigalka  (И в этом случае на странице mysite.ru/podarki-dlya-muzhchin/ и на странице mysite.ru/podarki-na-23-fevralya/ просто показываем карточку товара зажигалки, ссылка которой будет вести на адрес mysite.ru/stilnaya-zazhigalka )

Какой вариант лучше для продвижения в органике Яндекса?

Спасибо!
"Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel="canonical"" – скажите, в каком месте страницы пагинации во многом идентичны? Разные записи, разные заголовки, единственное что может быть одинаковое у этих страниц, это тайтл и дескрипшн (хотя и их можно уникализировать, добавляя номер). Отсюда вопрос, не будет ли хуже от rel="canonical", из-за того, что страницы разные, почему бы поисковому роботу не научится распознавать страницы пагинации?
Обновите информацию! Host не актуален )
Спасибо, поправил! :)
Добрый день!
Подскажите пожалуйста, что делать и к кому обратиться - я обнаружила дупликат своего сайта, который выполняется скорее всего парсингом - весь мой контент дублируется у него, разделы Новости, объявления, статьи.

http://industry-development.ru/tramp-vvodit-sankcii-protiv-rossii-za-vmeshatelstvo-v-vybory-ssha/

а вот мой сайт https://promdevelop.ru/news/tramp-vvodit-sanktsii-protiv-rossii-za-vmeshatelstvo-v-vybory-ssha/

пример копирования по разделам
http://industry-development.ru/category/novosti/
https://promdevelop.ru/news/

Спасибо
Денис Горохов
8 мая 2018, 10:56
Сделал новый модуль для 1С-Битрикс.
Позволяет красиво обработать постраничную навигацию, создавать страницы типа /page-2/, /stranica-2/ и при этом соблюсти все рекомендации Google для постраничной навигации, добавить теги rel=next/prev/canonical на страницы с постраничкой!
Надеюсь кому-то будет полезно!
Буду благодарен за отзывы и предложения!
Ссылка на модуль: http://marketplace.1c-bitrix.ru/solutions/gorokhovdv.paging/
Добрый день. 
Скажите пожалуйста. Есть основной сайт и есть региональные сайты на его поддоменах.
Кроме товарного предложения, на сайте есть большой массив тематических и аналитических статей.
Вопрос:
Надо ли закрыть на поддоменах этот информационный материал от индексации, чтобы не случилась склейка с этими же материалами размещенными на основном сайте?
Напишите нам в поддержку, пожалуйста, ответим обязательно!
Добрый день , имеется категория товаров на 30 страниц , имеет ли смысл отказаться от тега canonical , а в страничке со второй по последнюю выставить теги next и prev? Определит ли яндекс что в поиске ключевая страничка должна быть первая с которой начинается вся цепочка?
Обновлено 3 августа 2018, 18:17
mylovelyrogue,
наш робот сейчас не поддерживает атрибуты next и prev, поэтому они будут роботом игнорироваться. Если вы хотите, чтобы в поиске участвовала только одна первая страница данной категории, атрибут rel="canonical" лучше не убирать.
Константин К.
9 августа 2018, 11:42
Здравствуйте. Что лучше делать с индексируемыми страницами пагинации, если на них приходят пользователи из органики? Причем переходов на страницы пагинации в сумме больше, чем переходов на основную страницу.


Есть основная страница /proizvoditel/
И соответственно куча /proizvoditel-1/, /proizvoditel-2/ ...  /proizvoditel-N/
Константин К.,
это решать вам :) Возможно, пользователям эти страницы нравятся больше чем-то.
Добрый день! На моём сайте пагинация начинается с 0 страницы. То есть первая без параметра, вторая страница имеет параметр page=1 и т.д. Специалист посоветовал переделать, чтобы параметр у страниц пагинации в урл начинался с page=2, а не с page=1, как сейчас. Нигде не нашла влияет ли это как-то. Может ли это смутить робота.
Подскажите, это действительно важно?
Если, согласно вашей рекомендации, закрыть корзину (пример: Disallow: /cart), то как робот поймет о наличии данного функционала на сайте? Ведь наличие корзины явно является плюсом перед сайтами, где заказ можно сделать только через форму обратной связи...?
Здравствуйте!
Хочу учесть рекомендации Яндекса и Google одновременно.

Уточните пожалуйста, будет ли правильным организовать пагинацию следующим образом:


1. Не использовать canonical на страницах пагинации.
2. Использовать теги rel=prev, rel=next, rel=first, rel=last
3. Использовать meta-тег <meta name="yandex" content="noindex, follow">

Борис,
При использовании тега <meta name="yandex" content="noindex, follow"> будет ли робот Яндекса переходить по ссылкам?
Борис,
при таких указаниях робот сможет переходить по ссылкам со страниц.
Борис,
для страниц пагинации мы рекомендуем использовать именно атрибут rel="canonical", чтобы указать нашему роботу, по какому адресу страницы должны участвовать в поиске, но если Вы хотите полность запретить индексирование таких страниц нашему роботу, то вполне можете использовать мета-тега noindex.
platon,
Спасибо!
Здравствуйте! 
Уточните, пожалуйста, про несуществующие страницы пагинации: как поступать с ними? Ставить код ответа 404 или редирект 302 на первую.
В каталогах количество страниц меняется динамически, зависит от количества товара, соответственно за сутки может быть 20, 21, 22, 20.. страниц в каждом каталоге. Страницы открываются последовательно по кнопке показать ещё, в принципе попасть на несуществующею (бывшую последнюю) посетитель может из закладки или набрав в адресной строке цифру. Быстрого перехода на конкретную страницу нет. Для первой страницы установлен атрибут canonical, и для других, соотв., next/prev.
Спасибо.
vestum-direct,
tсли на таких страницах пагинации установлен атрибут rel="canonical" с указанием на первую страницу каталога, то попасть в поиск такие страницы не должны даже в момент их доступности. Если же вы беспокоитесь, что пользователи могут попасть на недоступные страницы из закладок, то вы вполне можете, например, использовать редирект на первую страницу каталога, чтобы пользователь не попал на страницу с ошибкой. Редирект также укажет нашему роботу, по какому адресу страница должна участвовать в поиске.
Уважаемый Платон!
Когда можно получить ответ на вопросы? Или направьте, где можно)
Игорь SEO Шевченко
7 марта 2019, 16:53
Уважаемые Платоны, если ли на страницах пагинации интернет-магазина установлен rel="canonical" (на первую страницу, страница со всеми товарами отсутствует), будут ли индексироваться товары которые расположены на страницах пагинации?
Игорь SEO Шевченко,
да, будут, дополнительно советуем указать ссылки на них в файле sitemap.
Добрый день, хочу уточнить один момент по страницам "пагинации".
Если мы настраиваем каноникал со страниц пагинации на "1ую" страницу, то страницы пагинации лучше не закрывать в robots.txt или мета-тегом noindex, они в любом случае в "поиск" не попадут, а статичный вес передавать будут попрежнему?


*В данный момент на сайте страницы пагинации закрыты в robots.txt и настроен каноникал на "1ую".


Спасибо за ответ.
Обновлено 23 апреля 2019, 18:05
Школа Семи Гномов
26 апреля 2019, 15:55
Vladyslav-Naboka,
Так же интересует ответ на этот вопрос. В данный момент страницы пагинации закрыты в роботсе, но canonical на первую не настроен.
Что я в этом варианте теряю?
Школа Семи Гномов,
Лучше настроить каноникал на 1ую страницу, и для гугла это будет хорошо. Ответа на свой вопрос я не нашел.
Елена Першина
6 мая 2019, 11:50
Vladyslav-Naboka,
Страницы пагинации запрещать к индексированию действительно не стоит, поскольку тогда робот не сможет обращаться к подобным страницам и индексировать их совсем. Корректно настроенного атрибута rel="canonical" будет достаточно, чтобы указать роботу, по какому адресу страницы должны быть в поиске.
Школа Семи Гномов
11 мая 2019, 06:58
Елена Першина,
 представьте себе каталог магазина. Кроме листинга товаров (которые постоянно меняются, так как принцип их ранжирования зависит от нескольких факторов, наличия, рейтинга и т.д.), все остальное окружение страницы статично, включая все метатеги. Всегда было принято страницы пагинации закрывать от индексации, чтобы не плодить псевдо дублей. Яндекс считает, что нет рисков, если открыть страницы пагинации и только канониклом указать первую как каноническую?



Школа Семи Гномов,
отвечу за Елену :) Для того, чтобы избежать появления дублирующих страниц в результатах поиска, вполне достаточно атрибута rel="canonical". Вместе с тем, окончательно решение принимать вам, владельцу сайта. Если вы не хотите, чтобы такие страницы индексировались совсем, по желанию, вы можете запретить их индексирование.
Обновлено 14 мая 2019, 15:47
Дмитрий Николаевич
22 июня 2019, 15:51
Елена Першина,
Здравствуйте, Елена.
Прошу извинить меня за очередное беспокойство.
Очень Вас прошу, если не сложно, пожалуйста, не могли бы Вы повториться.
Есть сайт женской тематики. Скорее, даже, блог, созданный по принципу вопросника. Читатели задают вопрос, я даю им чётко сформулированный ответ. Движок Wordpress. Разделы и Главная имеют постраничную навигацию, на которой выводятся 5 заголовков статей и анонсы к ним. С кнопочкой "читать далее".
До недавнего времени я использовал конструкцию для страниц сайта:
https://site.ru/voprosnik/page/7

<meta name= "robots" content= "noindex, follow" />

<link rel="canonical" href="https://site.ru/voprosnik" />

Я прописывал одновременно и мета-тег robots и каноническую ссылку на начало каталога.
Перечитав ветки обсуждений, мне подсказали, что необходимо оставить только директиву "каноникал", ведущую на первую страницу раздела. Так я и сделал.
Пожалуйста, подскажите, насколько грамотно я поступил? Не потеряю ли я сайт, который развивал 8 лет? 
Заранее Вам благодарен!
Подскажите, пожалуйста, по такому вопросу. Я хочу закрыть от индексирования ряд страниц сайта. Но при этом пользователи сайта проводят на них какое-то (заметное) кол-во времени. С точки зрения поведенческих показателей будет ли учитываться время пользователей, проводящих время на закрытых от индексирования страницах сайта? Или же страницы удаленные из индекса не влияют никак на время проведенное на сайте?
Елена Першина
5 мая 2019, 23:24
info@bizoku.com,
лучше скажите, зачем хотите их от индексирования закрыть? Пока из описания решение кажется странным. 
info@bizoku.com
6 мая 2019, 00:32
Елена Першина,
на этих страницах не наш контент, но пользователи проводят там много времени.
Елена Першина
6 мая 2019, 11:33
info@bizoku.com,
смотрите, учёт поведенческих мы в такой форме не комментируем, так что тут ответа в том виде, в какой вы ждёте, не будет.  Если хотите закрывать - закройте какую-то часть - и посмотрите эффект. Если проблем не будет - попробуйте закрыть все. Но! Оцените риски по потери трафика, в том числе прямого: есть ли сейчас трафик на эти страницы из поиска, в каком объеме. 
Здравствуйте!
Подскажите, пожалуйста - страницы фильтрации по каталогу идут через параметр "?set_filter=..." - что правильнее прописать им канонический адрес или закрыть от индексации или и то, и другое?
Для страницы пагинации настроили каноникал на первую страницу, при этом поисковый робот все равно ее проиндексировал с комментарием в ЯВМ:



"Страница попала в поиск, поскольку во время её сканирования роботом её содержимое существенно отличалось от содержимого страницы по адресу ..., который был указан в атрибуте rel="canonical" в исходном коде. Исправьте или удалите атрибут canonical, если он указан некорректно. Робот отследит изменения автоматически."



в чем ошибка? содержимое страницы отличается ровно на столько, на сколько это возможно для страницы пагинации (другой набор товаров).
Обновлено 30 сентября 2019, 12:25
Матвей,
также присоединяюсь к этому вопросу.
Часто ловим такие ситуации, хотя все сделано по рекомендации из статьи.


Уважаемые Платоны Щукины, как поступать в данном ситуации?


И ещё, если например сейчас вашей дополнительной рекомендацией будет закрыть в robots страницы пагинации, то не будет ли это влиять на ранжирование, т.к. было например 6000 товаров в разделе (30 товаров на страницу, 200 страниц итого) и робот понимает что тут пользователю есть что выбрать по сравнению с конкурентом где например 100 товаров, и после закрытия страниц в robots соответственно для робота будет всего 30 товаров (понятно что все-равно товары на тех страницах пагинации есть в sitemap)?
Как ранее писали создать страницу с общими товарами, то она будет очень и очень долго грузится и это сразу слив позиций, поведенческих и прочее.


Как тогда правильнее с точки зрения ранжирования и выдачи для поисковой системы Яндекс делать чтобы в выдаче была каноническая страница (первая) и чтобы без ущерба и потери уровня в ранжировании?
Андрей Петров
9 октября 2019, 07:23
Компания работает в нескольких регионах, для этого сделали сайты на поддоменах spb.site.ru, nsk.site.ru и ещё 3 региона, основной домен присвоен к региону Москва. (Товарный запас в разных регионах разный, условия доставки, цены и тд различаются) Поддомены сделаны, что бы можно было полноценно использовать системы коллтрекинга, метрику и тд для каждого региона в отдельности.


Вопрос о мобильной версии сайта и её региональной принадлежности, мы хотим сделать её на поддомене m.site.ru . Это отдельная версия специально для моб. устройств, очень легкая , без лишнего контента, без лишних скриптов и тд. Адаптивную верстку не предлагать ;) - это плохое решение, т.к скорость загрузки и удобство моб. версии важное преимущество перед конкурентами в нашем сегменте.


Сам вопрос. Можем ли мы версии m.site.ru присвоить все те регионы, которые у нас есть, что бы в моб. поисковой выдаче присутствовать в этих регионах ?
(например 1: по геоданным отображаем на m.site.ru контент для этого региона.
Например 2: смотрим юзерагент, видим, что с айфона и с версии spb.site.ru перенаправляем на m.site.ru c контентом для данного региона).
Или есть другое решение, более простое. Надеюсь нам не придется на кануне 2020 года дополнительно делать m.spb.site.ru m.nsk.site.ru. Для нас важно что бы мы могли использовать динамический коллтрекинг в каждом регионе и разные системы аналитики .


И второй вопрос.
В каждом разделе и у каждого товара есть текстовое описание, которое не меняется в зависимости от региона (точнее если в описании есть название города, то его мы меняем естественно), но потреб. свойства товара, его характеристики и тд делать уникальными не реально. Яндекс не сочтет страницы одного и того же товара на разных поддоменах дублями? 
Подскажите пожалуйста! Как я понял  директиву Sitemap с адресом актуального файла sitemap нужно закрыть "Disallow: https://сайт/sitemap.xml" ?
director@bspartner.ru
28 апреля 2020, 11:00
Подскажите пожалуйста, по какой причине файл robots.txt попал в список исключенных страниц, со статусом некачественная страница. Как такое возможно?  
6. Что нужно добавить в robots.txt ? - служебные каталоги с конфиденциальными документами (адреса доставки, контактные телефоны)

Ну и как вы телефоны внесёте в robots.txt????
Сами поняли, что написали?

Обратил внимание на то, что страницы пагинации часто попадают в индекс, даже не смотря на настройку rel="canonical" на родительскую категорию. И это многих сайтов так. И сейчас раздумываю над тем, чтобы вовсе убрать пагинацию для интернет-магазина, с которым работаю. А вместо пагинации сделать подгрузку товаров по нажатию кнопки "Показать ещё". Это же не будет ошибкой с точки зрения поисковых систем?

Насколько я понимаю, пагинация нужна для улучшения индексации карточек товара. Но в нашем магазине создано множество категорий с разными параметрами по цвету, бренду, серии и т.д. И как раз через эти категории поисковые системы могут находить товары.

И в таком случае, думаю, лучше вообще убрать страницы пагинации и оставить подгрузку товаров при прокрутке вниз страницы. У нас на сайте может быть более 1000 страниц пагинации, и многие из них случайно попадают всё равно в индекс. Видимо поисковики не всегда замечают rel="canonical". А такое кол-во дублей сайту тоже ни к чему.

В общем, вопрос короткий) Не будет ли это негативным фактором для поисковых систем, если вообще убрать пагинацию и оставить там только подгрузку товаров?)) Это всё, в чём я хочу убедиться))
Обновлено 16 декабря 2020, 13:59
v.pokunevich@pixelplus.ru
11 января 2023, 12:27
Дмитрий К.,
, убрав ссылки на страницы пагинации, Вы можете навредить индексации страниц товаров, которые находятся в каталоге. Нужно одновременно настроить грамотную внутреннюю перелинковку, чтобы бот смог находить новые товары.
Чтобы избавиться от страниц пагинации в индексе и оставить ссылки на товары доступными боту можно:
1. Оставить каноникал
2. Вывести на страницах пагинации в head тег <meta name="robots" content="noindex,follow">
Таким образом бот будет переходить по ссылкам на страницах пагинации, но сами страницы пагинации в индекс добавлять не будет.
Но я бы рекомендовал оставить каноникал и не закрывать страницы пагинации от индексации. Эти страницы не наносят вред сайту.
Василий Матюшин
7 января 2021, 15:54
пургу пронесли тут полностью с адресами сайтами

Изменилось что-то за 6 лет или рекомендации все те же?
cooliqanton,
Изменилось одно, забили на ответы на комментарии)
Насколько актуален этот материал? Вы пишите "Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel="canonical" тега <link> на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими" -- и этой рекомендацией все пользуются (кроме меня - и я спорю об этом в дискуссиях).
Как может быть "контент во многом идентичен" у 1й и 7й страницы паганации в принципе?
+ 18 августа вы пишете "Если GET-параметр влияет на содержание страницы — это не дубль" https://webmaster.yandex.ru/blog/kak-nayti-dubli-stranits-s-neznachaschimi-get-parametrami?from=email
Так разве 7я страница пагинации не уникальна, разве содержание 1-й и 7й страницы одинаковое?
Ребята! Что у вас происходит с каноническими страницами? Это просто кошмар! У меня каталог на 20 тысяч товаров, из которых 3 тысячи -- это уникальные товары, а остальные 17 тысяч -- цвета и разновидности главных товаров. Я по дурости все цвета год назад разметил тегом canonical с указанием на главный товар, и что я вижу сейчас? Главные товары, которые содержат в себе фотографии, видео с youtube, описание и пр. не индексируются, а индексируются цвета. Главные товары при этом выкидываются из индекса с примечанием "маловостребованная страница". Главные страницы категорий (каталога) товаров, которые содержат описания категорий и видео не индексируются. Вместо них зачем-то индексируются СТРАНИЦЫ каталога ?page=2, ?page=3, хотя они размечены CANONICAL с указанием на главную страницу категорий.


У меня только один вопрос: ЗАЧЕМ (это лишь политкорректный синоним того, что у меня на уме)? Мне пришлось убрать CANONICAL вообще с сайта и заменить его элементом NOINDEX, чтобы в поиск вместо цветов попадали главные карточки товаров. Но я не могу ничего поделать с пагинацией, я её не могу запретить NOINDEX-ом, мне нужно, чтобы Яндекс и Гугл боты проходили вглубь каталога, хотя у меня и карта сайта есть (но из него ничего не берётся, вместо этого берутся неканонические страницы, которых там нет).


С января месяца и по сегодняшний день я занят удалением этих дублей, благодаря которым робот захлёбывается и не может нормально обновлять изменения на сайте. Даже несмотря на то, что я уже отказался от каноникала, робот добавляет в индекс страницы, которые посетил ещё в сентябре. Головная боль -- удалять всё это вручную.


Если Google не включает в базу неканонические страницы, вы зачем-то включаете. ЗАЧЕМ? Вы думаете, вашим алгоритмам виднее, что выдавать пользователю: главную страницу категории или же её 150-ю страницу? Завтра я удалю часть товаров, и 150-я страница будет выдавать ошибку. Пожалуйста, исправьте ваши алгоритмы, CANONICAL -- прекрасный инструмент, с помощью которого можно мягко регулировать индексацию, но благодаря вам этим инструментом пользоваться совершенно невозможно. Такое впечатление, что ваши алгоритмы разработаны против того, что в мире считается общепризнанным.
Обновлено 29 января 2022, 11:32