Любой вебмастер хорошо знаком с HTML-разметкой. Обычно HTML-теги указывают браузеру, как отображать информацию, заключенную в тег. Например, тег <h1>Аватар</h1> означает, что строку «Аватар» следует отображать в формате заголовка первого уровня. Однако HTML-тег не предоставляет никакой информации о смысловом значении этой строки: «Аватар» может относиться к чрезвычайно успешному 3D-фильму или к картинке в пользовательском профиле. Это усложняет поисковым системам задачу нахождения информации, адекватной запросу пользователя.
Schema.org предоставляет общедоступный словарь, с помощью которого вебмастера могут размечать страницы, так чтобы они были понятны самым распространенным поисковым системам: Яндексу, Google, Microsoft и Yahoo!.
Словарь schema.org применяется вместе с микроданными (формат microdata). Хотя долгосрочная цель заключается в расширении перечня поддерживаемых форматов семантической разметки, изначально используются именно микроданные. Данное руководство познакомит вас с микроданными и schema.org, и вы сразу же сможете добавлять разметку на страницы своих сайтов.
Как размечать контент с помощью микроданных
Для чего нужны микроданные
Содержание страниц вашего сайта понятно читающим их людям, однако поисковым системам сложно определить, о чем идет речь. Добавляя специальные теги к HTML-коду своих страниц, вы как бы говорите: «Эй, поисковая система, вот здесь описывается такой-то фильм (место, человек, видеоролик)». Тем самым вы помогаете поисковым системам и другим приложениям лучше понимать ваш контент и отображать его подходящим, полезным образом. Микроданные — набор тегов, появившийся в HTML5,— позволяют делать именно так.
itemscope и itemtype
Начнем с конкретного примера. Представим, что у нас есть страница о фильме «Аватар» — со ссылкой на трейлер, информацией о режиссере и т. п. HTML-код может выглядеть примерно так:
<div><h1>Аватар</h1><span>Режиссер: Джеймс Кэмерон (род. 16 августа 1954 г.)</span><span>Фантастика</span><ahref="../movies/avatar-theatrical-trailer.html">Трейлер</a></div>
В первую очередь необходимо указать, какая часть страницы посвящена непосредственно фильму «Аватар». Для этого добавим атрибут itemscope к HTML-тегу, в который заключена эта информация:
<divitemscope><h1>Аватар</h1><span>Режиссер: Джеймс Кэмерон (род. 16 августа 1954 г.)</span><span>Фантастика</span><ahref="../movies/avatar-theatrical-trailer.html">Трейлер</a></div>
Добавляя itemscope, мы тем самым обозначаем, что HTML-код, содержащийся в блоке <div>...</div>, описывает некоторую сущность.
Пока мы только объявили, что речь идет о какой-то сущности, но не сообщили, что это за сущность. Чтобы указать тип сущности, добавим атрибут itemtype сразу после itemscope.
<divitemscopeitemtype="http://schema.org/Movie"><h1>Аватар</h1><span>Режиссер: Джеймс Кэмерон (род. 16 августа 1954 г.)</span><span>Фантастика</span><ahref="../movies/avatar-theatrical-trailer.html">Трейлер</a></div>
Тем самым мы уточняем, что сущность, описание которой заключено в теге <div>, представляет собой фильм (тип Movie в иерархии типов schema.org). Названия типов имеют вид URL, в нашем случае http://schema.org/Movie.
itemprop
Какую дополнительную информацию о фильме «Аватар» можно предоставить поисковым системам? О фильме можно сообщить множество интересных сведений: актерский состав, режиссер, рейтинг. Чтобы отметить свойства сущности, используется атрибут itemprop. Например, чтобы указать режиссера фильма, добавим атрибут itemprop="director" к HTML-тегу, содержащему имя режиссера. (Полный список свойств, которые можно задать для фильма, приведен на странице http://schema.org/Movie.)
<divitemscopeitemtype="http://schema.org/Movie"><h1itemprop="name">Аватар</h1><span>Режиссер:
<spanitemprop="director">Джеймс Кэмерон</span>
(род. 16 августа 1954 г.)</span><spanitemprop="genre">Фантастика</span><ahref="../movies/avatar-theatrical-trailer.html"itemprop="trailer">Трейлер</a></div>
Обратите внимание, что мы добавили дополнительный тег <span>...</span>, чтобы привязать атрибут itemprop к соответствующему тексту на странице. Тег <span> не влияет на отображение страницы в браузере, поэтому его удобно использовать вместе с itemprop.
Теперь поисковые системы смогут понять не только то, что http://www.avatarmovie.com — это ссылка, но и то, что это ссылка на трейлер фантастического фильма «Аватар» режиссера Джеймса Кэмерона.
Вложенные сущности
Иногда значение свойства может само являться сущностью, с собственным набором свойств. Например, режиссер фильма может быть описан как сущность с типом Person, у которой есть свойства name (имя) и birthDate (дата рождения). Чтобы указать, что значение свойства представляет собой сущность, необходимо добавить атрибут itemscope сразу после соответствующего itemprop.
<divitemscopeitemtype="http://schema.org/Movie"><h1itemprop="name">Аватар</h1><divitemprop="director"itemscopeitemtype="http://schema.org/Person">Режиссер:
<spanitemprop="name">Джеймс Кэмерон</span>
(род. <spanitemprop="birthDate">16 августа 1954 г.</span>)
</div><spanitemprop="genre">Фантастика</span><ahref="../movies/avatar-theatrical-trailer.html"itemprop="trailer">Трейлер</a></div>
Как использовать словарь schema.org
Типы и свойства schema.org
Кроме типов Movie и Person, упомянутых в разделе Как размечать контент с помощью микроданных, schema.org описывает множество разнообразных типов сущностей, для каждого из которых определен набор свойств.
Наиболее обобщенный тип сущности — это Thing (нечто), у которого есть четыре свойства: name (название), description (описание), url (ссылка) и image (картинка). Более специализированные, частные типы имеют общие свойства с более универсальными. Например, Place (место) — частный случай Thing, а LocalBusiness (местная фирма) — частный случай Place. Частные типы наследуют свойства родительского типа. (Более того, тип LocalBusiness является и частным случаем Place, и частным случаем Organization, поэтому наследует свойства обоих родительских типов.)
Размечая страницы с помощью schema.org, придерживайтесь следующих рекомендаций:
Чем больше, тем лучше — за исключением скрытого текста. Чем больше контента вы разметите, тем лучше. Однако, как правило, следует размечать только контент, видимый посетителям сайта, но не содержимое скрытых тегов <div> и других скрытых элементов страницы.
Ожидаемые типы или текст. Просматривая типы schema.org, вы заметите, что у многих свойств есть так называемые ожидаемые типы. Это значит, что значение свойства может быть вложенной сущностью (см. раздел Вложенные сущности). Однако добавлять вложенную сущность не обязательно: приемлемо использовать просто текст или URL.
Также вместо ожидаемого типа можно использовать дочерний тип. Например, если для свойства указан ожидаемый тип Place, можно добавить вложенную сущность с типом LocalBusiness.
Использование свойства url. Одни страницы посвящены описанию только одной сущности. Например, персональная страница конкретного человека, которую можно разметить, используя тип сущности Person. Другие — целому ряду сущностей. Например, на сайте вашей компании есть список сотрудников, со ссылками на профиль каждого из них. Для таких агрегирующих страниц нужно разметить отдельно каждую сущность (в этом случае получится последовательность сущностей с типом Person) и добавить свойство url в ссылку на соответствующую страницу для каждой сущности, например:
Подобно тому, как браузер необходим для проверки изменений в верстке веб-страницы, а компилятор — для тестирования кода, разметку schema.org также следует тестировать. В интернете существует несколько инструментов, с помощью которых можно проверить корректность разметки и выявить ошибки: Валидатор микроразметки от Яндекса, Rich Snippets Testing Tool от Google, Structured Data Linter.
Однако в некоторых случаях роботу сложно однозначно интерпретировать свойство сущности. Этот раздел описывает, как добавить машиночитаемую версию информации в разметку страниц.
Даты, время и длительность: используйте тег <time> с атрибутом datetime
Не всегда роботам удается правильно понять дату и время. Например, «04/01/11» — это 11 января 2004 г., 4 января 2011 г. или 1 апреля 2011 г.? Чтобы однозначно задать дату, используйте тег <time> вместе с атрибутом datetime. Значение атрибута datetime — дата в формате YYYY-MM-DD. Следующий HTML-код точно определяет дату как 1 апреля 2011 г.:
<timedatetime="2011-04-01">04/01/11</time>
Время суток задается в формате hh:mm либо hh:mm:ss, с префиксом T. Время может быть указано вместе с датой:
Рассмотрим пример в контексте: HTML-код с информацией о концерте, который состоится 8 мая 2011 г. Разметка типа Event включает название события, описание и дату.
<divitemscopeitemtype="http://schema.org/Event"><divitemprop="name">Spinal Tap</div><spanitemprop="description">Одна из самых громких музыкальных групп всех времен воссоединится для незабываемого двухдневного шоу.</span> Концерт состоится
<timeitemprop="startDate"datetime="2011-05-08T19:30">8 мая в 19:30</time></div>
Длительность описывается аналогичным образом, с помощью тега <time> и атрибута datetime. Значение атрибута предваряется префиксом P (от англ. period). Например, указать в рецепте, что время приготовления составляет полтора часа, можно следующим образом:
<timeitemprop="cookTime"datetime="PT1H30M">1 ½ часа</time>
H обозначает количество часов, а M — количество минут.
Форматы даты, времени и длительности соответствуют стандарту ISO 8601.
Перечисления и ссылки на канонические страницы: используйте тег link с атрибутом href
Перечисления
Некоторые свойства имеют ограниченный набор возможных значений. Программисты называют их перечислениями. Например, интернет-магазин может использовать тип сущности Offer для подробного описания товарного предложения. Свойство availability (наличие) обычно имеет одно из нескольких возможных значений: In stock (в наличии), Out of stock (отсутствует), Pre-order (на заказ) и т. д. Значения перечисляемых свойств можно указывать в виде URL, аналогично типам сущностей schema.org.
Вот товарное предложение, размеченное как сущность типа Offer, с соответствующими свойствами:
<divitemscopeitemtype="http://schema.org/Offer"><spanitemprop="name">Blend-O-Matic</span><spanitemprop="price">$19.95</span><spanitemprop="availability">Уже в продаже!</span></div>
А вот то же самое предложение, размеченное с использованием <link> и href, что позволяет однозначно указать одно из допустимых значений свойства availability:
<divitemscopeitemtype="http://schema.org/Offer"><spanitemprop="name">Blend-O-Matic</span><spanitemprop="price">$19.95</span><linkitemprop="availability"href="http://schema.org/InStock"/>Уже в продаже!
</div>
Schema.org предоставляет список возможных значений для небольшого количества свойств — в тех случаях, когда у свойства есть ограниченный набор типичных значений. Так, возможные значения для свойства availability перечислены в ItemAvailability.
Ссылки на канонические страницы
Обычно ссылки создаются с помощью тега <a>. Например, следующая гиперссылка на страницу в Википедии для книги «Над пропастью во ржи»:
<divitemscopeitemtype="http://schema.org/Book"><spanitemprop="name">Над пропастью во ржи</span> Автор
<spanitemprop="author">Джером Сэлинджер</span><aitemprop="url"href="http://en.wikipedia.org/wiki/The_Catcher_in_the_Rye">Страница в Википедии</a></div>
Как видите, атрибут itemprop="url" можно использовать для ссылки на страницу другого сайта (в этом случае, Википедии), которая описывает ту же самую сущность. Ссылки на сторонние сайты помогают поисковым системам лучше понимать, о чем речь на вашей странице.
Если вы не желаете добавлять ссылку, видимую посетителям, используйте тег <link>, как показано ниже:
<divitemscopeitemtype="http://schema.org/Book"><spanitemprop="name">Над пропастью во ржи</span><linkitemprop="url"href="http://en.wikipedia.org/wiki/The_Catcher_in_the_Rye" /> Автор <spanitemprop="author">Джером Сэлинджер</span></div>
Недостающая или неявная информация: используйте тег <meta> с атрибутом content
Иногда важная информация не может быть размечена из-за способа ее отображения на странице. Например, информация представлена на рисунке (изображение рейтинга 4 звезды из 5) или во Flash-объекте (например, длительность видеоролика) либо она подразумевается, но не указана на странице в явном виде (например, валюта цены).
В таких случаях можно использовать тег <meta> с атрибутом content. В следующем примере картинка иллюстрирует рейтинг 4 звезды из 5:
Этим приемом не следует злоупотреблять. Используйте тег <meta> с атрибутом content только для той информации, которую невозможно разметить иным способом.
Расширение schema.org
Большинству сайтов и организаций не потребуется расширять schema.org. Тем не менее schema.org предусматривает возможность добавлять свойства и дочерние типы для имеющихся типов сущностей. Если вы заинтересованы в этом, ознакомьтесь с механизмом расширения schema.org.
Задайте вопрос Нейровебмастеру — в правом нижнем углу нажмите кнопку .
Если у вас остались вопросы:
Напишите в чат службы поддержки — в правом нижнем углу нажмите значок . Чат доступен ежедневно с 8:00 до 20:00 по московскому времени.
Заполните форму обратной связи ниже.
Написать в службу поддержки
Чтобы ваш вопрос быстрее попал к нужному специалисту, уточните тему:
Разметка формируется в течение двух недель. Если Яндекс не поддерживает какой-то из видов разметки на странице или в разметке ошибки, то просто пропускает ее.
Робот Яндекса сможет проиндексировать информацию с сайта и без разметки, на показ страниц в поиске это не повлияет. Чтобы задать желаемое описание страницы в результатах поиска, используйте метатег description.