Блог Яндекса для вебмастеров

Яндекс начинает поддерживать schema.org

1 ноября 2011, 15:12
Яндекс присоединяется к инициативе международной группы schema.org по поддержке единого стандарта семантической микроразметки.

Стандарт schema.org появился летом 2011 года усилиями поисковиков Bing, Google и Yahoo. Представители этих компаний сформировали рабочую группу, которая выработала основы единого стандарта и продолжает улучшать несколько сотен схем разметки для различных типов данных. С недавнего времени Яндекс принимает активное участие в работе этой группы.

Цель семантической разметки – дать возможность роботам узнать больше полезной информации из данных веб-страниц. С помощью специальных свойств html-тегов, описанных в коллекции разметки schema.org, можно указать, какое именно свойство объекта описывает размеченный участок текста и его контекст.

Специально обученные и подготовленные роботы (в частности, поисковых систем) распознают такую дополнительную разметку, чтобы в дальнейшем интерпретировать ее на благо пользователя. На текущий момент самый популярный вид использования семантической разметки поисковиками – создание специальных сниппетов на странице результатов поиска.

Теперь контент, размеченный вебмастерами с помощью schema.org, будет понятен сервисам Яндекса, в том числе и Поиску. Уже сейчас schema.org поддерживают такие сервисы, как Яндекс.Справочник, Яндекс.Словари, Яндекс.Картинки, Яндекс.Видео.  Благодаря schema.org в рамках проекта Яндекс.Видео стало возможным размечать более одного видеоролика на странице.  Данные из этих сервисов различными способами (например, в виде специальных сниппетов) используются в Поиске Яндекса. Более подробную информацию вы можете прочитать в нашей документации.

Мы считаем, что семантическая разметка страниц улучшает мировой интернет. Поэтому мы не только используем её в своих сервисах, но и сами размечаем их. Первым таким сервисом стал Мой Круг. На страницах профилей вы теперь также можете обнаружить разметку schema.org.

Роботы Яндекса, выучили схему
38 комментариев
Подписаться на комментарии к посту

А тогда hcard?

С помощью разметки schema.org вы можете передавать информацию идентично hcard. 

Но поддержку hcard мы тоже скоро возобновим.

Отличная новость!

Поддерживается все, что описано? Например, http://schema.org/AggregateOffer?

Когда этот стандарт, станет единым для всех? Какие проблемы могут возникнуть у владельцев сайтов?

Рулез! всем спасибо за новости, пойду обновлять сайты :-)

Это не может не радовать!

классно,  только опять всё через непонятно какое место делаете
что из http://schema.org/docs/full.html вы собираетесь поддерживать и в какой срок или как с микроформатами пойдёте своим путём? :)

Поделитесь, что именно сделано через непонятное место?

аха, бурундук в своем репертуаре ;-)

А будет ли в Яндексе инструмент для проверки разметки?

Спасибо, я имела в виду проверку разметки не только рецептов и пр, а, например, events (событий), хлебных крошек и других полезных фрагментов. 

Пока валидируются только используемые форматы. Подумаем над более поддержкой.

Над более полной :)

отличненько )

хорошое утро, хорошее начало 8)

А Яндекс.Маркет не планирует индексировать товры напрямую на сайте через эти стандарты как aльтернатива импорту XML ?

Пока нет.

Удалённый пользователь
2 ноября 2011, 14:09

Не поняла... Что это?

То есть раньше поисковики индексировали интернет и находили нужный контент. Теперь же они предпочитают, чтобы нужный контент им приносили на блюдечке с золотой каемочкой. А кто не знает как это делать, а просто пишет интересные статьи для людей - того в топку, слонам поискового бизнеса это не интересно. Правда, слоны забыли спросить у людей - что интересно им: хорошие статьи написанные профессионалами-журналистами, или статьи с дикой разметкой, написанные програмистами (в лучшем случае). Epic fail для поисковых систем в нынешнем виде, они расписались в собственном бессилии.

где почитать описание формата на русском, а еще лучше описание на
русском того что будет использовать яндекс, конечно очень хорошо если бы
это был официальный документ от яндекса.

заранее большое спасибо

В нашей документации: http://help.yandex.ru/webmaster/?id=1122752 :)

И мы будем её расширять.

Шилов Евгений
2 ноября 2011, 18:45

где взять документацию на русском??

Скажите, зачем нужен еще один стандарт, когда уже есть микроформаты? Или это не альтернатива микроформатам?

Словарь schema.org значительно шире и стремительно развивается. Если говорить про технологию микроданных, то она ещё и проще.

Отличная новость!


Решил разметить весь свой сайт микроформатом schema.org.

Проверяю валидатором яндекса http://webmaster.yandex.ru/microtest.xml

Cначала валидатор находил Организацию/адрес в формате, который я ранее использщовал - hcard, а также находил картинки в формате shcema.org.

Организацию я переразметил в на формате shcema.org. После этого валидатор ее перестал находить.

Это могла бы быть ошибка, но я паралельно проверяю разметку валидатором от гугла http://www.google.com/webmasters/tools/richsnippets

Валидатор гугла ошибкок не выдает и находит среди прочего  нужный объект

Item



Type: http://schema.org/organization

name ...

Уточните, пожалуйста, Ваш валидатор поддерживает проверку микроформата с данными об организации и адресе в формате shcema.org?  Или

поддерживаются только другие более старые форматы? Если поддержка формата есть, то в чем может быть причина того, что другой валидатор код принимает? Я знаю, что пока Яндекс не все данные shcema.org поддерживает. Но я спрашиваю именно о тех данных, поддержка, которых заявлена.

Еще по картинкам прохожу Валидацию и получаю такой ответ"

  • imageobject
    • contenturl = ...
    • caption = ...
    • description = ...
    • thumbnail = ...
ПРЕДУПРЕЖДЕНИЕ: класс thumbnail не следует располагать внутри contenturl

Как в этом случае понимать "не следует располагать". Это значит, что что-то не будет из определенных атрибутов использваться, или

это просто совет, а все будет работать?

Поясню, на какой код ругается валидатор.

У меня есть маленькая картинка (Thumb), по клику на которую, открывается полная картинка. Код такой.

Обойти вложенность здесь я не вижу возможности. Можно было бы воспользоваться за пределами ссылки тегом . Но скрытое объявление данных рекомендуют не использовать, советуют размечать видимые элементы. Как в таком случае быть. Почему здесь валидатор видит проблемы с вложенностью? И кстати альтернативный валидатор гугла не ругается на вложенность.

И конечно же в будущем хотелось увидеть поддержку от Яндекса более полный перечень типов данных shcema.org. Например очень удобно размечать служебные элементы страницы, хлебные крошки, информацию о товарах (название, артикул, описание, цена, картинка и т.п.) Я сразу   начал разметку делать по всем доступным мне типам данных shcema.org, потому что альтернативные поисковики уже сейчас много чего поддерживают, а дальше только больше будет. И надеюсь и Яндекс подтянется.

Спасибо!

 

У меня есть маленькая картинка (Thumb), по клику на которую, открывается полная картинка. Код такой.

 

Большой разницы в данном случае нет, но лучше использовать вариант с . 

 

По поводу проблемы с schema.org/organization. Пришлите, плз, урлы с разметкой.

Большой разницы в данном случае нет, но лучше использовать вариант с .

  Раз большой разницы нет, то в валидаторе я был бы рад увидеть "рекомендацию", а не "предупреждение". Вариант с использованием скрытых элементов (meta) не любит другой поисковик и заявляет, что такую информацию использует только в крайних случаях. Поэтому приходится что-то придумывать, чтобы всем поисковикам угодить.


По поводу проблемы с schema.org/organization. Пришлите, плз, урлы с разметкой.

http://www.algoritmsb.ru/ - проверяю этот url на микроразметку.

Альтернативный валидатор находит следующие элементы, относящиеся к адресу:

http://www.google.com/webmasters/tools/richsnippets?url=http://www.algoritmsb.ru/&view=

Item
Type: http://schema.org/organization
name = Алгоритм СБ
address = Item( 1 )
telephone = +7 (495) 626-56-79
telephone = +7 (495) 626-56-85
email = algoritm@algoritmsb.ru
employees = Item( 2 )
Item 1
Type: http://schema.org/postaladdress
postalcode = 119021
addresslocality = Москва
streetaddress = ул. Тимура Фрунзе, дом 20, подъезд 1, домофон 1, офис 1Item 2Type: http://schema.org/person
name = Галина
name = Александр
name = Андрей
name = Евгений 

А далее пример с разметкой не только адреса, а еще картинок, информации о товаре, хлебных крошек, элементов навигации и др.
(Яндекс поддерживает пока только картики и адрес из этого списка)

Исходная страница http://www.algoritmsb.ru/catalog/videonabludenie/videoregistratory/avermedia-averdigi-eh1004h-4-nano

Обнаруживаемые данные из микроформата schema.org - http://www.google.com/webmasters/tools/richsnippets?url=http://www.algoritmsb.ru/catalog/videonabludenie/videoregistratory/avermedia-averdigi-eh1004h-4-nano&view=

Валидатор Яндекса адрес на двух приведенных страницах не находит. (разметка адреса на приведенных страницах одинакова).
По второй ссылке Яндекс находит картинки.

Народ, приколись: мне "запрещены комментарии". То есть, писать про Яндекс можно только хорошо или никак. Как про покойника :)

Роботы Яндекса могли бы выучить схему годом раньше. Сколько денег вы потратили на вычисление семантических цепочек? А тут вдруг выяснилось, что достаточно было просто поддерживать html5/микроформаты schema.org. Скажите мне, кудескники, любимцы богов: и сколько бабла вы просрали?

Не нужно считать чужие деньги и время.

Посчитайте лучше сколько Вы "просрали"
денег на мороженное, когда могли бы еще в первом классе начать пить
водку. Или посчитайте, сколько Вам потребовалось времени на изучение
иностранного языка, когда Вы его могли уже выучить в четвертом классе
школы.

Да, Яндекс иногда отстает, от гугла по скорости внедрения
какого-либо сервиса. Но я думаю, что если бы у Вас были теже
возможности, что сейчас есть у Яндекса, то вряд ли бы Вы реализовалидаже
столько. А с учетом жесткой конкуренции результат мог бы быть совсем
плачевный.

Да, у иностранных компаний ресурсы намного больше, чем у
Яндекса сейчас. Многие компании совсем не смогли конкурировать с тем же
гуглом и вынуждены были прекратить свою деятельность. А часть из тех,
кто не прекратил, выглядят совсем слабо.

Я как вебмастер могу Вам
привести к примеру тот же BIng от Microsoft. Принадлежит крупной
компании, а сервис никакой. В их индексе содержится процентов 5-10 от
других поисковиков и при это страницы старые.... Больше года назая я
обновил вебсайт. Сейчас в индексе гугла ~1400страниц моего сайта, в
яндексе ~1200страниц, в yahoo 900, а в бинге около 200 и часть из этих
200 еще относится к страницам, которые были удалены больше года назад.
При этом я бингу через его средства для вебмастеров сообщал  о
sitemap.xml и вручную вводил ему адреса  (можно по десять страниц в день
в приоритетную индексацию добавлять), ничего не помагает -  либо не
хочет работать, либо не хватает ресурсов. В моем случае с мертовой точки
бинг сдвинулся месяца три назад. А до этого около года в бинге было не
более 100 страниц моего сайта.

В Яндексе радует то, что, он
несмотря на сложности, продолжает развиваться, старается не сильно
отставать, и не просто копирует чужой опыт, а еще и делает свои полезные
и удобные сервисы.

На майте более 2000 товаров!Если к каждому всё прописать с ума сойдёш...

Идёт всё к тому что-б с яшей денежками делиться!Иначе как???

 

Иначе очень просто.

Если движок для сайта нормальный и использует для вывода информации о товарах структурированные данные, то не имеет значение количество товаров. Например, один раз правится шаблон карточки товара на сайте, размечаются области страницы. И далее все товары уже выводятся с микроразметкой на странице.

Или Вы думаете, что амазон, ebay, HP  и т.д. в ручную каждому товару разметку делают? Уж у них то товаров на несколько порядков больше, чем 2000.

Что значит движок нормальный?!До того как разметкой не заморачивались,движок был нормальный!Теперь с модулями ковырятся.Допустим "webasyst shop-script" заплатил за него,а тут какая-то разметка появилас...Тоже самое с CMS joomla и т.д.

Получается опять деньги-деньги-деньги либо самому PHP учить.Время идёт,прибыли нет,снова платить :-|.Почему-бы великому яндексу под нужды дорогих пользователей не подстроится?Одна только разметка среди веб-мастеров создаст в общей сложности миллионный оборот средств.

Допустим один из вариантов,создать на серверах шаблоны разны движков:

1) Заходит робот.

2)Определяет движок.

3)Сопоставляет шаблон с движком и видит картинки,текст,описание и т.д в том порядке в каком Яндексу нужен.

Думаю в это стоит вкладывать финансы,а не придумывать разные проблемы. 

Я, как пользователь считаю, что Яндекс делает правильные шаги в это направлении.

Ещё если бы Яндекс позаботился, чтобы клиент мог быстрее попасть на удалённый

 сервер из переферии.

Яндексу цены не былобы.

SE

Я что-то не понял, что Вы хотите от Яндекса? Максимум они могут заниматься тем, чтобы их собственные сервера были легко доступны в том числе и удаленным пользователем. Или Вы хотите, чтобы они Вам оптику в дом привели и расширили чужие регионалные магистральные каналы? Или Вы хотите, чтобы пользователи из Москвы могли через яндекс быстрее попасть на удаленный сервер, расположенный в домашней сети в одном из домов Владивастока?

Вопросами быстрого доступа к удаленным серверам должны заниматься операторы связи Если какой-то сервер полючен к сети по модему и его страницы генирируются динамически, то ни Яндекс, никто другой не ускорит Вам доступ. Тоже самое, если пользователь подключен по низкоскоростному каналу.

Ещё если бы Яндекс позаботился, чтобы клиент мог быстрее попасть на удалённый

сервер из переферии.

Так и не понял: стоит ли сейчас переходить на schema.org - вижу бывают проблемы, а пока у меня валидатор ИМЕННО Организацию/адрес в формате - hcard воспринимает корректно. Будут ли оба формата поддерживаться?

Пожалуйста, включите поддержку http://schema.org/WebPage (если включена, то добавьте в валидатор)

Особенно буду очень рад видеть поддержку itemprop="breadcrumb"

 

И вопрос. Старый стандарт xmlns:v="http://rdf.data-vocabulary.org/#" поддерживается? 

После переноса itemprop'ов из мест где реально расположены данные в meta, валидатор говорит, что разметки на странице нет. Гугл видит.