Технические требования
Экспорт данных для размещения заголовков и аннотаций новостей на yandex.ru (в том числе на сайте Яндекс.Новости) осуществляется в XML-based формате RSS 2.0.
Описание элементов RSS 2.0
Корневым элементом RSS-файла является rss
, атрибут version
которого должен иметь значение 2.0.
<rss
xmlns:yandex="http://news.yandex.ru"
xmlns:media="http://search.yahoo.com/mrss/"
version="2.0">
...
</rss>
Внутри элемента rss
содержится элемент channel
, который включает информацию об источнике и его содержание.
Информация о сайте-источнике
Сведения передаются в элементе channel
.
Элемент | Описание |
---|---|
title | Название RSS-канала. Если экспортируется содержание целого сайта, укажите название сайта. Если экспортируются раздел сайта, укажите название сайта и раздела через двоеточие. Примечание. На yandex.ru название RSS-канала не показывается, экспортируемые данные маркируются тем названием источника, которое было указано в анкете при подключении к сервису Яндекс.Новости. |
link | Домен сайта, данные которого транслируются. |
description | Описание канала одним предложением. Не используйте HTML-разметку. |
language | Язык статьи по стандарту ISO 639-1. |
item * | Информация о странице и ее содержимом. Каждый Для передачи новостных сообщений в
|
Элемент | Описание |
---|---|
title | Название RSS-канала. Если экспортируется содержание целого сайта, укажите название сайта. Если экспортируются раздел сайта, укажите название сайта и раздела через двоеточие. Примечание. На yandex.ru название RSS-канала не показывается, экспортируемые данные маркируются тем названием источника, которое было указано в анкете при подключении к сервису Яндекс.Новости. |
link | Домен сайта, данные которого транслируются. |
description | Описание канала одним предложением. Не используйте HTML-разметку. |
language | Язык статьи по стандарту ISO 639-1. |
item * | Информация о странице и ее содержимом. Каждый Для передачи новостных сообщений в
|
* Обязательный элемент.
Информация о сообщении
Данные передаются в элементе item
.
Элемент | Описание |
---|---|
title * | Заголовок сообщения. Элемент Максимальная длина заголовка — 200 символов. Запрещено:
|
link * | URL страницы-источника. Требования:
|
pubDate * | Время публикации сообщения на сайте источника. Передается в формате RFC-822. Время, указанное в экспортном файле, должно совпадать с фактическим временем публикации на сайте. Актуальными считаются сообщения за последние 8 дней. Остальные проиндексированы не будут. |
author | Автор сообщения. |
yandex:full-text * | Текст новости. Элемент В элементе
|
pdalink | Ссылка на версию сообщения, адаптированную для мобильных устройств. Чтобы мобильная версия сообщения была доступна на https://m.news.yandex.ru/, передайте в элементе pdalink ссылку на соответствующее сообщение в мобильной версии сайта источника.
|
amplink | Ссылка на AMP-версию сообщения. Ссылки на страницы в формате AMP, если они присутствуют в вашем экспортном файле, будут использоваться в версии Яндекс.Новостей для устройств с тачскрином вместо ссылок на обыкновенные мобильные и адаптивные страницы. Чтобы передавать AMP-версии новостей, укажите в элементе |
description | Краткое описание сообщения (аннотация, лид). Не используйте HTML-разметку. |
yandex:genre | Жанр сообщения. Указывается латиницей:
|
category | Рубрика (раздел, категория). Указывается оригинальное (как в издании) название рубрики, в которой опубликовано сообщение. Одному сообщению может соответствовать только одна рубрика. Внимание. Об изменении рубрикации издания или о добавлении в экспортный файл материалов новых рубрик необходимо сообщать по адресу info@news.yandex.ru. Иначе сообщения, относящиеся к ранее не существовавшим или переименованным рубрикам издания, проиндексированы не будут. |
enclosure | Иллюстрации, аудио и видеофайлы. В одном элементе указывается ссылка на одну иллюстрацию, аудио или видеофайл. Если в сообщении содержится несколько иллюстраций, или иллюстрация и видеофайл, используйте несколько элементов Требования к иллюстрациям:
Для изображений параметр |
media:group | Группа связанных медиаобъектов. Можно указать любое количество элементов Элемент
В
Внимание. Элемент media:group обязательно должен содержать media:thumbnail , а также хотя бы один элемент media:content либо media:player . Использовать все три элемента не требуется. |
yandex:theme_tags | Признак сообщения, относящегося к теме на сайте партнера. В качестве значения должен быть указан произвольный идентификатор события, продублированный в JSON-файле с темами. |
yandex:official-comment | Официальный комментарий
|
Элемент | Описание |
---|---|
title * | Заголовок сообщения. Элемент Максимальная длина заголовка — 200 символов. Запрещено:
|
link * | URL страницы-источника. Требования:
|
pubDate * | Время публикации сообщения на сайте источника. Передается в формате RFC-822. Время, указанное в экспортном файле, должно совпадать с фактическим временем публикации на сайте. Актуальными считаются сообщения за последние 8 дней. Остальные проиндексированы не будут. |
author | Автор сообщения. |
yandex:full-text * | Текст новости. Элемент В элементе
|
pdalink | Ссылка на версию сообщения, адаптированную для мобильных устройств. Чтобы мобильная версия сообщения была доступна на https://m.news.yandex.ru/, передайте в элементе pdalink ссылку на соответствующее сообщение в мобильной версии сайта источника.
|
amplink | Ссылка на AMP-версию сообщения. Ссылки на страницы в формате AMP, если они присутствуют в вашем экспортном файле, будут использоваться в версии Яндекс.Новостей для устройств с тачскрином вместо ссылок на обыкновенные мобильные и адаптивные страницы. Чтобы передавать AMP-версии новостей, укажите в элементе |
description | Краткое описание сообщения (аннотация, лид). Не используйте HTML-разметку. |
yandex:genre | Жанр сообщения. Указывается латиницей:
|
category | Рубрика (раздел, категория). Указывается оригинальное (как в издании) название рубрики, в которой опубликовано сообщение. Одному сообщению может соответствовать только одна рубрика. Внимание. Об изменении рубрикации издания или о добавлении в экспортный файл материалов новых рубрик необходимо сообщать по адресу info@news.yandex.ru. Иначе сообщения, относящиеся к ранее не существовавшим или переименованным рубрикам издания, проиндексированы не будут. |
enclosure | Иллюстрации, аудио и видеофайлы. В одном элементе указывается ссылка на одну иллюстрацию, аудио или видеофайл. Если в сообщении содержится несколько иллюстраций, или иллюстрация и видеофайл, используйте несколько элементов Требования к иллюстрациям:
Для изображений параметр |
media:group | Группа связанных медиаобъектов. Можно указать любое количество элементов Элемент
В
Внимание. Элемент media:group обязательно должен содержать media:thumbnail , а также хотя бы один элемент media:content либо media:player . Использовать все три элемента не требуется. |
yandex:theme_tags | Признак сообщения, относящегося к теме на сайте партнера. В качестве значения должен быть указан произвольный идентификатор события, продублированный в JSON-файле с темами. |
yandex:official-comment | Официальный комментарий
|
* Обязательный элемент.
Турбо-страницы
Передача информации о Турбо-страницах сайта производится через Яндекс.Вебмастер. Подробнее
Новостная тема
Если на вашем сайте реализовано объединение новостей по событиям, вы можете участвовать в формировании новостной темы. Для этого:
- Создайте отдельный экспортный файл в формате JSON с описанием ваших тем.
[ { "url": "http://www.interfax.ru/story/301", "name": "ПМЭФ-2018", "description": "XXII Петербургский международный экономический форум в 2018 году пройдет с 24 по 26 мая, его тема - 'Создавая экономику доверия'.", "tag": "story-301" } ]
- Отправьте ссылку на полученный файл через форму обратной связи.
- В экспортном файле, который вы уже передаете в Яндекс.Новости, в элемент
item
сообщения, относящегося к определенной теме, добавьте элементyandex:theme_tags
. В качестве значения элементаyandex:theme_tags
укажите значение соответствующего элементаtag
из JSON-файла.В одном
item
можно использовать несколько элементовyandex:theme_tags
.
Требования к заголовку и аннотации темы
При формировании темы алгоритм отдает предпочтение таким заголовкам и аннотациям, в которых максимально полно, точно и нейтрально описана суть события. В частности, в описании темы:
- указано где, что и когда произошло (точная дата или месяц и год);
- отсутствуют отсылки на подробную информацию о событии (Все новости о ... — в нашем специальном сюжете, Подробнее смотрите в нашей спецрубрике и т. п.).
Рекомендованная длина заголовка — до 40 знаков с пробелами, аннотации — до 350 знаков с пробелами. Заголовок и аннотация могут быть больше, но при прочих равных условиях алгоритм выбора заголовка и аннотации учитывает соответствие рекомендованным значениям.
Видео в сюжетах
Если у вас есть собственное или лицензированное для ретрансляции видео, которое размещается на вашем сайте, его можно показывать в сюжетах Яндекс.Новостей. В таком видео проигрывается реклама участников Рекламной сети Яндекса (РСЯ), доходами от которой Яндекс делится по модели revenue share.
Чтобы показывать видео в сюжетах, добавьте ссылки на видеоролики в формате MP4 в экспортный файл для Яндекс.Новостей. Если у вас нет возможности передавать ссылки на MP4-файлы, видео можно загрузить через партнерский интерфейс сервиса Яндекс.Видеохостинг и указать в экспортном файле ссылки на плеер с загруженными роликами.
- Разместите ссылки на видео к новостям в вашем экспортном файле для Яндекс.Новостей, указав их в элементах
media:content
внутри элементаmedia:group
. Ссылки должны вести на видеофайлы в формате MP4, а не на страницы с ними и не на плеер. Если в ссылке нет явно указанного расширения файла, используйте атрибутtype
и пропишите тип файла в нем.<media:group> <media:content url="ссылка на видеофайл в формате .mp4 на вашем сайте" type="video/mp4"/> <media:thumbnail url="ссылка на иллюстрацию, которая должна быть использована в качестве preview"/> </media:group>
- Примите оферту Рекламной сети Яндекса.
- Напишите нам на адрес info@news.yandex.ru. В письме укажите логин, под которым ваш сайт зарегистрирован в РСЯ.
- Запросите доступ к партнерскому интерфейсу Яндекс.Видеохостинга. Для этого отправьте на адрес info@news.yandex.ru ваш логин от аккаунта на Яндексе и укажите, что доступ к Видеохостингу нужен для загрузки видео.
- В результате загрузки вы получите ссылки на плеер с вашими роликами. Для каждого видео сформируется отдельная ссылка. Укажите их в экспортном файле для Яндекс.Новостей в элементах
media:player
внутри элементовmedia:group
.<media:group> <media:player url="ссылка вида https://frontend.vh.yandex.ru/player/..."> </media:player> <media:thumbnail url="ссылка на иллюстрацию, которая должна быть использована в качестве preview"> </media:thumbnail> </media:group>
- Примите оферту Рекламной сети Яндекса.
- Напишите нам на адрес info@news.yandex.ru. В письме укажите логин, под которым ваш сайт зарегистрирован в РСЯ.
Требования к качеству видео
- Видео соответствует содержанию новости. В элементе
media:group
должно быть только видео, непосредственно относящееся к событию, описываемому в заголовке и тексте новости. Даже если видео не соответствует событию напрямую, но в целом имеет отношение к общей теме новости, — его не нужно отправлять в элементеmedia:group
для этой новости. - Не нарушает авторские права. Партнер должен гарантировать, что обладает правами на передачу видеоконтента новостному агрегатору.
- Не содержит стороннюю рекламу. Экспортируемое видео не должно содержать встроенную рекламу.
- Заставка канала занимает не более 1 секунды. Наличие в видеоролике заставки канала допускается, но его длина должна быть не больше 1 секунды.
- Титры в аудиозаписях. Если ролик представляет собой аудиозапись интервью или комментария эксперта, он должен сопровождаться титрами.
- Видео должно нести дополнительную ценность пользователю. Не рекомендуется отправлять:
- Видео, которое в основном состоит из подборки фотографий или коротких видео из фото- и видеостоков с титрами (слайд-шоу).
- Видео, в котором ведущий просто зачитывает текст новости и где нет какой-либо дополнительной полезной информации (кадров с места события, комментариев очевидцев и т. д.).
В случае систематического нарушения требований, партнер может быть лишен возможности загрузки видео на сервис, пока не исправит качество.
Символы и кодировки
В экспортном файле укажите кодировку, отдаваемую вашим сервером. Наиболее часто используются: UTF-8, Windows-1251, KOI8-R.
Во всех элементах channel
и item
необходимо кодировать следующие символы:
Символ | Название | Код замены |
---|---|---|
& | Амперсанд | & |
> | Правая угловая скобка | > |
< | Левая угловая скобка | < |
" | Знак кавычек | " |
' | Апостроф | ' |
Символ | Название | Код замены |
---|---|---|
& | Амперсанд | & |
> | Правая угловая скобка | > |
< | Левая угловая скобка | < |
" | Знак кавычек | " |
' | Апостроф | ' |
Например, ссылка http://some.host.ru/?id=1&page=10 должна быть приведена к виду http://some.host.ru/?id=1&page=10.
Если RSS-файл передается в KOI8-R, необходимо также заменить встречающиеся в тексте символы кодировки Windows-1251 на аналоги из KOI8-R:
Символ | Название | Код замены |
---|---|---|
... | Многоточие | 133 |
– | Короткое тире (en-dash) | 150 |
— | Длинное тире (em-dash) | 151 |
' ' | «Сглаженные» апострофы | 145 и 146 |
" " | «Сглаженные» кавычки — «лапки» | 147 и 148 |
«» | Кавычки «ёлочки» | 171 и 187 |
№ | Номер | 185 |
Символ | Название | Код замены |
---|---|---|
... | Многоточие | 133 |
– | Короткое тире (en-dash) | 150 |
— | Длинное тире (em-dash) | 151 |
' ' | «Сглаженные» апострофы | 145 и 146 |
" " | «Сглаженные» кавычки — «лапки» | 147 и 148 |
«» | Кавычки «ёлочки» | 171 и 187 |
№ | Номер | 185 |
Механизм экспорта данных
Чтобы передавать информацию о новостных сообщениях, разместите RSS-файл на сервере вашего сайта и обновляйте его с необходимой периодичностью (например, файл может пополняться в течение дня и перезаписываться утром). Робот скачивает файл каждые две минуты.
Чтобы робот Яндекса (Yandex или YandexNews) проиндексировал данные, откройте для него (или, по крайней мере, не закрывайте) доступ к RSS-файлу и страницам сайта, ссылки на которые в файле передаются. Прописывать отдельно доступ к каждой странице сайта не нужно. Достаточно, чтобы доступ к разделу с этими страницами либо к URL с определенным паттерном не был запрещен.
Вы также можете задать параметры индексирования данных, указав поддерживаемые роботом Яндекса директивы в файле robots.txt.
User-agent: YandexNews
Allow: путь до экспортного файла без имени хоста (например, /file.rss)
...
#последняя строка должна быть пустой
Проверить корректность добавления строк можно в Яндекс.Вебмастере.
Если вы используете в robots.txt директиву Crawl-delay, укажите ее для робота YandexNews отдельно.
User-agent: YandexNews
Allow: /file.rss
Crawl-delay: 0.1
...
#последняя строка должна быть пустой
Пример экспортного файла
<?xml version="1.0" encoding="windows-1251"?>
<rss
xmlns:yandex="http://news.yandex.ru"
xmlns:media="http://search.yahoo.com/mrss/"
version="2.0">
<channel>
<title>Российские новости</title>
<link>http://www.rossiyskie-novosti.ru/</link>
<description>Ежедневная московская газета</description>
<item>
<title>Яндекс ищет на президентском сайте</title>
<link>http://www.rossiyskie-novosti.ru/2003/03/25/yandex.html</link>
<pdalink>http://www.m.rossiyskie-novosti.ru/2003/03/25/yandex.html</pdalink>
<description>Яndex.Site установлен на сайте президента</description>
<author>Иван Петров</author>
<category>Технологии</category>
<enclosure
url="http://www.rossiyskie-novosti.ru/2003/03/25/yandex.jpg"
type="image/jpeg"/>
<media:group>
<media:content
url="http://www.rossiyskie-novosti.ru/video/100237"
type="video/x-ms-asf"/>
<media:thumbnail
url="http://www.rossiyskie-novosti.ru/2003/03/25/yandex1.jpg"
type="image/jpeg"/>
</media:group>
<pubDate>Sun, 29 Sep 2002 19:59:01 +0300</pubDate>
<yandex:genre>message</yandex:genre>
<yandex:full-text>Для поиска по сайту www.kremlin.ru выбрана программа Яndex.Site.
Этот программный продукт был исследован провайдером президентского сайта —
Федеральным агентством правительственной связи и информации. ФАПСИ сочло
возможным использование поисковой системы <Яндекса> на www.kremlin.ru.
По результатам исследования программа была скомпилирована, протестирована и
установлена на сайт.</yandex:full-text>
</item>
</channel>
</rss>