Сюжеты в Яндекс.Новостях

Сюжет в Яндекс.Новостях — это подборка новостных сообщений, посвященных одному событию. Сюжеты формируются автоматически, путем определения текстового сходства сообщений.

Как ранжируются сюжеты

Все сюжеты в Яндекс.Новостях сортируются по важности. Учитываются в первую очередь актуальность и количество сообщений в сюжете. Алгоритмы анализа и ранжирования данных — оригинальная разработка Яндекса.

Как отображаются сюжеты

На первой странице сюжета отображается заголовок, краткое описание события и список ссылок на сообщения, из которых можно узнать подробности произошедшего.

Заголовком сюжета становится заголовок одного из сообщений, попавших в сюжет. Выбор заголовка происходит автоматически. Критериями оценки заголовков являются актуальность, информативность и читабельность.

Фрагмент текста, который используется для краткого описания новости, выделяется специальным алгоритмом из текста сообщения, заголовок которого стал заголовком сюжета. В этом фрагменте должны быть упомянуты наиболее значимые для понимания события факты — имена людей, названия организаций, географические объекты, даты и числа.

Сообщения на первой странице сюжета по умолчанию отсортированы по времени: более свежие расположены вверху. При прочих равных материалы с Турбо-страницами могут показываться выше.

Сюжет иллюстрируется фотографиями и видео, ссылки с которых ведут на новостные сообщения, использующие указанные материалы.

Как выбираются сообщения для показа на первой странице сюжета

На первую страницу сюжета выводятся сообщения с максимальным весом, упорядоченные по времени публикации. На вес сообщения влияют его цитируемость в других материалах, вошедших в сюжет, и вес источника. Все остальные сообщения, которые относятся к сюжету, доступны по ссылке Все источники.

Вес источника определяется на основе трех показателей:

  • Оперативность — показатель того, насколько быстро источник реагирует на то или иное событие. Чем раньше источник сообщает о событии, тем выше оперативность этого сообщения. На этот показатель также влияет вес других источников: если сообщение опубликовано раньше сообщения от более весомого издания, его оперативность будет еще выше.
  • Цитируемость — определяется количеством ссылок на данный источник во всех сообщениях других источников за последний месяц и весом цитирующих источников (чем весомее процитировавший источник, тем выше показатель цитируемости). Учитываются как гиперссылки, так и текстовые упоминания с точностью до синонимичных названий.
  • Вовлеченность аудитории — зависит от доли собственной аудитории сайта-партнера — количества пользователей, которые приходят на сайт из поиска или по прямой ссылке. Такие читатели, как правило, задерживаются на сайте, чтобы изучить его материалы, и готовы возвращаться туда снова. Для определения вовлеченности анализируются навигационные запросы в Яндекс.Поиске и переходы на сайты партнеров в Яндекс.Браузере.

Вес источника автоматически пересчитывается каждую неделю.

Почему заголовок сюжета может измениться

Заголовком сюжета становится заголовок одного из новостных сообщений, попавших в сюжет.

Заголовок сюжета может измениться, если на сайте-источнике заголовок новости был обновлен, сама новость была удалена или в сюжете появилась новость с более информативным заголовком.

Персонализация ссылок в сюжете

На странице сюжета находится большое количество ссылок на новостные ресурсы. Чтобы сэкономить время пользователя и сделать подборку сообщений полезнее, ссылки в сюжете могут быть выбраны с учетом предпочтений пользователя. Если в сюжете среди источников есть СМИ, сайт которого пользователь посещает чаще всего (переходит по ссылкам из Яндекс.Новостей), сообщение от этого СМИ, скорее всего, попадет на первую страницу сюжета.

Персонализация выполняется на основе обезличенных данных с помощью автоматических алгоритмов Яндекс.Новостей.

Настройки персонализации

Первоисточник сообщений в сюжете

Первоисточник — это материал, который стал отправной точкой для создания новостей. Например, первоисточником для новостей о научном открытии может быть пресс-релиз лаборатории, где было сделано это открытие, а для новостей о падении метеорита — фотография этого события в социальной сети.

Зная первоисточник, вы можете проследить, кто первый опубликовал материал и откуда началось распространение новости, а также увидеть сообщение, которое цитируют и анализируют новостные агентства.

С помощью алгоритмов машинного обучения Яндекс.Новости могут автоматически определять сюжеты, для понимания которых важен первоисточник, и находить его в интернете. При поиске первоисточника учитывается, насколько материал соответствует сюжету, а также время его появления и авторитетность ссылающихся на него СМИ.

Информация о первоисточнике и ссылка на исходный материал представлены в блоке C чего всё началось.

Ограничение. Блок C чего всё началось отображается только для сюжетов, для которых удалось найти первоисточник с помощью алгоритмов Яндекса.

Цитата в сюжете

Цитата — это блок, который показывает наиболее часто встречающееся высказывание о событии. Отображается под аннотацией сюжета.

Если в большинстве материалов упоминается одно и то же высказывание, алгоритм автоматически выделяет его, сопроводив именем и фамилией автора, а также ссылкой на сайт источника, на котором можно прочесть весь текст материала.

Ссылку на материал также выбирает алгоритм. Он ищет в материалах сюжета наиболее полное высказывание и при прочих равных условиях отдает предпочтение наиболее весомому источнику.

В качестве цитаты используются высказывания:

  • оформленные как прямая речь в кавычках;
  • с указанием имени и фамилии автора;
  • небольшие по размеру (2-3 предложения).

Тема

Связанные по смыслу сюжеты объединяются в тему. Такие сюжеты могут рассказывать о развитии события или о похожих новостях.

Сюжеты, связанные общей темой, отображаются в блоке Ещё по теме. Заголовки ранжируются по близости к сюжету, на странице которого находится блок.

Общее количество сообщений по теме показывается в карточке сюжета:

  • на главной странице Яндекс.Новостей;
  • в разделах сервиса;
  • на странице сюжета — в подборках справа от ленты новостей.