Как устроены Яндекс.Новости

20 февраля 2014, 14:19

Яндекс.Новости — крупнейший в рунете агрегатор новостных сообщений. Каждый день этот сервис получает материалы от нескольких тысяч СМИ и автоматически формирует из них новостную картину дня. Это очень сложная задача: нужно структурировать огромное количество информации, выделить самое важное и предоставить результат читателям в понятном виде. Нас часто спрашивают, как работают Яндекс.Новости, и в этой публикации мы постараемся ответить на ваши вопросы. А если что-то забудем — спрашивайте в комментариях.

Главная и определяющая особенность Яндекс.Новостей — отсутствие человеческого вмешательства. У нас нет редакторов и модераторов. Мы не пишем собственных материалов, у нас нет «редакционной политики» и своей точки зрения. Мы не СМИ. Все новости мы получаем от партнёров. Их материалы Новости не публикуют у себя целиком, а используют только фрагменты сообщений и заголовки. На сегодняшний день у Яндекс.Новостей около 6000 партнёров. В среднем они выпускают более 110 тысяч сообщений в будний день.
 

Количество сообщений Яндекс.Новостей по месяцам в 2013 году


Всё, что вы видите на страницах Яндекс.Новостей, — это результат работы алгоритмов. Они должны показать читателю полную и беспристрастную картину дня, сложить её из тысяч новостных сообщений. Яндекс.Новости являются входной точкой в медиапространство. Их задача — донести до вас всё, о чём пишут СМИ, говорят по радио и по телевизору. Что читать и где — вы решаете сами.

Для удобства читателей алгоритмы Яндекс.Новостей объединяют сообщения разных СМИ об одном и том же событии в сюжеты. За каждым заголовком на главной странице Новостей находится сюжет. Кроме собственно сообщений сюжет содержит дополнительную информацию: карта места события, фото- и видеоматериалы, интервью и статьи по теме, список упомянутых людей и организаций, а также ссылки по теме. Таким образом, на странице сюжета вы можете быстро понять, что произошло, где это произошло, и как новость освещают разные СМИ.

Сообщения объединяются в сюжет с помощью алгоритма кластеризации. Сначала робот Новостей анализирует все сообщения от партнёров и выделяет в них ключевые слова и факты с помощью разработанной в Яндексе технологии извлечения фактов. Затем он сравнивает выделенное и группирует сообщения по сюжетам. После того как сообщения сюжета отобраны, их необходимо отранжировать, и это самый интересный этап работы.

Даже человеку сложно решить, какая из десятков, а иногда и сотен новостей об одном и том же событии интереснее и полнее. Что говорить о компьютере. Чтобы формализовать этот выбор, робот Яндекс.Новостей рассчитывает «вес» сообщения на основе трёх критериев:

• цитируемость (сколько ссылок на это сообщение в других сообщениях сюжета, без учёта ссылок в аффилированных СМИ и самоцитирования),
• свежесть (время публикации сообщения по сравнению с другими источниками),
• информативность (наполненность сообщения ключевыми фактами сюжета).

Почему критерии именно такие? Мы ориентируемся на ожидания читателей: информация должна быть актуальной, полной и достоверной. Актуальность и полноту робот измерить может, а с достоверностью помогает цитируемость. Этот параметр сродни индексу цитирования в научном мире. Он говорит о том, насколько сообщениям этого СМИ доверяют другие издания.

Из фрагментов трёх лучших по этим критериям сообщений формируется краткое описание сюжета (аннотация). Фрагменты сообщений в аннотации должны содержать основные факты: даты и числа, названия объектов и организаций, имена людей, часто цитируемые высказывания. Как правило, фрагменты подбираются таким образом, чтобы дополнять друг друга и дать читателю как можно более полную картину произошедшего.

По тому же принципу выбирается заголовок сюжета. Прочитав его, вы должны сразу понять, о чём речь, поэтому он должен наиболее полно отражать актуальную фактическую сторону сюжета и не содержать лишних слов.

Под аннотацией в сюжете расположены другие сообщения СМИ о событии. Из всех сообщений робот выбирает наиболее цитируемые и ранжирует их по свежести. Остальные новости в виде хронологической ленты можно увидеть по ссылке в конце списка новостей. Приблизительно каждые 20 минут в сюжет добавляются свежие новости.

Кроме параметров самого сообщения при ранжировании учитывается ещё один фактор — вес источника, то есть СМИ, опубликовавшего новость. Он зависит от двух показателей. Это цитируемость — количество ссылок на источник в сообщениях других СМИ за последние два месяца — и оперативность — показатель того, насколько быстро источник реагирует на то или иное событие. Эти показатели автоматически пересчитываются раз в неделю. К примеру, на момент публикации этого текста первая двадцатка СМИ по весу выглядела так (в алфавитном порядке): Агентство спортивных новостей «Р-Спорт», «Ведомости», «Газета.Ru», «Известия», «Интерфакс», ИТАР-ТАСС, «Коммерсант», «Комсомольская правда», НТВ, ПРАЙМ, РБК, РИА Новости, «Росбалт», «Российская газета», «Спорт-Экспресс», телеканал «Дождь», «Чемпионат.com», «Эхо Москвы», Lenta.ru, REGNUM.

Вес СМИ играет незначительную роль при ранжировании сообщений. Он помогает нам в другом — ранжировать сюжеты. Как внутри сюжетов выбираются основные сообщения, так и внутри Яндекс.Новостей выбираются основные сюжеты. Вес источника помогает роботу оценить важность события. Если о каком-то событии пишут многие СМИ с большим весом, оно с высокой вероятностью важнее того события, о котором пишут менее весомые издания. Из этих важных событий и складывается новостная картина дня.

Как отбираются новости для главной страницы Яндекса?
На главной странице Яндекса должны оказаться самые важные события — такие, которые попали на главные страницы авторитетных СМИ. Поэтому при выборе новостей для главной страницы учитывается много разных параметров: количество сообщений об этом событии, вес пишущих о нём источников, плотность потока сообщений в единицу времени, а также позиция новости на сайте источника. Таким образом, на главную страницу Яндекса с большей вероятностью попадут события, о которых много пишут и которые попали на главные страницы авторитетных СМИ.

Почему в топе слишком много негативных новостей?
Яндекс.Новости собирают и структурируют информацию автоматически, они являются зеркалом медиасреды. Другими словами, мы лишь отражаем то, о чём пишут СМИ.

Почему в Яндекс.Новостях появляются опечатки?
Мы не вмешиваемся в работу алгоритмов. Все сообщения наших партнёров попадают в Яндекс.Новости в том виде, в каком они были переданы. Мы не исправляем опечатки вручную, а информируем источник об ошибке.

P.S. Если у вас есть вопросы о работе Яндекс.Новостей, задавайте их в комментариях. Кроме того, скоро мы проведём семинар на тему «Как работают Яндекс.Новости» для всех заинтересованных представителей СМИ. Отправляйте ваши заявки на news@support.yandex.ru, на ближайший семинар мы пригласим первых 70 записавшихся.
 

Команда Яндекс.Новостей

135 комментариев
Подписаться на комментарии к посту
Интересная новость о Я.Новости...
А сделайте фильтрацию по грубым опечаткам в Новостях, чтобы ее можно было включить тем пользователям, которых опечатки журналистов бесят.
Плюсы:
1. Грамотные читатели будут рады.
2. Новостные сайты с криворукими писателями из-за падений трафика начнут обучать журналистов профессиональным навыкам - русскому языку.
3. Качество текстов в Яндекс.Новостях улучшится.
Zemonengkak,
мы пробовали, но журналистский язык богат и разнообразен, в нём часто появляются неологизмы, и риск отфильтровать что-то важное очень велик. Тем не менее, обязательно сделаем второй подход.
Еще бы научились Яндекс.Новости первоисточник оставлять вверху, а всех копипастеров и уточнителей информации ниже опускать, было бы супер!
linews,
первоисточник в сюжете есть не всегда. Первый написавший о чем-то совсем не всегда первоисточник. Если в сюжете есть сообщение, на которое много ссылок в других сообщениях сюжета, алгоритм ранжирует его высоко и отображает в аннотации сюжета.
taningallery,
не будем лукавить. Если, к примеру, "Известия" написали первыми про то, что в России вскоре возможно появится велостраховка, то они и должны быть первыми в этом сюжете. Понятно, что подсуетившийся после (минут через 20-25, как правило), например, Интерфакс, получит большую ссылочную базу. Хотя по сути, переписавший новость, просто виртуозный копипастер в данном конкретном случае. Есть информационный повод - он всегда заявляется каким-то одним СМИ. Потом остальные переписывают, дополняют, уточняют, опровергают даже. Первый должен быть первым. Он тему заявил. Остальные подхватили. И кто подхватил, не всегда ставит ссылки на источник информации.
taningallery,
http://news.yandex.ru/yandsearch?content=alldocs&cl4url=autochel.ru/text/newsline_auto/758126.html?full=3&lr=213 вот как у Яндекс.Новостей "сварился" сюжет. "Известия" оказались внизу. Хотя они были первыми, кто эту тему предложил.
linews,
Мне как простому пользователю, без разницы кто первый опубликовал новость. Главное, чтобы она была читабельная.
Дмитрий,
ваше утверждение сродни "мне все равно, что есть, лишь бы не отравиться". Если вам нравиться кушать то, что кто-то уже пожевал, я вам мешать не буду.
linews,
Вы я так понимаю редактор того сайта и вам обидно за то, что сайт не первый?
Дмитрий,
я - не редактор газеты "Известия". Но я работаю в СМИ с 1991 года и могу привести тысячи примеров, когда копипастеры получают бонус от Яндекс.Новостей в виде удачного позиционирования. Это плохо. Фактически порочная практика такого размещения помогает "информационным ворам". Они не тратят усилий на поиск, обработку информации. Воруют чужой труд и Яндекс.Новости им в этом помогает. Вот это обидно. Дело не в Известиях, РИА Новости или Интерфаксе. Дело в порочной практике сложившейся годами.
linews,
Поддерживаю в этом вопросе! Посидят, поскребут по всем местам, а через 5-6 часов выдают свое Г  - издания, у которых в штате 3 человека.
linews,
сюжет склеился вот так: http://news.yandex.ru/yandsearch?cl4url=autochel.ru/text/newsline_auto/758126.html?full=3&lr=213 На Известия в этом сюжете 9 ссылок, поэтому сообщение Известий входит в аннотацию. Но пользователям, для которых  мы работаем, действительно часто всё равно, кто был первый. Кроме того, время публикации, данные о котором мы получаем от СМИ, не всегда указывается честно. Наша задача дать самую проверенную информацию, и алгоритм, решая эту задачу, ориентируется на количество ссылок на то или иное сообщение.
taningallery,
именно про это я и говорю. Смотрите, 9 ссылок на "Известия" а "За рулем" и "autochel.ru" в выдаче Яндекс.Новостей стоят все равно выше. При этом, я не говорю, что алгоритм Яндекс.Новостей плохой или хороший. Мое пожелание было и остается прежним - было бы очень правильно, если бы Яндекс.Новости научились выделять тех, кто добыл новость, раскопал факты и озвучил их. Это труд и настоящая работа. А на то, чтобы украсть новость, сделать рерайт сюжета много ума не надо.
linews,
не всегда первый по времени это именно тот, кто добыл новость, и часто это действительно неважно - какая разница, кто первым успел взять новость из терминала информационного агентства, или кто первым успел добежать до ноутбука после пресс-конференции какого-нибудь ньюсмейкера. В случаях, когда есть явное сюжетообразующее сообщение, мы определяем его по наличию и количеству ссылок на него. Да, не всегда безошибочно, но стараемся улучшаться.
taningallery,
я не говорю про пресс-релизы. Давайте не будем путать их с "Новостями". Каждый день появляется много эксклюзивной информации, интервью, заявлений. Вот эту информацию всегда доносит до читателя кто-то один. Первый! Потому что это эксклюзив, а не рассылка. А вот потом начинается рерайтинг. Вот этого первого Яндекс.Новости, как честный сервис, должен выделять, а не опускать вниз.
linews,
на такие сообщения обычно ссылаются, и они оказываются наверху в сюжетах Яндекс.Новостей, не смотря на то, что со временем теряют свежесть.
taningallery,
вот вам сегодняшний пример http://news.yandex.ru/yandsearch?text=запахов&rpt=nnews2&grhow=clutop - Карту запахов создадут в Подмосковье. Это - не пресс-релиз. Это - эксклюзив все той же газеты "Известия". Почему "Глобал Омск.ру" и "М24", которые проснулись, увидели, что сюжет вышел в топ, сделали рерайт - попадают в верхнюю выдачу? Они же рерайты делают. А "Известия" при этом задвигается вниз. Вы лучше меня знаете, насколько больше кликов получает тот, кто стоит первым. И в этой ситуации получается, что Яндекс.Новости помогают тем, кто "заимствует" информацию, а не тем, кто ее добыл для читателя. В этом принципиальная ошибка алгоритма Яндекс.Новостей.
linews,
Ваша ссылка на выдачу, в результатах поиска мы стараемся давать самые свежие из релевантных сообщений, а сюжет выглядит вот так http://news.yandex.ru/yandsearch?cl4url=mir24.tv/news/society/9904209&lr=213 Известия в топе-3 сообщений сюжета. Но сортировка всегда по времени - более свежие из цитируемых и весомых наверху.
taningallery,
как раз об этом и речь. Если сейчас эту новостей зарерайтит РИА Новости их публикация окажется первой. Таким образом, вместо того, чтобы продвигать тех, кто реально нашел новость, Яндекс.Новости помогает тем, кто делает рерайты. Массаракш! Мир наизнанку! Вы не находите?
linews,
нет, не находим. ссылка на первоисточник есть на видном месте и останется там, не смотря на то, что появляются свежие сообщения на эту тему. А пользователь должен иметь возможность самостоятельно выбрать, на каком сайте читать новость, поскольку далеко не всегда хочет читать её на сайте первоисточнике. Другое дело, что все без исключения предлагаемые сайты должны быть уважаемыми изданиями, ссылки на которые не стыдно предлагать. Так получается не в 100% случаев, но мы работаем над совершенствованием алгоритма ранжирования.
taningallery,
или вот вам еще один пример - следите внимательно в развитии: Менеджеры "Аэрофлота" получат в качестве бонусов по 14 миллионов рублей http://lifenews.ru/news/127645 На данный момент, новость еще даже не проиндексирована. Нет рерайтов и нет в выдаче Яндекс.Новостей. Рерайты обязательно последуют. В ближайшие часы мы с вами сможем наблюдать, как алгоритмы Яндекс.Новостей будут распределять автора новости и рерайтеров.
Даже я ошибся, первыми в новости про миллионные бонусы "Аэрофлота" были "Известия" и Яндекс.Новости сейчас это безошибочно определили.  Вот здесь - молодцы! Снимаю шляпу.)
linews,
Арам Ашотыч, залогиньтесь
linews,
а вообще "давайте не будем путать" это как раз одна из самых сложных для алгоритмического решения задач)
Вы лучшие
FlooMBaster,
спасибо!
FlooMBaster,
Без сомнения! Вдохновения,  допиливания алгоритмов и стремления к идеалу.
А есть ли возможность для источника смотреть показатели цитируемости и оперативности?
beltanews,
нет, мы не публикуем эти параметры.
Не совсем верно. Источник об ошибки не информируют.
nmolkova,
в вашей реплике неверное окончание в слове "ошибке".) А если серьёзно, конечно, проинформировать всех мы не можем, сообщений очень много. Но о каждом найденном случае всё же стараемся сообщать.
nmolkova,
нас информировали :)
Сергей Петухов
20 февраля 2014, 17:11
Иллюстрации частенько не соответствуют новости.
Сергей Петухов,
бывает. робот Яндекс.Новостей очень мало знает об изображениях, но мы работаем над этим.
В жж есть возможность убрать автора из топа, если вы не хотите читать его посты (по воим - тем или иным причинам).
Будет ли в Яндексе возможность применять подобную же схему к новостям?
BudanIvan,
сейчас реализована возможность выбрать СМИ, которые вы хотите читать. Для этого нужно зайти на news.yandex.ru/mynews и сделать свой выбор. В результате сообщения от ваших любимых СМИ будут отображаться на страницах сюжетов в отдельном блоке на видном месте, по ссылке news.yandex.ru/mynews вы увидите ленту, собранную из сообщений только этих СМИ.
Как решается проблема с попаданием в похожие к другим источникам, если они вышли позже нас, например.
beltanews,
часто более поздние по времени сообщения содержат цитату из более ранних, но при этом в них есть новые подробности, важные для понимания актуального состояния события, они более информативны. Чтобы дать возможность пользователю увидеть это актуальное состояние, алгоритм отдает предпочтение при ранжировании таким сообщениям. В таких случаях мы проблемы не видим. Но бывают и ошибки алгоритма, мы их лечим.
taningallery,
я про то -  если информагентство  дает короткую информацию раньше, а потом часть этой информации с новыми "подробностями" попадает к вам от другого источника, случается что новость информагентства оказывается в похожих. Оно априори, не может быть в похожих, т.к. вышло раньше, другое дело в ранжировании. но вопрос именно о похожем. и если не заметишь и не сообщишь, оно так и будет висеть там.
beltanews,
"похожие" это именно похожие - не дубликаты, а сообщения, тексты которых в большой части идентичны. Показывать пользователю все такие сообщения нет смысла - идентичные тексты ему не нужны. А из двух похожих текстов, кажется нам, пользователю интересней тот, который полнее описывает событие, поэтому ранжирование устроено таким образом.
Как часто робот забирает рсс, который ему отдают?
beltanews,
это зависит от частоты обновления RSS, робот самообучается забирать тем чаще, чем чаще в RSS появляются новые сообщения.
Как лучше отдавать видео Новостям, как собственный файл или они хорошо понимают встроенное видео, если да, то какие сервисы более любимые )))
beltanews,
Наши партнёры обычно хорошо знакомы с нашими техническими требованиями)) Видео наш робот индексирует вместе с текстом, ссылка на видео указывается в специальном теге экспортного файла.
Если вначале новость выходит короткой, а через некоторое время дополняется, то сканируют Новости полный текст еще раз и по другому ли они ее затем ранжируют?
beltanews,
наш робот забирает только то,что партнёры кладут в экспортный файл. Если новость была исправлена/дополнена и снова помещена в экспорт, робот проиндексирует актуальный вариант автоматически. На ранжировании это обычно не сказывается.
taningallery,
разве это логично? Если автор весь день ведет тему новости, дополняет ее, а на ранжировании это никак не сказывается? Зачем тогда делать ее качественной? Проще пару строк написать и забыть про нее. Разве не так?
интересно про опечатки и ошибки в новостях - почему бы не сделать автоматическую отправку данных сообщений партнеру?

т.е. добавить что-то в духе "выделите кусок с опечаткой или ошибкой и нажмите ctrl",
после появляется форма для описания ошибки,
после подтверждения все это автоматом уходит на соответствующий контактный адрес партнера.
okoneko,
а кто должен подтверждать?
taningallery,
я неправильно выразился - под подтверждением имел ввиду форму ввода и капчу на ней, а не какую-то премодерацию отправляемых данных.

В принципе, можно вместо мгновенного формирования запроса на исправление опечатки/ошибки накапливать статистику отзывов и только потом отправлять кумулятивный отчет партнеру. Т.е. наличие ошибки в определенном участке текста должны подтвердить еще некоторое количество других пользователей.
okoneko,
как правило, такие формы есть на сайтах СМИ, но, как видите, не помогает.
Регулярно пользуюсь! Общаюсь, комментирую, с целью популяризации себя и своих ресурсов! Один развёрнутый комментарий, на злободневную тему, прогоняю иногда по 100-200 новостникам! Здорово!
schurup87,
что за новостники, если не секрет?
Яндекс. новости, в почте с права, всё самое животрепещущее за день.
Проще выборочно использовать rss
Вопрос команде Яндекс.Новостей: можно ли добавить настройку, позволяющую фильтровать новости по желанию пользователя? Хотя бы совсем примитивный фильтр - по ключевым словам. Допустим, я не хочу читать новости со словом "олимпиада" - тогда я указываю его в списке моих исключающих слов, и новости, содержащие это слово и его производные, перестают отображаться. Эту идею можно развить и дальше, но для начала хотелось бы хотя бы такой простой, но индивидуальный фильтр.
zelenk2007,
сейчас такой фильтрации нет. Есть гипотеза, что больше востребован будет механизм, позволяющий собирать в ленту только интересное, а не выфильтровавать из неё неинтересное. Как Вы думаете?
taningallery,
я думаю, что полезным было бы и то, и другое. Поверьте, множество людей НЕ хочет читать в ленте новости про условных Киркорова, или Кураева, я уж не говорю о новостях со словом "футбол" :) Механизм, позволяющий собирать только интересующие пользователя тематики будет неполным без исключающих фильтров - и, наоборот, очень мощным с этими фильтрами.
zelenk2007,
верю!) Что-нибудь придумаем, спасибо.
taningallery,
 жаль что за 2,5 года так и не реализовали эту функцию.
Ребят, реально невозможно читать рубрики Интернет и Hi-Tech (я говорю именно об этих главных страницах без влезания в хронологию данных рубрик). Почему? Да потому что там очень высокий процент новостей, которые дублируются. Некоторые новости не относятся к Hi-Tech. Например, сейчас в самом верху там висит новость "Роспотребнадзор закрыл 3,7 тысяч сайтов о самоубийствах". Каким, спрашивается, он относится к хай-теку? Ну, разве что к интернетам относится. Зато покупку WhatsApp нужно дублировать в две рубрики, это же Hi-Tech и Интернеты в одном виде (ирония, да).
serejqa.m,
алгоритм делает вывод о тематической принадлежности сюжета, исходя из данных, полученных от партнёров. Некоторые рубрики действительно очень близки по содержанию, а некоторые события находятся на границе различных тематик (оглашение приговора по "Болотному делу" - это Общество, Политика или Происшествия?), в таких случаях алгоритм относит сюжет в две рубрики. Но иногда, конечно, бывают и ошибки алгоритма, как в приведённом Вами примере. Будем чинить. Спасибо!
Добрый день, сервис как-то конролирует качество уже принятых СМИ? В теме «Авто», в частности, есть огромное количество сайтов, занимающихся исключительно рерайтом новостей, видимо с целью сбора трафика.
kruglovsasha,
пытаемся контролировать, но партнёров очень много, а редакторов и модераторов у нас нет. Редакционная политика у любого сайта может измениться в любой момент времени, поэтому, как нам кажется, правильное поведение в этой ситуации не запрещать и не пущать, а делать умное автоматическое ранжирование, которое не позволит подниматься на видные места некачественным материалам.
taningallery,
спасибо за ответ.
Очень часто видео на которое ссылается яндекс не соответствует заголовку новости . Неплохо было бы доработать этот момент.
dozorov.yakov,
обязательно доработаем. Если не сложно, можно ли пример, чтобы мы точно понимали, о чем идет речь.
Я конечно не прочитал все сообщения, но как мне показалось, основные споры ведутся вокруг темы «Кто был первым». Но, никто не говорит про пользователя.  Ключ именно у пользователя.

Для меня лично, новости Яндекса слабо структурированы как по интересам так и по источникам.

1. Первый способ, который приходит на ум, это персонализация по темам. Например, мне абсолютно не интересно читать новости про футбол. Ни под каким соусом и даже в разделе СПОРТ я их видеть не хочу.

2. Второй способ персонализация по подаче. Например, мне интересны новости, где много фактов и мало рассуждений (кому то будет наоборот).

Итог: рано или поздно новости станут персонализированными, тогда можно будет мелким сайтам конкурировать с крупными, просто делая новости для своей аудитории.


Михаил,
действительно, Яндекс.Новости структурированы только по событиям и тематикам. Но Вы совершенно правы, мы работаем для пользователей, и будущее за персонализацией. Работаем над этим.
Я конечно не прочитал все сообщения, но как мне показалось, основные споры ведутся вокруг темы «Кто был первым». Но, никто не говорит про пользователя.  Ключ именно у пользователя.

Для меня лично, новости Яндекса слабо структурированы как по интересам так и по источникам.

1. Первый способ, который приходит на ум, это персонализация по темам. Например, мне абсолютно не интересно читать новости про футбол. Ни под каким соусом и даже в разделе СПОРТ я их видеть не хочу.

2. Второй способ персонализация по подаче. Например, мне интересны новости, где много фактов и мало рассуждений (кому то будет наоборот).

Итог: рано или поздно новости станут персонализированными, тогда можно будет мелким сайтам конкурировать с крупными, просто делая новости для своей аудитории.

   К сожалению с данным алгоритмом выбора новостей легко управлять.Как мы знаем гос пропаганда сейчас в расцвете и новости яндекса сейчас(в отличии от 5 лет назад) ничем не отличаются новостей 1канала, Russia Today, ... чем оттолкнул меня и знакомых на определённые новостные сайты.
   Как говорила Марго Симонян, в интервью К. Собчак, что группе сми(большая часть, но пока не такая как с ТВ, где был один дождь) подаётся из одного пула(Сурков и ко) новость с "аргументами" и как бы "независимые СМИ" начинают обсуждать, т.о. так как их больше, то и их новость-пропоганда вылезет под "их" заголовком. Вылезти другой значимой новости невозможно, т.к. ваш алгоритм учитывает кол-во упоминаний. Хотелось бы, чтобы робот по истории(чтобы манипулировать сложнее) определял  обособленные группы ресурсов и их вес уменьшал.
Т.е. сейчас 1канал, нтв, россия, ...  больше половины ресурсов выдают одинаковые события вот их и вес объединить как 1 равный весу новости Дождя  или 1 весу NY Times. Понятно, что манипуляторы поймут и разобьются на группы, но ... на то вы и Яндекс, чтобы выть на шаг впереди, а пока новости Яндекса оставим любителям тв :(
форма-046.рф
Добрый день!
Можно ли как-нибудь настроить на более положительные новости в топе новостей?
Все какие-то печальные новости: умер,скончался,разбился,ушел,уволен и т.д.
Неужели в мире одни только печальные новости?
Больше позитива в новостях!
Спасибо.
ptftc,
попробуйте настроить себе "Мои Новости" - news.yandex.ru/mynews
Вопрос такой, при ранжировании учитываются именно ссылки на сми в других сми по теме сюжета? Учитываются ли поведенческие факторы, т.е. ссылки скажем в соц сетях, насколько новость разлетелась и читаема там?
aka-fenix,
нет, эти факторы для ранжирования не используются.
Хотелось бы отметить отвратиельный подбор новостей компанией Яндекс-Украина. У нас сейчас очень непростая ситуация, после переворота нацики взяли под контроль всю прессу. С теми кто осмелится опубликовать информацию отличающуюся от официальной версии путчистов рассправляются физически. И в это время, когда очень нужна объективная информация о ситуации в стране, Яндекс Новости для Украины выдают заголовки исключительно антироссийской направленности.
Раньше я прсто отключал блок новостей в настройках, но сегодня обнаружил что новости пошли вверху, там где была реклама Яндекс браузера и отключить их нельзя:((( Приходится менять город с Киева на Москву, но тогда не работают Погода и Пробки.
Очень неприятно что в российской компании Яндекс поддерживают наших полицаев....
m1642511,
СОГЛАСНА
Добрый день. Интересно, как определяется количество источников, которые отображаются до строки "еще X cообщений" в одном сюжете? понятно, что это какая-то пропорция к количеству сообщений в сюжете, но какая?
dvs1972,
там "гвоздями прибитое" количество ссылок, больше которого быть не может, а меньше - да.
Здравствуйте, не всегда новости с нашего сайта попадают в новости нашего региона, хотя населённый пункт события в статьях указан, могли бы вы открыть механизм попадания новости в конкретный регион?
avpovazhniy,
в региональный выпуск попадают сюжеты о событиях, произошедших в этом регионе. регион, в котором произошло событие, определяется автоматически по употребляемым в текстах сюжета географическим названиям. в выпуске отображаются 15 самых важных по мнению алгоритма Яндекс.Новостей сюжетов про события в регионе.
Здравствуйте, есть ли возможность добавить источник в Яндекс.Новости, не являющийся Вашим партнером? Для просмотра новостей по определенной теме.
Раздражает, что когда заходишь на главную страницу наверху слева сразу видно новости. Я иду проверять почту и не хочу видеть новости! Как сделать чтоб их не видеть?
shugnin,
в настройках яндекса. Нажать на главной странице яндекса в правой верхней стороне: настроить и нажать крестик рядом с новостями и в нижнем, правом углу, нажать: сохранить.
новости висят по 3 часа не мнеяясь, только местами
Ну и как теперь в Яндекс. Подписках понять где свежие новости,а где вчерашние?Всё через Ж, как всегда.
Несколько лет пользовался подписками, все было удобно и строго. К чему эти карточки? Их читать невозможно - глаза не могут сосредоточиться. Хотя бы предупредили, что уберете подписки, я б фиды экспортировал в другой RSS ридер. Дайте возможность экспорта фидов или настроить внешний вид новостей без прыгающих заголовков
все, нашел как скачать архив ссылок.
кто тоже озадачился, вот на этой странице скачивается архив:
https://mail.yandex.ru/lenta-block/?nr
нормальная работа
В течении какого времени рассматривает заявка на подачу новостного сайта в ваш агрегатор? Как можно узнать причину отклонения сайта при n-количествах подачи заявки, то есть, вы несколько раз заявили, что пока что не хотите принимать сайт в агрегатор и сказали, что следите за нами и когда придет время Вы нас позовете, однако я сомневаюсь что это случится.
Отправили заявку с указанием наших новостных ресурсов на эл. почту info@news.yandex.ru 2.04.2015
Не подскажете, как долго будет рассматриваться наша заявка?
На яндексе одни негативные новости,читать не возможно! Из окна вывалился ребенок,мигранты устроили бунт в спецприемнике,прохожий ударил женщину ножом и т.д.Ну кому интерестно,что нашли грабителя аптеки????Перекладывают всю эту грязь с больной головы на здоровые!
Здравствуйте, недавно создали и запустили свое новостное СМИ http://shraibikus.com посещаемость пока еще очень низкая, есть ли порог по посещаемости для попадания в Яндекс Новости? И второй вопрос, на сайте установлены 6 рекламных баннеров, благодаря которым сейчас хоть как-то отбиваются затраты на хостинг, не будут ли они влиять на решение о добавлении сайта в яндекс новости?
Здравствуйте, иногда в Яндекс Новости попадают молодые сайты, для которых сложно получить естественную цитируемость с других источников СМИ. Как таким источникам добится попадания в верх сюжета?
Удалённый пользователь
4 сентября 2015, 22:48
Прочла очередную "новость" - разбился легкомотор-
ный самолет! И что? Этот новость! Особенно сегодняшняя подборка "новостей" - собрали по Руси, кто где разбился, кто где стрелял! Устали уже от таких "новостей"! Автобус перевернулся! И что?!
Это разве новости? Новости должны быть позитивными или хотя бы интересными! Ну перевернулся автобус - это разве новость для такого большого браузера как Яндекс?!  Неужели больше не о чем сообщить, погуляйте тогда по Гуглу, там чего-нибудь поищите! Работайте пожалуйста, а не собирайте остатки мусора!
Удалённый пользователь
4 сентября 2015, 23:11
Если все новости у вас появляются от алгоритмов, то смените или уберите такой алгоритм! По каким таким алгоритмам отбираются ваши "новости", которые совсем и не новости, а просто сплетни! И уберите их от меня, о чем я захочу узнать, найду в строке "поиск"!
Можно сделать чтобы не главное дня показывалась, а то что мне интересно? Например я помечу какие тематики мне интересны и чтобы мне показывалось из этой тематики новости. Что-то подобное у вас реализованно или планируется?
Согласен, что тема устарела, но вопрос появился только сейчас. Почему-то, когда открываю Яндекс.Новости в своем регионе, у меня отображаются только главные новости, а списка всех новостей нет. Подскажите, пожалуйста,  что делать.
Не так раздражают опечатки и безграмотные заголовки  партнёров Яндекса, как отсутствие даты, когда произошло событие. Употребление  слов вчера, сегодня, накануне при описании Новостей надо ЗАПРЕТИТЬ! Эти "вчера, 10 часов, и т.д. путешествуют по моему любимому Яндексу и вносят сумятицу. Сейчас важен каждый день. "Аэробус, потерпевший крушение в Египте, прошёл в Домодедово предполётный контроль НАКАНУНЕ вылета" Потом - заправился в Самаре и полетел в Египет"
И только после 3-х дневных моих вопросов, так когда самолёт прошёл предполётный контроль в Домодедово, промелькнуло, что  он прошёл этот контроль 26 октября. Это разве НАКАНУНЕ???
А потом - под чьей охраной находился самолёт 4 или 5 суток до вылета? Если уж сообщать Новость, то указывать дату. А то пишут часы, а когда доходишь до конца Новости, стоит дата годовой давности. Эту дату надо писать в самом начале. Обязательно КАТЕГОРИЧЕСКИ ПОТРЕБОВАТЬ от СМИ - указывать даты.
Может, что-то переналадить в технологии самого Яндекса? Если я спрашиваю в поисковике про рабство в Алабаме, зачем мне поисковик даёт миллионные ответы о рабстве вообще в мире? И в кратких ответах обязательно где-то мелькнёт слово Алабама, но, когда откроешь текст, то  в тексте - не будет НИЧЕГО об Алабаме. А время на поиски - потрачено. Ладно, при этом происходит наше ОБЩЕЕ развитие, так что ЯНДЕКСУ - СПАСИБО огромное за такой поисковик.  Осталось только призвать СМИ к грамотному изложению Новости. Пусть их будет меньше, но они будут и через год и через два путешествовать со своими правильными датами.
Являюсь владельцем сайта новостей астрономии (ссылку не указываю, дабы не сочли рекламой). Контент уникальный и проблем с экспортом в Я.Новости не было. Но вот незадача, последнее время робот почему то зачастую отправляет мои новости в Общество, хотя тематика никак с этим не вяжется. Неужели робот не может распознать тематику новости по словам - NASA, РОСКОСМОС, галактика, созвездие, черные дыры, телескоп Хаббл и т.п. и отнести ее к Науке? Как это может попадать в Общество? Пытались решить проблему с поддержкой, установив в экспортном фале единый тег <category>Наука</category> для всех новостей, но и это не помогло. Посоветуйте, как лучше поступить в данной ситуации?
Почему новости о Республике Крым часто большей частью составляют выборку Украинских СМИ,а не Российских? По другим регионам РФ подобной картины не прослеживается. Может быть имеет смысл что-то подправить в алгоритмах?
почему в яндексе в футбольных новостях часто фото не соответствует статье
Света Чистякова
16 февраля 2016, 18:07
varvaras22a,
здравствуйте. А в чём именно проявляется несоответствие? Можете привести пример или показать скриншот?
Скажите, а по каким критериям Яндекс разделяет материалы на "новости и "статьи"? Определенное количество знаков? Что-то еще?
Добрый день. Почему новость с сайта появляется в Яндекс.Новости с задержкой в несколько дней?
Вы хоть сами-то читаете эти новости, которые выкладываете ? Утром вы пишите что в каком-то городе что-то произошло, а вечером пишите что этот город опроверг информацию о каком-то происшествии, и это часто происходит !
Очень много негативных новостей и так время не очень радостное для жизни, так и новости в ленте прям кричат - ВСЁ ПЛОХО, МЫ ВСЕ УМРЕМ. Выключу новости и поставлю анекдоты. Яндекс не надо писать, что "мы транслируем, что пишут СМИ" - Вы тоже несете, за настроение масс, ответственность. Можно как приукрасить новости? Неужели ничего хорошего не происходит? 
Света Чистякова
24 мая 2016, 15:43
rai505,
здравствуйте. Яндекс.Новости и блок новостей на главной странице Яндекса можно настроить под себя. Выберите в качестве любимой рубрики, например, «Культуру», и вас будет вкладка с новостями о кино, театре и музеях. Негатива там обычно мало.
как мне из новостей заблокировать канал Дождь ?
Другими словами, нет спасения от негатива, навязанного общими СМИ?!.. А вам не подчинится, значит "проиграть"! Но в этом есть и свои плюсы. Я собственными глазами вижу, как много в мире ХОРОШЕГО!!! Главное хотеть и уметь это видить! А значит работа над собой приобретает особый смысл... Не быть поглощённым общей истерией зла и уныния. Если кто-то очень любит выделиться из серой массы, пусть не ищит спасения в бунтарских организациях! Сегодня добрые дела куда заметнее людми, чем подчёркнутая агрессия во всём!...
С новыми алгоритмами выдачи сайтов в Яндекс новости стало сложнее выбиться в топ небольшим региональным сайтам. Хотя и у них бывают интересные новости. Вот и получается, что читаешь одни и те же  Сми, которые и так наводнили интернет...
Почему в новостях Яндекса по СПб одни происшествия и вместо слова "погиб"  пишут "задавил", "отрезало голову" и т. д. Противно читать. Знать бы куда пожаловаться. Работаю редактором в серьезной структуре.
А рейтинг по полноте информации рассчитывается для каждого отдельного сообщения или же на основании материалов, которые были опубликованы за последние 2 месяца? Или же и то и другое имеет место? 
И правда ли, что новость, которая содержит ссылку на запись в социальной сети (первоисточник) считается более полной нежели такая же новость, но без ссылки?
Удивительный негатив в новостной ленте. Такое впечатление, что позитива нет. На нем не акцентируется внимание. Полагаю, алгоритм поиска новостей Яндексу нужно изменить. Не нужно брать среднюю температуру по больньце - она нездоровая. Как-то столбик нужно сметсить в более положительном направлении. Процентов хотя бы на 20-30.
ЯНДЕКС  ,  У МЕНЯ НЕТ СЛОВ!!!! В МИРЕ, ЧТО НЕТ ХОРОШИХ НОВСТЕЙ! ???? ОДИН НЕГАТИВ.. ВЫ НОРМАЛЬНЫЕ ЛЮДИ ТО ВООБЩЕ.  ???   СДЕЛАЙТЕ  ВВЕРХУ НА ГЛАВНОЙ СТРАНИЦЕ  БЛОГ  ХОРОШИХ , ДОБРЫХ , ВЕСЕЛЫХ НОВСТЕЙ....
a.mangasarian,
они специально так делают почему-то. Я убедилась в этом из новости, про то что: мужчине предъявили счет за парковку на три миллиона. Если кликнуть на эту новость, то там написано: но этот счет был ошибочный, всё  быстро удадили и счёт оказался на 200 рублей. Специально умалчивают про хорошее почему-то. 
Яндекс.новости бесполезны если следишь за ходом какого-то события. Например, как сегодня - выборами в США. Первая строка в Яндекс.новостях всегда повторяет заголовок с какого-то произвольного сайта новостей. И сегодня он то сообщал актуальную информацию, то смещался на несколько часов назад, сообщая утреннюю новость о том, что Клинтон лидирует в 14 штатах. Хотя Трамп уже победил))) Добавьте фильтр на время публикации новости от сайта-партнера.
Света Чистякова
10 ноября 2016, 17:00
Здравствуйте. Простите, Новости вчера в первой половине дня немного лихорадило из-за технического сбоя. Обычно они себя так не ведут.
Заголовки региональных новостей безграмотны массово. Например омские новости сегодня: "пенсионер-рецидивист". Профильтровать бы каким-то образом местных журналистов.
Насколько я понимаю Яндекс - поисковая система.
Часто при наборе в поисковой строке нужного слова и сочетания слов  выскакивает сообщение о том, что меня заподозрили в том, что я бот или робот ... и блокируют возможность продолжать поиск требуя ввести название слова в иконке... Как побороть ситуацию и объяснить,  что  я не робот ... и спокойно работать?
Спасибо,
С уважением,
Павел Пафнутьев
Света Чистякова
9 января, 15:29
Павел, здравствуйте. Сообщение отображается в случаях, когда с одного IP-адреса к Яндексу поступает много запросов сразу. Такое может произойти по нескольким причинам. Возможно, вы делите IP-адрес с другими пользователями — это наиболее вероятная причина. Кроме того, бывает, что запросы незаметно отправляет вредоносная программа, заразившая компьютер. Что делать в таких случаях, можно узнать на этой странице.
Кому надо знать что в мире происходит,тот найдет. Освещайте только положительные новости. Будет своя лента положительных новостей. так этого не хватает нам на перекрестках кривого бытия

но бывает, что они пишут, допустим: парень упал, а нажимаешь на новость и пишут: он выжил и всё хорошо. Зачем акцентрировать внимание на негативе, а про хорошее умалчивать? 
Особенно улыбнуло слово "беспристрастно".
Новостные заголовки в Яндекс Украина выглядят как скандал базарных бабок.
Читать противно...
Американские СМИ сообщили о российском военном корабле у побережья США
Белый дом: Трамп ожидает от России возвращения Крыма
Nokia возобновит продажи модели 3310
У берегов США обнаружили российский корабль-шпион
Гражданин Турции убил русскую жену и детей и застрелился  -  
вот ваши новости на сегодня! Откровенно говоря, достала эта ваша новостная политика.
 Критикует вас народ, критикует, а вам всё пофигу.  Времена меняются,  но "ненаглядный Яндекс" застрял в 90-х... И не надо вешать лапшу про "алгоритмы".  Уйду на "Спутник", ну вас к черту.
Есть ли фильтр отбора в настройках новостей, а если есть, то как его настроить? Поясню: мне нет никакого дела, что сказал тот или другой дядя, и совершенно не интересно где и как тушат пожары. А вот разделы "Наука" или "Технологии" мне и в самом деле интересны, но прежде чем я до них доберусь, на меня выльют тонны негатива. 
Можно ли настроить новости так, чтобы "Наука" появлялась в топе сразу, минуя так называемые "Главные новости"?
Зачем в Яндекс-Новостях распространять негативную информацию, особенно убийства, аварии, ... ничего положительного ... ( Житель Железногорска зарезал собаку на глазах у соседей, В Красноярске неизвестный мужчина с ножом ограбил 9-летнего мальчика,) (Пенсионера, чистившего крышу дома, завалило снегом, Двое мужчин в масках ограбили магазин на Большой Подгорной, В Томске приостановлена работа магазина из-за отсутствия вентиляции) - это уже в Томске, (Семилетний мальчик погиб под колесами грузовика в Сочи
В Краснодаре мужчину избили у ресторана во время семейного торжества
Пьяного пассажира самолёта задержали в аэропорту Краснодара) - это новости в Анапе... Доколе? Не нужно говорить про рейтинги СМИ и их цитируемость, нужно грамотно фильтровать поток информации, тогда и СМИ будут подстраиваться под ВАС...
Шедеврально, что глупости Яндекс.Новостей обсуждают уже везде. Надо удалить раздел про Науку и вернуть прежние Технологии. А Науку можно вообще удалить. http://pikabu.ru/story/nauka_glazami_yandeksa_4942963
И уволить того, кто это придумал, т.к. именно этот человек в будущем развалит весь сервис...
Больше разностороннего позитива господа
inspacesite
12 мая, 13:34
После ввода ограничений по СМИ в Яндекс.Новости раздел Наука стал невменяемым. Недобросовестные сайты (коих 80%) порят всякую чушь, которая без проблем пробивается в топовые сюжеты. Вот один из примеров, на который я наткнулся сегодня, такой ахинеи я не встречал (кто немного разбирается в астрономии, оценит):


Ученые рассказали, что атмосфера Нептуна содержит воду. Они считают, что исследование прольет свет на формирование экзопланеты. Новые данные помогут улучшить знания о нашей собственной Солнечной системе. Как сообщается в отчете, составленном научным журналом ***************, для изучения Нептуна ученые использовали данные Хаббла и Спитцера. Ученые сообщили, что Нептун, известный также под названием HAT-P-26b, напоминает Юпитер. Газовая оболочка Нептуна образовалась после его формирования. Формирование планеты произошло без загрязнений – они появились позже. Изучение атмосферы является очень важным. Экзопланета была открыта шесть лет назад. Данный тип планет не является редкостью. Ученые не обнаружили внеземную жизнь. Но новые знания о формировании планетарных систем, подобных Нептуну, могут улучшить понимание Солнечной системы и нашей планеты.


Не знаю почему Яндекс бездействует, публикуя ежедневно сотни лживых "научных" статей из "СМИ", но доверие к сервису пропало.
den.vic.dim
28 мая, 23:04
Убрали тренера. Так делиться не хотел .

Здравствуйте.

Вопрос может и не оригинальный, но всё же..

А можно отфильтровать новости о политике, чтобы их не было видно?