Все самое свежее

29 февраля 2012, 13:03

Пользователи часто спрашивают Яндекс о каких-нибудь событиях  - важных и не очень. В ответ на такие запросы мы теперь показываем целый блок свежих статей и видеороликов. Вы сразу увидите их в результатах поиска:

Если этой информации мало, можно просмотреть все свежие ответы за три дня. Статьи и видеоролики, которые вызвали интерес в Твиттере, мы отмечаем соответствующим значком. Вы можете также посмотреть, какие еще документы по теме обсуждаются в микроблогах.

Свежие документы Яндекс, как и раньше, ищет на сайтах с часто обновляемым контентом,  например, на новостных ресурсах и в блогах. Теперь найденные результаты ранжируются по новой формуле и среди них показываются документы, на которые люди ссылаются в Твиттере. Таким образом, пользователи получают  наиболее интересные и востребованные сейчас статьи и ролики по теме. Популярные в Твиттере документы мы находим с помощью технологии компании Topsy. Она предлагает поиск, основанный на записях в социальных сетях.

Мы будем и дальше использовать социальный контент для улучшения качества поиска. Этому посвящена программа поиска в социальном интернете (ПСИ), о которой мы писали недавно.

 

Команда поиска,

выбираем свежее

8 комментариев
Подписаться на комментарии к посту
Еще б сделали, чтобы находились многолетние записи (2 года назад и тому подобное).

(+1)

Это попытка Яндекса оттянуть часть трафика у социальных сетей, например Twitter. Мол зачем идти в соц.сети, если все самое цитируемое там, есть теперь и у нас. B-)

Скажите пожалуйста, почему нововведение затронуло сайты несоциальных тематик? Почему новый алгоритм затронул "несобытийные" запросы?

Поисковику приходится иметь дело с неоднозначностью запроса, т.е. даже эксперт не всегда может сказать, хотел ли пользователь с этим запросом свежее или нет. Также неизбежно есть доля ошибок при определении свежести запроса алгоритмом: как в одну, так и в другую сторону. Оба типа ошибок неприятны для пользователя. Мы настраиваем алгоритмы так, чтобы такие ошибки были сбалансированы. В таких случаях часть выдачи - свежая, часть - нет. При включении свежих результатов часть сайтов основной выдачи может быть сдвинута ниже.

Было бы замечательно, если бы эти события были или внизу страницы с результатами поиска, либо даже на отдельной ссылке вверху (там где почта, карты, маркет и т.д.). Не очень то удобно когда полстраницы занимают притянутые за уши к поисковому запросу ссылки на события. Вводя "raspberry pi", я хочу увидеть ссылку на сайт их проекта в числе первых трех, а не внизу, под ворохом записей в жежешечках и левых новостных сайтах, спешащих поделится устаревшей информацией

В нашем потоке очень много 100% свежих запросов, для таких случаев мы хотим сразу дать ответ, а не посылать его за ссылку типа "Новости" или "Свежее". Есть большая серая зона неоднозначности, когда мы смешиваем свежую врезку с новостями и основную выдачу. Иногда могут случаться неудачи, но качество алгоритма оценивается статистикой по потоку: сколько раз мы правильно определили потребность пользователя.

Я нашёл баг в Вашем новом формате выдачи. Там с датами глюк.

Посмотрите на скрин шот:






На первом месте по запросу наш сайт (спасибо):
[метка 2 часа назад] [Время на сайте: 1 час назад] - Расхождение только в минутах
http://www.womanews.ru/2012/03/jessica-biel-pokazala-kolco-i-koe-chto-eshhyo/

На втором, копипастеры из ЛавРадио.
[метка 4 часа назад]
http://www.loveradio.ru/new/39862.htm

ЛавРадио привычно ссылается на Наш сайт как на автора дабы избежать претензий в плагиате.

Вопрос такой: Каким образом ЛавРадио могло скопипастить нашу статью за два часа до того, как мы её опубликовали, и сослаться на нас как на авторов?

Просто Фантастический результат. Самые быстрые копипастеры в мире.