Как это работает? Персональный поиск

30 мая 2013, 11:32

На один и тот же вопрос может быть несколько правильных ответов — в зависимости от нужд пользователя. Например, кому-то по запросу [nevermind] нужно найти перевод слова, а кому-то — альбом «Нирваны». Персональный поиск умеет учитывать личные интересы и предпочтения пользователя и выбирать наиболее подходящий для него ответ.

В основе персонального поиска лежит анализ поискового поведения — например, какие запросы задает человек, на какие сайты переходит, на каком языке общается с поисковой системой. Анализируя вопросы и переходы пользователя, Яндекс делает вывод о том, что ему сейчас важно и интересно. Так, если человек часто ищет бесплатный софт, бесплатные книги и музыку, вероятно, его в принципе интересует бесплатный контент. Эти данные учитываются как при выборе подсказок, так и при поиске персонального ответа на вопрос.


Подсказки

Выбирая для человека подсказки, Яндекс пытается предугадать его следующие запросы. При этом поисковая система опирается на вопросы людей с похожим поисковым поведением. Для этого было выделено 400 000 групп пользователей, интересы которых более-менее сходны. Разумеется, человек не зачисляется ни в одну из этих групп навсегда. По мере изменения интересов он переходит из одной группы в другую.

Практика показывает, что примерно четверть своих запросов пользователи задают повторно и часто кликают по одним и тем же результатам. Таким образом они переходят к любимым сайтам и документам. Чтобы облегчить им эту задачу, Яндекс добавляет в подсказки недавние запросы человека и его любимые сайты. Разумеется, при вводе запроса на соответствующие буквы. Например, если вчера пользователь спрашивал про [обои для гостиной], сегодня Яндекс сам предложит ему этот запрос в подсказках. А завсегдатаю ВКонтакте покажет ссылку на его любимую сеть — стоит только начать вводить ее название в поисковой строке.

Отбирая персональные подсказки, Яндекс учитывает также, какие запросы характерны для одной поисковой сессии. Например, если человек только что спрашивал [назад в будущее], и следующий его запрос начинается на «к», [кристофер ллойд] будет более полезен в подсказках, чем другие запросы на эту букву.

Персональные ответы

Мало помочь человеку задать вопрос, нужно еще подобрать ему наилучший ответ. Для этого используется специальная формула ранжирования. Она подстраивается под каждого пользователя с учетом его интересов и языковых предпочтений. С помощью персональной формулы Яндекс определяет, насколько каждый из найденных по запросу документов подходит конкретному человеку. Все документы получают свою оценку и располагаются в результатах поиска в соответствующем порядке. Получается, что по одному и тому же запросу два разных человека видят разные ответы. Например, вот как различаются подсказки и результаты поиска для людей с разной поисковой историей:

Формула ранжирования учитывает как постоянные (долгосрочные и среднесрочные), так и сиюминутные интересы человека.  Все они в разной мере влияют на качество ответа на вопрос. Так, постоянные интересы отражают  языковые предпочтения пользователя, его привычки и близкие ему темы. А сиюминутные — показывают, что важно человеку прямо сейчас. Например, пользователь, который обычно спрашивает про кино и музыку, может неожиданно заинтересоваться компьютерными играми, а потом надолго о них забыть. Таких интересов, которые быстро возникают и так же быстро сходят на нет, больше половины.

Чтобы быть в курсе постоянных интересов пользователя, Яндекс анализирует его поисковую историю за последние два месяца и за неделю. А чтобы следить за сиюминутными интересами – обрабатывает данные поисковых сессий в режиме реального времени. Это позволяет понять, что важно человеку прямо сейчас, и подстроиться под его интересы. Скажем , если  в поисковой сессии любителя литературы вместе с названием произведения встретилось слово [афиша], возможно, что в данный момент человека интересует экранизация. Вот как различаются результаты поиска с учетом и без учета сиюминутных интересов пользователя:

Чтобы мгновенно реагировать на изменения в поисковом поведении людей, Яндекс создал систему обработки данных в режиме реального времени. Она обрабатывает более 10 терабайт данных в сутки, постоянно корректируя свои знания о потребностях пользователей. Благодаря этой системе запросы и клики, которые человек сделал только что, начинают влиять на результаты поиска уже через несколько секунд.

По умолчанию персональный поиск работает для всех пользователей поиска. И чем больше запросов задает человек, тем лучше поиск его понимает. Впрочем, каждый пользователь может сам решать, нужны ему ответы с учетом интересов или нет. Персональный поиск можно в любой момент включить или отключить в настройках сервиса.

 

20 комментариев
Подписаться на комментарии к посту

а можно как-то это отключить пользователю?

только не предлагайте заходить в настройки и снимать галочки, при закрытии/открытии браузера они опять автоматически проставляются!

 

желания Яндекса вполне понятны - улучшить поиск для конкретного пользователя, но может просто стоит улучшить общий поиск, тогда танцы с бубнами не понадобятся

поддерживаю, где это отключается?

А вот тут увы, отвечу за Яндекс, снимается галочка в настройках. 

см. ролик, в самом конце об этом есть.

Так вот, хотел бы заметить, что по умолчанию этот поиск включен. 

Что оченно печально. 

 

 

 

 

 

 

Печально что поиск становится удобнее, так как нужные результаты выше? Да, очень печально.

не фарисействуйте, Константин. Вы прекрасно поняли что именно огорчает,

Это не танцы с бубнами, а окучивание доверчивых рекламодателей. Ну типа как создание имиджа богоконторы. Помните такую?

Хотя им безуспешно пытались объяснить, что такое выкладывать вредно
http://roem.ru/2013/05/21/addednews72050/#com170012

для окучивания рекламодателей досстаточно определить (предположить) пол, и на основании этого показывать или сиськи или члены - гарантированное попадание в целевую аудиторию

всё остальное это именно танцы с бубном! :-)

Задумка ничего, реализация чуток подвела — не работает.

Проверил на запросе Мурка.

Мурка — это песня и сленговое название винтовки мр-512.

Я не слушаю шансон. В основном классику, плейлист составлен много лет назад и поиск по музыке, тем более в яндексе, я не выполняю.

Мои постоянные пользовательские интересы относятся ко второй тематике. Отследить их можно, как по посещаемым мной страницам, так и по запросам.

Тем не менее, по запросу мурка, я вижу только одну ссылку на винтовку. Вероятно это работа "спектра".

Желая помочь ПС определить мой сиюминутный интерес, повводил десяток запросов со словом мурка и тегами моей тематики. Повторил запрос "мурка" — результат прежний. Галочки в настройках естественно стоят.

вероятно, прочитают отзыв и допилят :)

спасибо, давно отключил

Формула ранжирования учитывает как постоянные (долгосрочные и среднесрочные), так и сиюминутные интересы человека.
Вот же сказочники!

Формула ранжирования не может учитывать интересов человека, только лишь историю запросов, которые алгоритм ранжирования понимать не обязан (а если бы понимал, то вместо ранжирования всего вероятно релевантного — был бы поиск правильных ответов — от чего Сегалович давно открестился).
Выбирая для человека подсказки, Яндекс пытается предугадать его следующие запросы.
Но фактически подменяет его запросы подсказкой чего-то массового. А что если массы идут не в ногу с истиной?
Как это работает?
Вместо дочитывания вашего пиара, подскажу вам на что работают старания Яндекс.Каперайторов... ТП вынуждена про какие-нибудь Острова отвечать так:
В настоящий момент у нас еще нет готовых примеров и описаний для вашего случая. Если у Вас возникают трудности, то лучше дождитесь появления полной спецификации. Следите, пожалуйста, за новостями в нашем блоге http://webmaster.ya.ru/
и зачем следить за вашим пиаром, когда нет примеров по ещё позапрошлым вашим новостям?

В долговременном плане вы не выигрываете... от подмены действий пышными объявлениями о том, чего никогда не будет сделано.

всё логично, сначала они плакали что пользователи вводят слишком короткие запросы и поэтому им пришлось ввести спектр, потом когда наконец-то по их же заявлениям пользователи стали задавать более длинные запросы, они ввели подсказки - решили пойти на встречу пользователю и сократить количество вводимых символов.

логичен и следующий шаг - острова, раз они "могут угадать" что желает пользователь, давайте за него заполним форму поиска, которую за них сделает вебмастер, проблема смощностями решена и ранжировать ни чего не надо!

теперь персональный поиск, по их же заявлениям есть постоянные и сиюминутные интересы пользователя, для постоянных будет работать один единственный остров от яши, а сиеминутный заменит директ ;-)

Проблема лишь в том, что за директ не будут платить те, кто потратился на действительно релевантный (с т.з. человека) ответ
шутки 1 апреля
смешные ситуации в Метро
черный юмор
подводный мир, около дна
фото Земли из космоса ночью
(а пиариться компании надо всегда).

Суворова работает еще в я он лайн, привет ей.

В целом, весь этот тренд есть производство хаоса. Безнагрузочный (и хотя бы условно объективный) поиск уже навсегда останется в далеком прошлом, верно? 

Столкнулся с такой проблемой, при поиске какой то информации на первой странице выдачи поиска наблюдаю допустим site1, site2, site3, перехожу на второй десяток (страницу) и обнаруживаю в списке site1, site2, site3, перехожу на первый десяток(страницу) и вижу что нету site1, site2, site3.

Не помню по какому запросу, но при переключении первых 3 страниц выдачи видел одни и те же сайты, я так понимаю яндекс в динамичном режиме устроил мне персональную выдачу, но как то странно он перетасовывает и перемещает сайты, допустим я на первой странице уже побывал (сделал переход) на странице и не нашел нужной информации, прошелся по всему списку на первой странице выдачи, перехожу на вторую и тут он меня снова отправляет на те же сайты и страницы на которых я уже был и не нашел нужной информации.

Дополню немного про странности, хотя поиск делался без персонализации, при вводе в поиск envato.com, выпадает подсказка envato.com - перейти на сайт, а вот в самих результатах выдачи поиска по этому запросу дошел до 5 страницы, но так и не увидел сниппет сайта envato.com :-D

При открытии страницы поисковика и бездействия пользователя Яндекс сам будет задавать себе вопросы, отвечать на них, находить в выдаче релевантные сайты, открывать их, и т.д. по кругу пока не сойдет с ума и не ляжет в больничку для душевно больных. Вот так мне видится эта перспектива "развития поиска".

вероятно, поможет