Свежие поисковые подсказки

26 августа 2011, 18:01

Поисковые подсказки Яндекса основаны на статистике. Если много людей задают один и тот же запрос, он попадает в список подсказок. Подробнее о том, как запрос превращается в подсказку и что происходит потом, можно прочитать в этой статье.

В списке подсказок — запросы из повседневной жизни наших пользователей, собранные на основании статистики популярности запросов за месяц. Но иногда в мире происходит какое-то событие или происшествие, которым почти сразу начинают интересоваться много людей. С недавнего времени свежие запросы о таких событиях добавляются к общему набору подсказок раз в полчаса.

Например, два дня назад появилась новость о назначении Стива Маттина главным дизайнером "АвтоВАЗа", а вслед за этим в подсказки попали запросы не только о новости, но и о ее герое:

Свежесть запроса определяет система машинного обучения Матрикснет. Учитывается множество факторов, например, как быстро возрос интерес пользователей к этой теме, как много появилось новостных сообщений или постов в блогах. Запросы о наиболее ярких новостях могут появиться в подсказках уже в течение часа после происшествия. 

Иногда запросы о событии могут попасть в подсказки ещё до того, как оно произошло. Допустим, когда перед каким-нибудь ответственным футбольным матчем очень много людей начинают о нём спрашивать. Например, если сейчас ввести в поисковую строку слово [Порту], можно увидеть подсказки о предстоящем сегодня матче португальского футбольного клуба с испанской Барселоной.

 

Число свежих подсказок зависит, конечно, от происходящего в мире. Обычно это десятки тысяч запросов, которые показываются пользователям несколько миллионов раз ежедневно.

 

Команда Поиска,

следим за событиями в мире

28 комментариев
Подписаться на комментарии к посту

То есть хорошенько накрутив нужный низкочастотный запрос, можно достаточно быстро загнать его в подсказки?

Если под накрутить понимается:

1. Создать качественного контента в сети

2. Обеспечить возникновение интереса к тематике разных людей (шаринг в твиттере/вконтакте/фейсбуке, обсуждение на форумах, просмотры видеоролика, материалы в СМИ, запросы к Яндексу)

то есть создав интересное событие, то да, можно )

 

Пункт 2 технически можно обеспечить и без собственно "создания интересного события".

Авторитетность авторов свежего контента так же учитывается

Учитываться-то учитывается, вопрос, насколько это важный фактор. А то, может, и без него можно обойтись, если хорошо прокачать п. 2.

Сергей, вы меня последнее время шокируете своими высказываниями.

я понимаю, что дальше своего носа вы видите лишь на 1 шаг, но зачем же постоянно это всем показывать? Противно читать даже.

прокачать у вас уже не получиться, это во первых.

во вторых вы похоже, совершенно не понимаете как расчитывается приоритетность подсказки и сколько факторов в этой оценке.

Вы, styskin, лучше бы мне вот на какие вопросы ответили, коль уж занимаетесь подсказками:

В директе вы навязали уже давненько так поиск и переформулировки коммерческих запросов, а в вордстате собираете некоммерческие переформулировки.

И там и там есть некоторая доля полукоммерческих.

1) Можете сказать, какой кворум по основному признаку должен быть в процентах, чтобы в вордстате, к примеру, отключилась коммерческая часть переформулировок?

2) И еще интересно, куда деваются запросы, которые не отнесены ни к коммерческим ни к некоммерческим, доли которых вы не можете посчитать? Оно вообще отсутствуют в вордстате и в директе?

3)  Хотелось также ответ на такой вопрос. Сколько вы планируете продолжнать строить свой классификатор целей подобным образом? Есть какие то новые идеи без такого разделения (оно несколько ущербно и скоро этот способ не будет давать ценных плодов в плане уровня допустимой погрешности?). Есть ведь куда более грамотный способ собирать эту статистику.

вы бы из вордстата людей в директ тоже чтоль направляли, а то перекос по сбору статы. Не всеж догадываются, что в директе надо пойти поискать, раз в правой колноке нет. Или светиться не хочется?

Если не получается не светясь что то собирать- это Явный признак того, что собираете криво.

логично?

красивые решения не только скрывать не нужно, их пиарить даже выгодно!

Решение не красивое из за некрасивого алгоритма построения классификатора целей. Уродство оттуда идет.

а уродство алго построения классификатора по целям идет от уродского понимания что есть цель.

подсказка вам:

2+2=?

левая часть условие, а правая ЦЕЛЬ

по мере решения задачи, вопросительный знак ПОСТЕПЕННО превращается в ответ, понимаете, ПОСТЕПЕННО он из цели превращается в решение (серп в данном случае и конкретный клик). Т.е. нельзя относиться к цели для какой то конкретной задачи как к статичной, она МЕНЯЕТСЯ.

т.е. в процессе переформулировки цель уточняется, вы это какбы и сами знаете, но не понимаете, что цель, это ОБРАТНАЯ функция от...поиска.

Т.е. не надо изобретать методом тыка велосипед наоборот. Нужно просто взять и вывернуть наизнанку сам алгоритм поиска. И этот алгоритм породит вам классификатор целей. Ну неужели такие банальности нужно объяснять команде поиска? :)

Неужели нельзя поменять задачу матрикснету, чтобы он ИСКАЛ остальные запросы, опираясь на релевантность воткнутой в серпе ссылке по какому то НЧ запросу? Синтезировать нужно цели, а не статистику искать.

И здесь куча новых сервисов для яндекса вырисовываются...

х+х+х+х+х+х=6

х+5х=6

2х+2х+х=6

4х+2х=6

3х*2х=6

и остальное множество возможных комбинаций, которые вам нужно НАЙТИ из числа имеющихся в статистике переформулировок и вводов, руководствуясь обратным принципам построения графа.

Т.е. по сути, вам просто вывернуть граф запросов нужно наизнанку и сделать преобразования координат. так даже еще проще. Представьте себе функцию кубической параболы, вот как она в нуле на обратную меняется, также ваш граф должен в других декартовых симметричных измерениях получиться вывернутым.

У вас надеюсь трехмерный граф?

разделять запросы на коммерческие, полукоммерческие и ранжировать доли этой коммерциализации - ошибка сегодня. Это каменный век! Называть их можно как хотите, но это будет двумерной проекцией трехмерной системы, кривой по определению и агрегированная выдача, будучи такой же двумерной моделью также ущербна. Вы же сами уже отходите от двумерной выдачи...со своими аяксами...

Я очень извеняюсь, но я не смогу уловить Вашу мысль.

С удовольствием отвечу на Ваши вопросы, но пока я их не понял (

:) бывает. мыслим то немного по разному. вы как математик. я как логик.

про процент кворума ответить можете?

начнем с легких...:)

какое соотношение коммерции к некоммерции должен быть запрос, чтобы у него отключились подсказки в правой колонке вордстата?

что нельзя чтоли отвечать?

фи...

как же мы с вами принесем пользу обоюдную? :)

ну тада делайте свой классификатор целей как умеете...тормозите и проигрывайте гуглу в этом отношении. Для вас же обрубить невинную переписку важнее, чем получить ценную мысль и опередить гуглоидов...:)

Наличие ассоциаций не зависит от «коммерческой направленности» запроса.

"Вообще" - да. Но разве вы показываете ситуацию "вообще"?

"Вообще" - да. Но разве вы показываете ситуацию "вообще"?

а по их ответам и недоумению очень хорошо просматривается истинное положение дел...

фотонную ракету они строят только и всех нас за хомячков считают :)

давайте уже называть вещи своими именами, ассоциации, это не тот
термин, который здесь надо использовать (если конечно, вы не настаиваете
на том, чтобы продолжать строить классификатор по целям на ассоциациях,
взятыми из жизни. Этот путь слишком груб и годится лишь на первых
порах, дальше он бесполезен).

применять нужно термин не ассоциации, а ЦЕЛИ.

ассоциации-это синоним. И тех и других множество, и те и другие логически связаны. Вопрос какой алгоритм у этой связки.

Формально,
поисковая цель НИЧЕМ не отличается от результата. Одна и та же фраза
может быть рассмотрена и как цель и как результат. Вопрос в том, с какой
стороны подходить к анализу этой ключевой фразы в направленном графе
запросов. Я уже не говорю о том, что каждый результат является
промежуточной целью для более серьезной цели. Т.е. все зависит от того,
куда направлен вектор логической цепочки, от причины к следствию или
наоборот. Тот граф запросов, который вы строите каждый раз, направлен от
причины к следствию. У причины есть только одно следствие, а вот у
следствия, может быть множество причин (это и есть ваши ассоциации на
самом деле. т.е. цели)

например, баба хочет схуднуть, набирает
запрос "похудение". Если покопаться в причинах, то ей наплевать сколько
она весит. Ей не наплевать как она будет на пляже выглядеть или на свое
здоровье. Поэтому в подсказках, в этом множестве возможных ПРИЧИН,
кроется не что иное, как множество конечных целей, выраженных НЧ
запросами конкретных бадов или поиск комплекса упражнений, понимаете?

причем пути решения может быть грубо 2:

купить бад - коммерческая ветвь целевого классификатора и некоммерческая ветвь зарядки дома.


Так
вот, целевой вектор куда пойдет решение человека, в коммерческую ветку
или некоммерческую, зависит от массы факторов, и все они уже ЕСТЬ в
вашем графе запросов на самом деле.

Направленный граф и все
логические расстояния между выражениями, отражающие длинну и вес
логической связки создается именно от причины к следствию, совпадая с
вектором поиска юзера. Он ведь идет от следствия "похудеть"
конкретизируя (находя на самом деле в процессе поиска именно ту причину,
которая лежит в основе его счастья).

Вы никак не поймете, что для
того, чтобы создать обратный граф, вовсе не надо его заново строить,
нужно просто преобразовать имеющиеся координаты выражений в нем.
вывернуть его наизнанку.

А степень коммерциализации запросов
позволяет просто более эффективно СТРОИТЬ этот классификатор целей. Я
просто предлагаю вам более правильный и красивый путь, вот и все...А вы,
похоже, застряли на своих ассоциациях там...

Я буду ретранслятором - между Вами и таром. Какую мысль Вы не смогли уловить?

Если под накрутить понимается:

создав интересное событие, то да, можно )

глум это хорошо...особенно над тем, кто в эту сторону думать не может принципиально :)

зачет

А попробуййте задать "Стив Джобс" ))

подсказки хорошо придуманы
Это облегчит поиск. Молодцы.

Не знаю технических деталей, но это удобно.

 

Наконец-то! Я знал, что когда-нибудь такие подсказки будут. Специально для Яндекса я сформировал rss ленту надеюсь это поможет улучшить поисковые подсказки для моего сайта.