Блог Яндекса для вебмастеров

Прюнинг

21 мая 2008, 20:14

Продолжаем рассказ о "Магадане". В новой программе улучшена скорость поиска по запросам, по которым  находится большое число документов. Для этого мы применили технику под названием "прюнинг". Время поиска сократилось за счет появления еще одной стадии поиска -- на ней отсекаются заведомо нерелевантные документы.

Как это происходит? В формулу ранжирования, которая определяет релевантность страниц, входит множество факторов, как зависящих от запроса, так и статических по отношению к нему (они характеризут страницу или сайт, а не пару "страница-запрос"). На стадии прюнинга на основе всех статических факторов для каждого документа оценивается вероятность того, что он окажется релевантным запросу. Если вероятность низкая, документ дальше не анализируется.

По таким запросам как [новости] и [жж] время поиска было сокращено в десятки раз. При этом ускорение  поиска было достигнуто без всякого ухудшения его качества.

 


Андрей Гулин, ускоритель

 

Между прочим, 

Яндекс старается дать ответ на запрос, сократив время и усилия пользователей. Спрашиваете "погода"? Отвечаем: "Москва, +12 °C, дождь" (см. ответ в первой строке над результатами поиска), если вы живете не в Москве, погода будет показана для вашего города. Спрашиваете "Елена Колмановская"? Отвечаем: "Елена Колмановская — Яндекс, главный редактор". И ссылка на пресс-портрет, составленный по материалам СМИ. Мы называем такие подсказки "колдунщиками", потому что от них иногда создается впечатление, что поисковая система понимает всё, что вы хотели, и даже больше. :)
18 комментариев
Подписаться на комментарии к посту
То то всё съехало наперекосяк и опять мусор в топе.
Нет, это никак не связано. Примеры запросов с мусором, если можно.
пример не с мусором, сравнение кач-ва поиска (стоит отдать должное до Магадана и после - результат почти не изменился). Когда-то искал в Яндексе любимый стих Фета по строчке: "я пришел к тебе с приветом рассказать", первое же место в поиски очень улучшило настроение, для интереса сравните с Гуглом
по радовало ))
Перегнули с этим Магаданом - по некотором запросам совсем не то ищем
Комментарий удалён
это к гуглю ))
gaudeamus-omskcity
22 мая 2008, 06:45
"В формулу ранжирования, которая определяет релевантность страниц, входит множество факторов" Множество фактров. Хе-хе, всё же правильно предполагалось когда-то...
На Илью персс-портрет есть. А когда спрашиваем "Александр Садовский" выдается: «Александр Садовский» Садовская Александра Ивановна — САДОВСКАЯ (Августинович) Александра Ивановна (г. жизни неизв.) Певица (сопрано) ... Агин.. Нехорошо получается :)
ржал до слёз )))
Думаю такой баг поправят в ближайшем будущем. П.С. Улыбнуло :-)
Пока непоправили...
Посмотрим, посмотрим
Ну если говорить про колдунщик, то не стоит забывать о калькуляторе :) Запроc 2+3 в Google и в Яндексе Запроc дважды два в Google и в Яндексе
Решением Наблюдательного Совета Фонда Развития Интернет c 28 апреля 2008 г. в домене SU снимаются ограничения на регистрацию доменов с префиксом xn--, что позволит пользователям вводить часть адреса в строке браузера в национальной кодировке. А Яндекс все показывает домены как xn-- В ноябре 2007 г. на Форуме по управлению Интернетом, проходившем в Рио-Де-Жанейро, представители ICANN, ЮНЕСКО и Международного Союза Электросвязи (МСЭ) решили объединить усилия по внедрению IDN, признав многоязычность ключевым элементом современного Интернета. Эту позицию активно поддерживает мировое интернет-сообщество. Видно Я не входят разработчики в это сообщество.
Скажите, как можно найти на конкретном сайте документы word с определенным заголовком, или ссылкой-заголовком?
запрос url="fff*" ничего не хочет искать
я заметил по нескольким сайта такую тенденцию - до МАГАДАНА позиции сайта 30 после магадана 10. Первый АП позиция 15 второй ап позиция уже 23 ___________________________________________ Такое ощущение что магадан это не тот самый релевантный поиск а улучшение сервиса поиска! в Пользу скорости.