Технология «Спектр»

15 декабря 2010, 13:45
Когда пользователи задают запросы к Яндексу, примерно в 20% случаев они формулируют запрос неоднозначно. Например, по запросу [наполеон] кто-то хочет найти полководца, а кто-то – рецепт торта. А задавая запрос [суши], человек может искать и ресторан с доставкой на дом, и рецепт блюда. Спектр возможных целей может быть очень широк – так же, как и спектр возможных ответов. И если пользователь не указал в поисковом запросе, что он ищет, то понять это крайне трудно.

Сегодня мы внедрили новую поисковую технологию, которая умеет учитывать множество неявных целей пользователей и показывать соответствующие ответы. Новая технология так и называется – «Спектр».

В основе работы «Спектра» лежит статистика поисковых запросов. Система исследует запросы всех пользователей Яндекса и выделяет в них различные объекты – это могут быть имена людей, названия фильмов и книг, модели автомобилей и тому подобное. Каждый объект относится к одной или нескольким категориям. Например, в запросе [колдрекс инструкция] название лекарства «Колдрекс» — объект, который попадает в категорию «лекарства». А объект «Пушкин» относится к двум категориям — «поэты» и «города». На данный момент «Спектр» выделяет около 60 категорий, и это количество будет еще расти. Знание категорий позволяет поисковой системе понимать разные значения слов в поисковых запросах.

Кроме того, «Спектр» умеет учитывать при поиске различные потребности пользователей. У каждой категории есть список возможных потребностей – тех намерений, с которыми пользователи ищут тот или иной объект. Например, когда люди ищут какой-нибудь товар, они, как правило, хотят купить его или почитать отзывы и обзоры. То есть для категории «товары» среди потребностей будут «купить», «отзывы» и «обзоры». Всего у категории может быть от двух-трех до нескольких десятков потребностей.

С учетом того, в какие категории попал объект, что люди обычно про него спрашивают, что пишут в интернете и т.д. «Спектр» оценивает процент людей, которые ищут этот объект с каждой из возможных целей. Эти данные используются при ранжировании результатов поиска по многозначным запросам. Используя их, «Спектр» вычисляет пропорции, в которых ответы на ту или иную тему должны быть представлены в результатах поиска. Найденные сайты упорядочиваются таким образом, чтобы спектр ответов соответствовал спектру вопросов. Таким образом, поиск Яндекса максимизирует вероятность того, что человек найдет именно то, что искал. Даже если он не указал это явно в своем запросе, а просто подумал.

«Спектр» анализирует поисковые запросы полностью автоматически – каждый раз рассматривается очень большой массив запросов, более пяти миллиардов. Их обработка происходит одновременно на нескольких сотнях машин. Чтобы данные не теряли актуальность, «Спектр» запускает процесс анализа несколько раз в неделю.

Кроме статистики запросов, «Спектр» умеет использовать данные из справочников и энциклопедий – в том числе из Википедии. Это помогает распознавать недавно появившиеся объекты, узнавать, какие значения объектов не укладываются ни в одну из существующих категорий, и добавлять новые.
105 комментариев
Подписаться на комментарии к посту
Давно уже пора делить выдачу на коммерческую и не коммерческую.
Только все это засунуть в 10 позиций первой страницы - жесть.
В Беларуси половина выдачи российской тусит - крутяк)
А чему ты удивляешься, в .RU зоне давно уже нет различий с .ua типа я там хочу то что знавет за меня Яша.
Точно что новый алгоритм!
До регионов судя по всему еще не добрался этот "Спектр"
ну что же:))

феерично.


- а давайте сделаем юзером еще тупее.


- как?


- технология спектр - один запрос и думать не нужно.


- давайте


 

Вы посмотрите бел. выдачу по слову гольфы - треть выдачи про носки, треть про авто, треть про игру.
Мне кажется, что люди, которые ищут авто гольф или игру гольф не будут вводить запрос "гольфы". А вот те, кто ищет гольфы (всмысле носки), как раз таки так и введет.
Доктор Kno существует
В ответ отпимизаторы припишут в Тайтлы слова: отзывы, обзор и т.д. по списку всего Спектра категорий, ну и разбавят анкоры ссылок дабы иметь больше шансов завладеть выдачей.
Да, боюсь, что многие так и начнут поступать. Но как вы, наверное, понимаете, некоторая защита от подобных действий была сделана заранее, и они зазря испортят себе и тайтл, и карму.
После сказанного Вами стало тревожно за свой сайт, который построен какраз на обзорах и отзывах (это соответственно упоминается в тайтлах и ссылках).
Всё будет хорошо. Главное, чтобы обзоры-отзывы были хорошие, настоящие. Для людей :)
А то :)  Их сами люди-то и пишут.
Люди для людей, ничего себе... все для людей и техника и отзывы к ней прилагаются B-)
соотношения типов отзывов смотрим? :)
классифицируем...
а отличать хороший отзыв от плохого не можем...
прискорбно...этим ведь можно пользоваться...дырочкас образовалас...
Спамишь дорогой, скопировал мой коммент и разместил на инородном сайте еще и подписали неким "masco". Надо бы Яндексу понизить ваш сайт за неоригинальный контент.
Поверьте, Маско, нечаянно прописался. Поправил-с.

Если сайт такой плохой, то, конечно, понизьте. За то я буду знать, кто же в Яндексе НАСТОЯЩИЙ хозяин)).
Есть, правда, нюанс один: пользователь часто открывает несколько вкладок сразу и потом их смотрит. Без Бара такое поведение не отследить. Да и с ним не всегда получится.
Это только Google может отследить - Chrome - помогает. ))))
А кто сказал, что яшка не впаривает никому файрфокс уже с баром?)
Бар можно отключить. Хром - нет. Доля Хрома активно растет. Браузер, в отличии от любого тулбара, полноценный шпион. Тулбар куда менее надежный способ подсматривать за пользователем.
Хром пока слабоват... А те, кто набирают нечёткие запросы, как правило, мало переживают из-за бара и не знают, как его отключить :) Поэтому бар как раз-таки хорошо показывает поведение основной массы пользователей, а не всяких продвинутых программеров и оптимизаторов). Собственно, Яндекса это вполне устраивает и достаточно для выводов.

Спасибо яшке за то, что он ещё держится на ногах), совсем не хотца, чтобы остался только Гугл.


Хром пока слабоват...


9% пользователей. Уверен, это значительно больше, чем браузеров с Яндекс.Баром.
Чтобы получить такой же охват, Яндекс.Бар должен стоять на 15% всех браузеров Firefox и Internet Explorer. При этом технически таких же возможностей, как у Хрома, все равно не будет:
Хром (по крайней мере теоретически) может запоминать даже
- то что ты пытался вводить в поисковую адресную строку, но не ввел;
- то что ты ввел в адресную строку (часть поискового запроса) до того как выбрал ссылку на сайт
- в какой момент какое окно у тебя было активно
- движения мыши по окну с сайтом

И много чего еще - на что фантазии хватит.


А те, кто набирают нечёткие запросы, как правило, мало переживают из-за бара и не знают, как его отключить


Правильнее сказать: не знают как его поставить :)


Спасибо яшке за то, что он ещё держится на ногах), совсем не хотца, чтобы остался только Гугл.


Повеселили. Спасибо.

Хром (по крайней мере теоретически) может запоминать даже

- то что ты пытался вводить в поисковую адресную строку, но не ввел;
- то что ты ввел в адресную строку (часть поискового запроса) до того как выбрал ссылку на сайт
- в какой момент какое окно у тебя было активно- движения мыши по окну с сайтом
И много чего еще - на что фантазии хватит.


Всю эту статистику отлично собирает Яндекс.Метрика, которая установлена почти на всех толковых сайтах). А уж то, что пользователи делают в поисковой системе и на всём портале Яндекс, как водят усом т.п. мышкой), что вбивают в поиске - Яндекс отлично фиксирует). Ему ничего не мешает.

Хромом же  пользуется узкий круг людей и это явно не те, кто не может правильно  составить поисковый запрос. Поэтому статистика собранная им будет  характеризовать определённый достаточно узкий круг аудитории.
Догадается ли Спектр, что "Фото Пушкин" не может быть про поэта, а "фото Жуков" и про город, и про поэта, и про полководца?
http://yandex.ru/yandsearch?text=%D1%84%D0%BE%D1%82%D0%BE+%D0%B6%D1%83%D0%BA%D0%BE%D0%B2&lr=213 - вроде бы, неплохо

http://yandex.ru/yandsearch?text=%D1%84%D0%BE%D1%82%D0%BE+%D0%BF%D1%83%D1%88%D0%BA%D0%B8%D0%BD&lr=213 - поэт есть. Но есть и во всех остальных поисковых системах, я проверил. Возможно, в этом случае все-таки все поисковики как один не ошибаются, и многие пользователи действительно задают грамматически несогласованный запрос, ожидая увидеть наше всё.
Семен Воронкин
15 декабря 2010, 17:34
Продвигать сайты становится всё сложнее :)
все интересней ;)
И дороже для килентаФ B-)
Это смешно конечно...как в Википедии прямо... а можно найти синонимы на китайском например.
Хорошо бы научить Яндекс искать простые вещи сначала, а то выдача 5 летней давности от сегодняшней не отличается, а сайтов много появилось -)
Ощущение такое, что яшей школьники рулят и развлечения себе придумывают в виде алгоритмов всяких и псевдодостижений.
А почему нельзя было винести сию полезную фичу в подсказку быстрого поиска по запросу, отчеркнув ее от традиционной выдачи? Т.е. при наборе "Жуков" вывести что-то типа:

Вы имели ввиду:
полководец Жуков
город Жуков
поэт Жуков
-----------------------------
далее как обычно

Никому не хочу давать советов, но на мое имхо, поисковая система должна искать, а не гадать. :)
зачем??? это же путь наименьшего сопротивления.

через 2-3 месяца будем смотреть, что изменится, пока ничего не поменялось
По однословникам - поменялось, но логику я пока не вполне уловил, а ждать придется по-любому.
Не очнеь понимаю, как это видно на практике, что изменилось в поиске?.. Поясните, пожалуйста.
введи в поиске http://yandex.ru/yandsearch?text=%F1%F3%F8%E8&lr=213 как пишет Яша, изменилась выдача. Я разницы не вижу. Як были клиенты в топ, так и остались =)
Считаю это не совсем корректным. Почему тупой компост должен пользоваться спектром, составленным из уточненных запросов, которые формировали явно умные люди... по моему тут явное нарушение авторских прав.
Иван Сагалаев
15 декабря 2010, 22:13
Андрей, а как, собственно, понять, в чём именно вся эта красота выражается на практике? То есть можно ли как-то узнать, что по запросу такому-то раньше было так, а теперь — сяк. АБстрактное "поиск стал лучше" почувствовать невозможно, он и раньше, вроде, по слову "Пушкин" находил поэта…
Вообще, понять, чем одно ранжирование лучше другого, всегда гораздо проще изнутри Яндекса, имея доступ к статистике: если улучшение существенное, то растут CTR-ы всех позиций выдачи, меньший  людей "уходит ни с чем" и т.п.

"Снаружи" можно показывать только отдельные примеры, об изменениях в каждом из которых при желании можно долго спорить. Самое заметное "на глазок" изменение - не ранжирование, а подсветка дополнительных уточняющих слов, помогающая быстро выхватить взглядом нужный результат. Задай, например, запрос [пицца] или [кофеин], и посмотри десятку.

Изменения в ранжировании показательны, например, на запросах, которые задает моя дочь (ей 6 лет), скажем, [пантеры] или [айболит] - стало гораздо больше картинок или мультиков, которые можно тут же посмотреть, и гораздо меньше длинных текстов (совсем оно не исчезло, потому что есть и люди, которых интересует боевое применение танков "Пантера" на Курской дуге или ветеринарная клиника). Есть интуитивное ощущение, что эти изменения - правильные, "маленькие девочки с косичками" эти запросы задают чаще, но при этом "свои" результаты в новой выдаче найдут все-таки не только они. Статистика эти ощущения подтверждает.

Ну и вообще, иногда меня самого приятно поражает, какие вещи спектр "знает". Например, посмотри на богатство языков в выдаче http://yandex.ru/yandsearch?text=%F6%E8%EA%EB+for&lr=213
Иван Сагалаев
16 декабря 2010, 00:14
Вроде понятно. По крайней мере, понятно, почему мне это сразу не понятно :-). Потому что я редко оказываюсь в ситуации, когда пишу в поисковик что-то настолько общее. Обычно я пишу конкретный термин с уточняющими словами и вижу в первой строчке единственный ожидаемый результат :-). Типа [RFC 2616] или [аэропорт Шереметьево]. Нецелевая аудитория я, короче :-).
>если улучшение существенное, то растут CTR-ы всех позиций выдачи, меньший  людей "уходит ни с чем" и т.п.

Трудно ответить однозначно... В моём понимании, наоборот, если CTR-ы всех позиций начнут расти, значит выдача стала хуже. Получается, что посетитель заходит в поиск и начинает скакать по сайтам, в поисках инфы. Не находит и кликает по следующим. Вот CTR и растёт.

Хотя с другой стороны, если считать динамику изменения CTR среди уникальных заходов пользователей, то вполне возможен рост CTR при улучшении выдачи. Так как каждый пользователь будет в выдаче находить свой ответ среди десятка представленных результатов.
Казалось бы, надеяться получить содержательный ответ на комментарий, написанный в подобном тоне, не станет даже совсем недалекий человек. Поэтому попытки понять, зачем вы его оставили, сначала завели меня в тупик.

Но, кажется, я понял! Вы, похоже, чем-то сильно расстроены, и пытаетесь вылить своё зло в интернете. Не знаю, с женщинами у вас проблемы, или сайт не продвигается никак, или еще что, поэтому затрудняюсь что-то вам посоветовать.

В любом случае, не печальтесь, все пройдет! Вот вам картинка для поднятия настроения:
прости, что длинно - торопился
"А объект «Пушкин» относится к двум категориям — «поэты» и «города». На данный момент «Спектр» выделяет около 60 категорий"

Ну зачем же так сразу обманывать. Как-то слабо верится, что при наличии всего 60 категорий нашлось место для категории "поэты". (Иначе там и "нарисованные тонкой кисточкой из верблюжьей шерсти", а это уже совсем фигня). Стало быть, категории "Поэты" нет, а есть какая - "люди", "литература"?
Категории, стало быть, из Википедии берете? Почему не Я.Каталога?
Эти 60 категорий  - это крупные категории, охватывающие примерно все запросы Яндекса или это небольшие категории, охватывающие его часть?
Региональное распределение учитываете? (Понятно, что запрос "Зенит" в Питере и Красногорске означает разные вещи)
И когда наконец можно ожидать, что этот "Спектр" прикрутят к Директу?
И что с порно? Помнится, Яндекс заявлял в качестве политики - не показывать порно по двусмысленным запросам (т.е. если порно-тематика не задана явно; один из классических примеров - "училки"); теперь же "Спектр" должен делать прямо противоположное - если 99% ищущих "училок" ищут порно, то что должен показать Яндекс? Сейчас мне на первом месте показывают "Когда треугольничек ее ануса достаточно размягчился...". Не знаю, как было вчера, но вот этот "треугольничек ануса" - это "Спектр" постарался или как?
Да нет, мы не обманываем. Посмотрите выдачу по запросу "Пушкин", и обратите внимание на десятый результат. Для объектов из категории "люди" вряд ли выделялась бы отдельная потребность "любовная лирика", правда?

Категории и не из Википедии, и не из Каталога, они у Спектра собственные. Размер у них бывает разный - поэтов, как вы справедливо заметили, мало, а товаров очень много. Но в конце-то концов, поэтов мы ценим не за их размеры!
Давайте лучше посмотрим статистику по запросу "Белый".
Вордстат уверяет, что я искал либо цвет, либо поэта. А предлагают - цветовой колдунщик (кул, но не про "Спектр") , магазин, остров и дайвинг (в Питере).
Андрей Белый - только на четвером месте, и это единственный поэт в десятке.
То есть не знаете вы поэта Белого, что при наличии такой категории среди всего шестидесяти - сложновато.

Ну да ладно, дело ваше, вывели "поэтов" в отдельную категорию - значит, вывели.

(Если что, это не критика, боже упаси, направление архиверное - просто пытаюсь примерно понять, как оно работает.)

Давайте еще поэкспериментируем.
"Руслан и Людмила поэма" - 23700 показов страниц по Вордстату.
"Руслан и Людмила опера" - 5600.
"Руслан и Людмила фильм" - 3100.
Соотношение запросов, условно, 8:2:1, однако по запросу же "Руслан и Людмила" в первой десятке семь поэм и три фильма, а опера появляется только на 14-м месте. Недоработка алгоритма? А как должна выглядеть идеальная выдача для такого запроса?
Сделайте что нить   с товарным запросом " свингер"  -  женское пальто.
В картинках тоже срамота.
В смысле, переколбасить выдачу ради тех 0,1% процента пользователей, которые под словом "свингер" подразумевают непременно пальто?
  Ну это нечеткий запрос. Однажды  Яндекс говорил, что по нечетким запросам  клубничка будет подавляться  в выдаче.   Она остается  только по своим, четким запросам,  типа " порно.
Что ж, хоть чаще всего я задаю в поиске Яндекса (да и других поисковых систем тоже) запросы вполне конкретные, то есть либо те, по которым хочу найти конкретный результат (пр. город Орел, одежда Пума и т. д.), либо те, по которым хочу, чтобы мои сайты искали и находили другие люди (дабы проверить, кто находится в топе, и отвечает ли какой-то сайт на данный запрос лучше, чем я), все равно вещь нужная.

На мой взгляд, нововведение зачетное, если только оно будет работать как положено :) 

Прошу извинить за столь сложное предложение с разными видами связи, но по-другому сформулировать не получилось :-O
Не лучше ли всё-таки дать пользователю самому искать то, что ему нужно, а не решать за него? Лучше сделать больше настроек для поиска, чем пытаться показывать смешанную выдачу.
А что, язык запросов отменили? Или не позволяют в запросе больше трех букв вводить? :)
А где в языке запросов возможность выбрать "категорию" или "потребность"? И много ли людей пользуются языком запросов? С тем же Наполеоном, например, куда лучше дать пользователю возможность явно уточнить запрос, а не показывать смешанную выдачу.
В языке вопросов можно задать все :) А вот обособленный вопрос "много ли?" отношения к теме не имеет, так как с ним надо задавать еще 100500 вопросов, ответы на которые есть "внутри" яндекса.

Чем выше квалификация пользователя, тем хуже он реагирует на нововведения для чайников. Это не только к ПС относится. А вот кого больше, чайников или гиков, знает яндекс и действует не на ощупь :) :)
Ну и как же задать "категорию" или "потребность"?
Ориентация на чайников принципиально неправильная, потому что она влияет на поведение самих пользователей. Если прятать от них возможность любого выбора, любой настройки, то чайники об этой возможности и не узнают. Они будут считать, что смешанная выдача - это то, что и должно быть. И вообще, чем больше параметров учитывается, при том, что выдача остаётся для всех одинаковой, тем больше Яндекс стимулирует всех подстраиваться под некий стандарт. Скажем, в данном случае многие начнут подстраивать сайты, чтобы по популярному запросу сайт попал в более популярную категорию. Если бы единой выдачи не было, и такая проблема бы исчезла.
Запрос
"поэт Пушкин конкорданс купить"


Поэт            Пушкин    конкорданс    купить
^ категория   ^ объект   ^др. объект    ^ потребность

Тут даже язык не нужен, просто запрос формулируешь :) Не умеешь формулировать и не устраивает работа "спектра" - учись, там хелп есть.

Эни озер квещенс? Синсирели фром зе харт! :)

1. Лично мне профигу на траблы СЕОшников, апсолютно.
2. Учить - это не задача яндекса :) Задача Яндекса отвечать на вопросы которые задает уже кем-то и как-то обученный массовый пользователь :)
3. Для гиков, более сложные инстументы поиска никуда не убрали, так что нормуль :)
А кем "обучен" массовый пользователь? Он обучается тем, что ему предоставляют, в данном случае, тем способом поиска, который предоставляет Яндекс. Если пользователь умеет пользоваться компьютером, думаю, вряд ли стоит считать его полным идиотом, и если он умеет работать с Windows, то без проблем научится использовать и дополнительные возможности по настройке поиска. Ориентация же на какие-то стандарты создаёт положительную обратную связь - Яндекс подстраивается под действительные или мнимые предпочтения пользователей, пользователи подстраиваются под Яндекс. Что касается траблов сеошников, то тут не только траблы сеошников, но и траблы вебмастеров, и траблы пользователей, которым Яндекс всё время подсовывает усреднённый результат. Просто здесь позиция Яндекса по "Спектру" идёт в том же русле, что и учёт других факторов - например, поведенческих, под которые тоже будут подстраиваться, чтобы пользователь, например, походил по сайту, посмотрев пару лишних страничек, пока найдёт искомое, даже если это и не нужно, и т. п. Не хотелось бы, чтобы "улучшение" поиска сводилось в итоге к выдаче всё более усреднённого результата и принуждению вебмастеров подстраиваться под некие стандарты. Яндекс должен стремиться не дать пользователю максимально точный ответ, а предоставить возможность максимально удобно найти то, что нужно.
Жизнью он обучен, как правило фигово. "Не пускайте детей в интернет, он от этого глупеет" :) Слышал такое? А еще можно поговорить про АКПП и пластиковый чехол под капотом, понимаешь куда клоню? И его не считают полным идиотом, его поведение изучают и делают выводы, в том, что выводы такие виноват сам пользователь (в т.ч. и мы с тобой, что не научили всех своих знакомых грамотно формулировать запросы) :)

У 70% людей, несмотря на то, что в резюме написано "опытный пользователь ПК", замятие бумаги в принтере вызывает священный ужас, промолчу про процесс смены картриджа :)

Да, Геля Иванович тоже очень любит вопрос обратной связи, в каком-то смысле я его точку зрения разделяю, но...
... это массовый сервис.
... никто не забирает возможность к самообразованию, не отнимает более сложные инструменты поиска.

Ведь никто не бросает все и не бежит спасать мир, почему мы этого должны требовать от "Яндекса", Google, MS  и т.д.
Один управленец как-то сказал: "Основная социальная роль бизнеса - платить налоги!" Лично я с ним полностью солидарен (мы сейчас не рассматриваем коррупцию и распилы), остальное - добрая воля.

А вот теперь возьми весы и положи на две чаши разные социальные действия - налоги и образовательную роль. Как думаешь, Яндексу социальноответственнее работать на массового потребителя и платить больше налогов или "заставлять людей учиться" и терять пользователей, выручку и платить меньше налогов? Учти, что речь идет о конкурентном рынке.
Ну тут уже пошла путаница и иррациональные доводы. Можно сказать, конечно, что и ориентацию на дураков и ориентацию на получение прибыли я считаю в принципе неправильной. Допустим, ты пошёл к врачу лечить зуб. Тебя что интересует - как он тебе его вылечил или сколько он с тебя взял и заплатил с этого налогов? Думаю, ответ очевиден.

Выбор в последнем абзаце предлагается ложный. Яндексу лучше сделать качественный поиск и научить пользователей им пользоваться. Если они увидят, что они получают желаемый результат, то Яндекс их не потеряет, а наоборот, приобретёт. И никто, конечно, не исключает варианта типа "автоматическое определение настроек" для совсем идиотов. Здесь тоже можно привести простую аналогию. Есть, например, три продукта A, B и C. Можно сделать так - посмотреть, какой больше покупают и начать выпускать его больше. А можно попытаться понять, что же будет удобнее для пользователя и сделать продукт D. Яндекс идёт пока по первому варианту.
Спорить с человеком, который называет вывод ложным и не приводит доказательств - скучно. Человек ленив и учиться в большинстве не любит это определяющий фактор :)
Во-первых, этот вывод я аргументировал. А во-вторых, нужно уточнить, что ленив и не любит учиться современный человек, выросший на примерах западного образа жизни. Потому общество у нас сейчас и деградирует, а Запад заселяется мигрантами и теряет своё влияние в мире.
Это вам так кажется). На самом деле всё должно быть как можно проще и автоматизированно. А уж кому нужно, пускай лезут в настройки стоят себе выдачу как им нужно.
Хотябы из-за того, что одни из комментаторов выше решил сказать такое:
>Почему тупой компост должен пользоваться спектром, составленным из уточненных запросов
Поэтому всё должно быть просто, чтобы любой пользователь быстро получил нужный ему ответ. Даже если вопрос поставлен не точно.

p.s. тупой компост - это же надо было так основную массу пользователей обозвать)
Яндекс с таким подходом скоро загнётся. Считать пользователей идиотами - это тупиковый путь. Честно говоря, те, кто исходит из подобной позиции, с моей точки зрения, сами обладают не очень высоким интеллектом.
Не знаю не знаю... Я пока продолжаю пользоваться яшкой, ну не нравится мне что-то в гугле. Не родное это что-то). Яндекс более близкий, с ним хоть пообщаться можно...
http://yandex.ru/yandsearch?text=%D0%BE%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BB%D1%91%D0%B3%D0%BA%D0%B8%D1%85%20&lr=213
смотрим на первую позицию - оказывается легкие из металлоконструкций.
запрос рояль - роял конин оказывается из Рояля делается.
Запрос женщина - пятое место "камасутра с картинками"
Яндекс делай бэкап не позорься сырыми алгоритмами :)
Спасибо за удаленные комментарии, которые вчера писал. Яша не любит критику - Яша первоисточник истины, он знает что я ищу: битва экстрасенсов на Яндекс, угодайте что я ищу.
Запрос "девочки" или "игрушки" жгет тоже :-D все как я и думал, банально просто на выходе из безобидного запроса того же ребенка может выйти порнушка.
При прочих равных, сайты, содержащие в себе много разных «потребностей» (например, сайт «заточен» под «купить», «отзывы» и «обзоры» — получается как бы сайт «обо всём») при таком подмешивании будут ранжироваться хуже, чем узконаправленные сайты конкретно с «отзывами» или конкретно с «обзорами»?
Нет, не хуже. Если, согласно спектру запроса, в выдаче должна быть отражена какая-то потребность (например, отзывы), то при выборе кандидата важно то, насколько хорошо он удовлетворяет эту потребность, а не то, насколько плохо - остальные. :)
2Не кинокритик
однобокая политика однако, почтайте запись обычного пользователя Марии Ивановой ниже. Если вы говорите, что результат лучше виден "изнутри" (читал выше) то смотрите логику (как я это вижу):
Пользователи ищут "Наполеон-а" больше народу ищет торт а не самого человека, отсюда вывод что человек который ищет человека - его не найдет в первой десятке, более терпеливые могут искать до второй страницы. Другой пользователь уйдет и будет искать в другой ПС.
Если я ищу по запросу "женщина", или "девочки" вот что я нахожу:
частные фото девочки, камасутра в картинках. Получается чем больше даунов и извращенцев - тем грязнее и пошлее выдача, тем больше людей находят не то, что ищут и тем больше CTR тупых запросов.
В общем погнавшись за большинством - вы можете потерять аудиторию вменяемых людей, останутся только те люди, которые сами не знают что ищут или хотят: "все побежали и я побежал (c)" :-D
По-моему проще набрать "холодильники самсунг отзывы" - логично? Хотя, возможно это одна из игрушек как в Яндекс.Погода (где однорукий бандит) кликаешь смотришь выдачу (кручу верчу, запутать хочу)  и смеешься...Как то так.
Мне кажется проблема можеть быть в том, что торт "наполеон"  ищут значительно больше людей, чем полководца "Наполеон".
А значит может получится, что при запросе "Наполеон" будут вылезать сплошные торты, что по факту является не верным. Хотя, бы потому, что тортик назван в честь полководца, а не наоборот :)

Ну и конечно, те кто действительно ищут торты, скорее наберут "торт наполеон", а не просто наполеон, хотя люди бывают разные :)

Поэтому, тут главное, чтобы всё учитывалось адекватно, а лучше бы сделали, что при таких противоричивых запросах, прежде чем выдавать результаты, предлагалось уточнить...
А то в итоге, будет каша в выдаче и хорошо если нормальная каша... а в это слабо верится, по крайней мере сейчас уже выдача слабо релеватная. 
>Мне кажется проблема можеть быть в том, что торт "наполеон"  ищут значительно больше людей, чем полководца "Наполеон".
А  значит может получится, что при запросе "Наполеон" будут вылезать  сплошные торты, что по факту является не верным. Хотя, бы потому, что  тортик назван в честь полководца, а не наоборот :)

Что же в этом не верное? Не важно, кто в честь кого был назван. Яндекс же не по этому принципу ранжирует сайты))). Яндекс стремиться дать ответ, удовлетворяющий наибольшее число пользователей и это получается.

>Ну и конечно, те кто действительно ищут торты, скорее наберут "торт наполеон", а не просто наполеон, хотя люди бывают разные :)
Ну сначала пишут наполеон, а потом, когда выдача не устраивает, многие запрос уточняют. Со спектром уточнять запрос придётся гораздо реже!

Яндекс молодчина, он сделал правильный шаг и это главное. Он пытается быть живым)
А зачем убрали ссылку на Блоги из основного поиска?
Раньше было удобно - ввел запрос, посмотрел выдачу, потом нажал "блоги", поискал отзывы.
Красндорар однозначно хорошая система должна быть!
А почему "Краснодар"?
ИМХО, это какое-то технологическое уложение ради усложнения. Есть ведь возможность все сделать проще! Вот допустим у меня "неявные цели" обычно связаны с выискиванием фактов и цифр. Такова моя специфика. Если я спрошу "СУШИ" то скорее всего для выяснения сколько тонн их делают, как давно придумали и какова тенденция их потребления... И эту мою характеристику очень легко выследить считывая, что я кликаю в поисковой выдаче и как на долго ухожу по ссылкам. Буквально месяц наблюдений -- и можно будет догадаться, что набирая слово "Блины" я тоже ищу что-то такое.... И так можно склонность "неявных целей" у каждого определить. Кто-то будет искать товары, кто-то новости, что-то хохмы и т.д. Психотипы не меняются (или меняются медленно) и все будут довольны. 

Яндекс потихоньку приближается к почетному статусу "поисковика для домохозяек". Дом-2, Ксюша Собчак, Яндекс... :)


Работаю в компании, которая занимается производством и реализацией разного рода железяк (тм). Заодно есть еще 3 сайта (тоже небольшие заводики). Запросы - очень узкоспецифичные, все сайты - старые трастовые ресурсы в топе. В выдаче - каша полная. Первые места по СЧ и НЧ запросам сейчас занимают ГС с рефератами, доски объявлений и каталоги.


Интереснее другое - поисковый трафик вовсе не упал. Или точнее с Яндекса упал, с Гугла - возрос. Гугл же не пытается в ромашку играть: что на первом месте, то и на первом. В итоге Яндекс в минуса, Гугл в плюс, ну и наслаждайтесь дальше сами своим "бетховеным" - люди найдя в Яндексе кучу рефератов быстренько идут в Гугл и там что надо находят.


Кстати, поскольку отслеживаю выдачу Яндекса по разным регионам одновременно (около 10), то поразило еще вот что: в "своем" регионе выдается правильная страница, в других - все, что угодно, но близко не похожее на запрос. У меня в основном страницы в "чужих регионах" - страницы с описаниями, схемами монтажа и подключения и прочее, похожее на "рефераты". Что радует - у конкурентов так же. :)


 


"Яндекс это зеркало рунета"? Уже нет. Зеркало не придумывает, что хочет увидеть заглядывающий в него, оно просто показывает. "Яндекс - поиск для домохозяек!" :)


 


Пысы: http://hghltd.yandex.net/yandbtm?fmode=inject&url=http%3A%2F%2Fwww.uztour.ru%2F&text=%D0%BA%D1%80%D0%B0%D0%BD%20%D0%B1%D0%B0%D0%BB%D0%BA%D0%B0&l10n=ru&sign=ee20fbaf1392b767a8feaa26e0eafc63&keyno=0


- улыбнуло. :)


Запрос "кран-балка". Сайт в топе. "Гостиницы Ташкента, Бухары, Самарканда и других городов Узбекистана... Электрические тали, тельферы, кран-балки, лебедки." Там внизу страницы ссылка с сапы с этим анкором.


Мощно, Яндекс! Внушаитъ! :)

жжошь в точку :)
>> А задавая запрос [суши], человек может искать и ресторан с доставкой на дом, и рецепт блюда.

Ввел запрос "суши крокодила", так поисковик мне про армию вообще ничего не выдал, странно... а в армии эта тема популярная.., недочет Яндекса, однако :)
Всю эту статистику отлично собирает Яндекс.Метрика, которая установлена почти на всех толковых сайтах). А уж то, что пользователи делают в поисковой системе и на всём портале Яндекс, как водят усом т.п. мышкой), что вбивают в поиске - Яндекс отлично фиксирует). Ему ничего не мешает.

Во-первых, на всех толковых сайтах стоит Google Analytics или более продвинутые системы аналитики. Метрика стоит на столь малом числе сайтов, что даже Яндексоиды стесняются говорить об этих числах на конференциях, когда им задают этот вопрос. Что вбивают в поиске (в поисковой строке браузера) не фиксирует никто. Если посмотреть код Яндекса, то даже при вводе поисковых запросов и выдаче подсказок он фиксирует далеко не все, что можно было бы.

И вообще как-то очень внезапно вы съехали с Яндекс.Бара на Метрику. ;-)


Хромом же  пользуется узкий круг людей и это явно не те, кто не может правильно  составить поисковый запрос. Поэтому статистика собранная им будет  характеризовать определённый достаточно узкий круг аудитории.


Хоромом пользуется 9% посетителей. Это объективные данные. Выборка репрезентативная. Пользуются им те, кому он удобен или кому его поставили. Выборка более чем репрезентативная. Других данных я не встречал. Если у вас есть - поделитесь. Только не с аргументом ОБС, а желательно со ссылкой на какое-нибудь вменяемое исследование. ;-)

Я не говорю, что у Яндекса нет достаточно хороших данных о поведении пользователей на сайтах. Но наилучший инструмент для анализа поведенческих факторов - это популярный браузер. И он есть только у Гугла.
А как же IE? :-D
Вы про Bing? Ну это в нашей стране пока не особо актуальный поисковик. Да и не уверен я, что Bing использует его данные. Хотя теоретически такая возможность, конечно, есть.
К сожалению, Яндекс по-прежнему (как и Гугл) не может отличить псевдо-сайт-помойку от сайта для людей.
К примеру, покупает ОШБ в апреле 2010 г. домен mba.spb.ru и ставит на нем одну статью из СМИ.
Яндекс это радостно проглатывает и выводит теперь этот сайт на 2 место в СПб по запросу "бизнес-образование".

Еще более забавно, что для поиска по СПб выводится Бизнес-образование, Казань и Республика Татарстан | AllInform.ru
Смотрите - в случае со СПЕКТР-ом получается, что сайты с узкой аудиторией проигрывают доскам, формумам и даже иногда не тематичным ресурсам - вот я описал выдачи НЧ по версии СПЕКТР - честно получается ахинея иногда - страницы сайтов на которых толпы ссылок на другие ресурсы - то что раньше называлось поисковым спамом - теперь считаются более релевантными, нежели нормальные сайты... у Вас же есть служба построения качественного поиска, или у них зимняя спячка??
Привет,
на самом деле, по этому запросу ни один результат не появился в выдаче именно благодаря "Спектру". Дело в том, что запрос [уборка квартир в Тольятти] при всем желании сложно назвать многозначным - что именно нужно пользователю, задающему такой запрос, вполне очевидно.

А за пример спасибо. Насчет 1-7 мест с вами можно спорить (мне, например, кажется, что пользователя гораздо больше интересуют цены и качество уборки, нежели любые мыслимые параметры сайта компании; лично я думаю, что идеальной выдачей по такому запросу была бы вообще не привычная "десятка урлов", а список телефонов с ценами и отзывами). Но вот 8-10 явно ошибки. Баги я позаводил.
7-место грубо говоря статья о Московской компании - при поиске компании в Тольятти это не логично

Угу, правда. Кто бы вот еще объяснил, зачем клининговая компания из Москвы рекламирует себя статьями на сайте из Тольятти.
ради ссылочной массы покупают такие статьи)))) это же просто)) - статья ни очем , не претендует на оригинальность и смысловой позыв....
а как вы назовете такую выдачу межкомнатные двери фрамир в екатеренбурге??
доска с рекламой с фирмы из ленобласти, хотя сайт сам двери в екатеринбурге
доска с рекламой питерского сайта
сайт
питерская доска
питерский сайта
московский сайт - хотя есть тут есть екатеребургская соствляющая
питерский сайт
каталог с ссылкой на питерский сайт
доска с рекламой питерского сайта
доска с рекламой питерского сайта


мне кажеться что это треш тоже
На самом деле вы слегка не к тому человеку обращаетесь, я не занимался регионализацией практически. Но неважно, черт с ним, Яндекс и Яндекс, мы тут все роботы, как известно. Мне самому уже интересно стало. Я попытался поискать эти самые двери фрамир в Екб всякими способами, в том числе в других поисковиках (тм). Вот смотрите, на чем я сдался:
http://yandex.ru/yandsearch?text=межкомнатные+двери+фрамир&lr=54 ?
Это запрос "дайте мне все сайты из Екб, на которых вообще бывают такие слова". Их всего 4. Ни один из них, судя по тому, что я вижу, эти самые двери фрамир (чем бы они ни были) не продает - они просто вставили слово "фрамир" зачем-то (ну то есть понятно зачем, SEO, "бьют по площадям"). И чего Яндексу делать? Выдумывать результаты? :) Или писать "ничего не нашлось"?

Или это вы троллите меня так?
я не тролю - просто интересно.. так сказать и шкурный интерес присутсвует...
извините, что вас мучаю, но вы анонсировали и решил логичным тут писать - ведь доски и т.п. это как раз СПЕКТР
в общем смотрите - вы были в СПБ (производят там) и увидели там двери компании Фрамир - решили теще такие же поставить - забили в поисковую строку довольно четки запрос "межкомнатные двери фрамир в екатеринбурге" - результат 103 ответа и 48 контекстных объявлений - а реально что-то соотвествующих ответа 4, кстати странно в выдаче на 3-ем месте стоит еще один сайт не указанный в вашей выдаче..

и с точки зрения качественного поиска более удобно - 4 наиболее верных результата или 103, в которых 99% абсолютно не подходящих, не будем говорить об окружающем контексте - с точки зрения пользователя прошу Вам ответить

кстати помниться в далеких 98-99 годах иногда отдавалось по 5-15 ответов всего иногда..
к опросу надо больше людей привелчь..
У меня вопрос к разработчикам, двухсловный Запрос "site delta" - почему выдает совсем не то? (что нужно...мне нужен плагин site delta). Это связано с "Спектром"? я так понял нет т.к. это двухсловный запрос.
Не связано.
Плагин называется SiteDelta (пишется слитно), и по раздельному написанию в данном случае слитное не ищется. Это само по себе нехорошо, надо бы искать, я посмотрю, как можно исправить подобные случаи. Спасибо за репорт.

Ок, спасибо за внимание. Прошу прощения за предыдущие посты (эмоции взяли верх, часть моих сайтов просто провалилась по некоторым запросам..).
Комментарий удалён
Я по этому запросу вижу 10 результатов про обои. Поменял регион про Украину, там тоже всё в порядке. У вас точно нет никаких подменяющих выдачу вирусов и т.п. радостей?
http://clubs.ya.ru/4611686018427444576/
здесь написано как надо ссылки покупать в спектре, чтоб работали, и вообще...
ввбиваем детский запрос "мультик про мужика в очках" и получаем выдачу в которой 6 жестких порно ответов!

Я думаю CTR точно повысится при такой выдачи, особенно если ребенок решит мультик посмотреть!
Гасилова Ирина
29 апреля 2011, 23:18

Да уж, есть над чем подумать.

kukoleff.serzh
5 мая 2011, 17:33

Каждый тематический  документ формируется автором в соответствии с определёнными правилами. Эти правила, как и стиль изложения, задаётся и описывается на примерах документов каждой тематики в терминах структуры и связей между ключевыми понятиями и словами.
Это позволяет сразу находить предметные соответствия. Предметность
определяется наличием общего и частного понятия в одном тексте, например, [авто-объявление]. Все слова можно проиндексировать по степени общности или конкретики, выдавая результаты уже связного поиска. Опционально.

Такое соответствие можно установить даже между математическими знаками "+-*/" в качестве последовательности операций накопления [отрицания, слияния и разделения]. В общем виде.

потребность == интенсионал?

Вот это флэшбек!

Если я правильно понял вопрос, то нет, т.к. тот текст никакого отношения к Яндексу не имел. Даже если неправильно, то все равно нет. Слово "интенсионал" в семантике обозначает что-то, что ближе к термину "спектр" в том понимании, в котором он тут используется, а не к отдельной "потребности".

Конечно, я ступил с вопросом, подразумевался "спектр". Да что-то мне сегодня решётки эти взбрели в голову, хотел разобраться, что к чему, проводил параллели. Пока не очень понимаю.