Блог Яндекса для вебмастеров

Яндекс исправляет ошибки в запросах

10 апреля 2008, 13:48
Ошибки в поисковых запросах были и остаются темой пристального внимания разработчиков Яндекса. Мы считаем восстановление правильной формулировки запроса важной частью программы повышения качества поиска.

Есть несколько способов работы с опечатками в поисковых запросах: подсказка правильного написания, автозамена, подмешивание (поиск как правильного, так и ошибочного написания). В Яндексе применяются первые два. В тех случаях, когда не хватает уверенности в правильности замены, используется подсказка.

Когда Яндекс считает замену уместной, запрос исправляется автоматически. При этом над результами поиска появляются сообщение об автозамене и ссылка на выдачу по запросу, написанному с ошибкой.

Автоисправление ошибок мы внедряли в несколько этапов. В ноябре прошлого года начали автоматически исправлять и перезадавать запросы, для которых не нашлось ни одного документа. Два месяца мы наблюдали за реакцией пользователей на нововведение, после чего включили автозамену и для ненулевой выдачи.

Сейчас поисковая система ежедневно выявляет опечатки в 2,5 млн запросов (из 25 млн, задаваемых Яндексу). Автоматически исправляется около 1 млн запросов (4% от общего потока): 600 тысяч независимо от количества найденного и 400 тысяч при нулевой выдаче.

Разработчики лингвистических технологий, пишем без ошибок
86 комментариев
Единственная претензия -- в строке поиска опечатку исправлять не надо.

Раз напомнили об опечатке и все и не делайте полного дурака с потребителя сервиса

где тогда ее исправлять, если не там?
Разумеется, в результатах поиска. И в строке-подсказке над ними, где "вы, вероятно, имели в виду ...".
Шевченко Юрий
10 апреля 2008, 14:55
Жалко, что игры с заменами/подсказками работают только с одним вариантом исправления. Вот отсюда http://www.yandex.ru/yandsearch?text=%EE%EF%F2%E5%EA%E0 попасть на оптику нереально, а хотелось бы
Возможно на взгляд яндексоидов написать "оптека" подразумевая "оптика" - это что-то из ряда невозможного ;-) Хотя было бы не лишним наверное предлагать несколько вариантов.
Шевченко Юрий
10 апреля 2008, 15:29
да, именно об этом я и говорю. предлагать не самое популярное слово для замены, а список из 2-4 по популярности было бы куда кошернее, на мой взгляд
Значит ли это, что в последствии могут исчезнуть страницы с сознательными опечатками, созданными исключительно для поисковых машин и как следствие сократится количество слов по корпусу документов со значительным пересчетом весов слов?
Ну, пока ещё у таких страниц есть шанс. Всё-таки исправляется миллион запросов из 2,5. Меньше половины.
Вроде бы автозамена случается только при нулевой выдаче по оригинальному слову. Если опечатка проиндексировалась (скажем, "превед"), она находится.
Речь шла про страницы с сознательными очепятками. =)
Ну да. Если такая очепятка нашлась роботом-индексатором, она будет найдена поиском. Тут всё честно.
Андрей Белов
10 апреля 2008, 18:10
Не, написано же: "Автоматически исправляется около 1 млн запросов : 600 тысяч независимо от количества найденного и 400 тысяч при нулевой выдаче." При нулевой выдаче - меньшая часть.
Как же иногда бесит эта автозамена даже при нулевой выдаче… Помните про Принцип Шоу.
Сэндвич, сендвич... Что-то не нравится мне такая назойливость, я склонен писать через Е.
А правильно через «а».
Видимо, не в строительной тематике =)
подсказка - это хорошо, а вот автозамена выдачи - не очень, может быть стоит в настройках поиска дать возможность пользователю вкл./выкл. автозамены?
Андрей Белов
10 апреля 2008, 15:54
Недавно на Роеме этот вопрос поднимался: http://roem.ru/2008/04/05/addednews5967/ Пока без ответа.

На 1000% согласен,почему за меня решает "дядя"

Александра
10 апреля 2008, 15:16
Ужасное нововведение. Очень злит, когда запрос сам меняется.
в чем проблема нажать на ссылку "быть может, вы искали?"...
Александра
11 апреля 2008, 11:12
Для того, чтобы подправить тот же запрос (добавить/удалить слово, например), нужно сначала загрузить выдачу по ссылке «Показать результаты для [первоначальный запрос]» или вручную исправлять в строке поиска. Гораздо гуманнее выдавать то, что нашлось; а в случае возможной ошибки — давать ссылку «Показать результаты для [исправленный запрос]».
учитывая уровень грамотности населения в последнее время, думаю, гуманнее все-таки автоматическое исправление. В конце концов, загрузка "правильной" выдачи ест не так много трафика. Конечно, не в том случае, если Вы намеренно целыми днями набираете неверный запрос и ждете ответа.
Александра
11 апреля 2008, 12:03
В этом аспекте мне лично нет никакого дела до уровня грамотности населения ни в какое время. Загрузка ещё одной страницы — раздражает, потому что я не хочу грузить никакие дополнительные страницы и следить за тем, поменяли ли мой запрос, и как именно его поменяли. Я хочу писать запрос и править его самостоятельно. При нулевой выдаче или начилии ссылки на испраленный вопрос раньше я всегда сама могла решать: изменить слово, переформулировать запрос, или пойти по ссылке. Теперь этого выбора нет.
Вы сейчас точно так же можете решать сами, менять слово, переформулировать вопрос, или идти по ссылке (искать нужное слово "до конца"). Оболочка изменилась, а выбор все так же остался за вами.
Александра
11 апреля 2008, 12:32
Сейчас строку меняют без меня, и нужны дополнительные движения для того, чтоб вернуть её к тому виду, который был мне нужен. Изменение запроса не всегда вызвано именно грамматической ошибкой. И для того, чтоб, например, нажать на ссылку Google внизу страницы и поискать ненайденное Яндексом там, нужно самому менять строку обратно или отдельно открывать Google. В этой ситуации становится проще просто сразу открывать Google, где никто самовольно не меняет мой запрос. Я лояльно отношусь к Яндексу и мне очень не хотелось бы отказываться от привычки искать в нём, а уже потом, если нужно, в Google. Измененять запрос я хочу самостоятельно и никак иначе. Если Вас это нововведение не раздражает — Вам повезло, Вы репрезентативны.
Почему меня должен волновать уровень чьей-то грамотности? Если я написал так, как написал, у меня были на то причины. И исправление запроса в поисковой строке меня люто и бешено бесит. Я из-за этого стал реже пользоваться яндексом и чаще гуглом. Ненавижу, когда кто-то смеет пытаться решать за меня.
вы меня удивляете ))) а вы так часто пишете неграмотные запросы?
Я часто пишу запросы, состоящие из слов, которых яндекс не знает. А ещё бывает, что я ищу чьё-то конкретное высказывание, неграмотное, да. Так или иначе, исправлять запросы автоматически - отвратительно.
Пожалуй, специально придуманные каламбуры приходится вбивать чаще, чем ошибаешься в запросах. Хочу я проверить, не придумал ли кто-то некую шутку раньше меня, вбиваю, к примеру, [лисная тварь] (просто для примера, только что из головы взял) и мало того, что вижу тысячи найденных страниц, так ещё и начинаю сомневаться в собственной вменяемости, потому что в поле запроса написано [лесная тварь]. Спасибо, дорогой «Яндекс», я пока не идиот, но ты настойчиво пытаешься меня им сделать.

Это Яндекс решает, что неграмотный запрос,не зная ответа на запрос.Достаточно одного напоминания с их стороны,а далее автор решает ,что делать.

А я вот думаю настроить у себя по умолчанию английский Гугл, потому что русский стал совершенно невыносим. Доходит до того, что вводишь два слова латиницей, он их транскрибирует и выдаёт на первой странице исключительно русскоязычные документы с написанием слова кириллицей. Если я ищу, скажем, [video magazine], почему я должен читать ту хрень, что Гугл мне подсовывает на русском?

А вывод один-должны быть гибкие,понятные и с примерами,настройки "поисковика" под себя (автора запросов) с учетом его потребностей.

Полностью согласен. Но это правильно (удобно) с одной стороны (с нашей). Поиск - это именно та тема, что лучше выбрать то, что удовлетворяет большинство (удобно большинству). Т.е. Яндекс наверняка уже при тестах засёк и из двух вариантов (сразу исправлять или не исправлять и предлагать выбор) выбрал тот, который устраивает (юзает) большинство. Т.е. если, например, 70% этим довольны (от них небыло действий продолжить искать по ошибочному запросу), стоит удовлетворить их требования, чем оставшихся 30. Да и по тихоньку подтянется грамотность в Интернете. Сайты будут перед выкладкой в Ворде проверять, появятся он-лайн сервисы проверки орфографии, работа корректоров будет еще больше востребована, на филологические факультеты конкурс 500 человек на место и т.п. =)

Да поймите же. Не о исправлении неграмотности чаще всего идет возмущение от потребителей ,а исправлении яндексом смысла запроса ,якобы для исправления грамотности.

используйте язык поисковых запросов и будет Вам счастье, никаких замен не будет.
например можно сделать запрос так: "!тилефон" см.: http://www.yandex.ru/yandsearch?text=%21%D1%82%D0%B8%D0%BB%D0%B5%D1%84%D0%BE%D0%BD
Это тоже лишние движения, а лишние движения - всегда плохо.
Вот согласен с вами на ФСЕ 100% ))) Ищу то как пишу и именно такое вхождения я ищу, а не то, на что мне автоматом правют!
Есть такая фишка: в последнее время народ начал часто говорить на сленге, обдуманно коверкая тем самым само слово - "превед" и так далее.. Таким образом образовалась некая прослойка, которая не отвечает понятию грамотного правописания. Тем самым, если исправлять слова на автомате, выдача будет нерелевантная - ищущий имел в виду совсем другое слово. Поэтому лучше искать как ввели, а давать ссылочку "Быть может, вы искали:..."
Ну... С Преведомто как раз все нормально ;)
Все верно )) Это просто пример из нового безграничного набора слов..Все равно возникнут спорные ситуации по словам, а для того, чтобы этого избежать, нужно как я думаю оставить поиск по тому слову, которое вводят. Тем более, что есть ошибки на самих сайтах, проиндексированных поисковиками и если сделать автозамену, то эти сайты даже при хорошем контенте не станут релевантными увы...
А чтобы были релевантными, нужно писать ГРАМОТНО. В общем-то, Я способствует сейчас повышению уровня грамотности населения - рано или поздно ты заметишь, что с сайтом что-то не так, и исправишь орфографические ошибки, а не будь автоисправления - так и сидел бы дуб дубом ;)))
Насчет Грамотности я согласен. ОДнако, человек не робот и ему крайне сложно писать безошибочно со 100% грамматикой и орфографией, отсюда - ошибки, даже если они не специальные. Поэтому вводить жесткий грамматический контроль ПОКА точно не стоит, ибо не удасться все население переделать с т.з. корректного изречения и правописания.
Любопытная мысль в итоге получилась )) Т.е. не все люди могут писать без ошибок (ну, случается, не спорю), но при этом если их исправляют - они почему-то начинают возмущаться и считать, что их обделили :-))) Так они специально ошибки делают или нечаянно, определись? ))
Смысл в том, что если "этих человек" было 1 да 2 да обчелся - я не спорю - это разумно. А когда это уже эпидемия российских масштабов, то увы, исправить все не реально в принципе, т.к. каждый день ктото исправляет, а ктото добавляет новые ресурсы с грамматическими и орфографическими ошибками. И нет от этого вакцины - это человеческий фактор )) И его нужно учитывать при поиске в любом случае.

Ну что ж. Как бы не заметим 2008 год и чуть-чуть займемся некромантией.

1. Значительная часть людей не могут не делать опечатки.

2. В условиях дефицита времени даже когда человек знает как правильно пишется многие не исправляют опечатки (и объектом поиска зачастую может быть именно такой текст, речь не об опечатках в поисковых запросах, а об искомых текстах с опечатками, в отношении которых авторам этих текстов безразлично будет ли оно наилучшим образом проиндексировано - выдал ценную для кого-то информацию и забыл).

3. В состоянии утомления (даже у людей с грамотным сразу набором текста) количество опечаток увеличивается. И опять информация именно из такого источника может представлять интерес.

4. Многие специально искажают слова в качестве каламбуров.

5. Специфическое написание может быть использовано и как специальный опознавательный знак или отличительный признак. Частным случаем этого является следующий пункт.

6. Как уже сказано, не только каламбуры побуждают видоизменять написание слов - для того чтобы, например, зарегистрировать слово в качестве торговой марки это делают специально. Знаете, очень раздражает, когда вместо нулевой выдачи по не самой известной торговой марке выдается куча нерелевантных запросу результатов поиска.

А учитывая, что Яндекс стал порой произвольно заменять запросы даже на правильно с точки зрения орфографии написанных словах, заменяя их на более распространенные, или (Вообще безобразие!) самовольно заменяя закавыченный запрос, который раньше искался именно в таком виде, перестал в каких-то случаях реагировать на минусование в запросе слов, которые не должны отображаться в результатах поиска (вместо того, чтобы предоставить возможность использовать какое-то слово как исходный шаблон фильтра) - очень подмывает пользоваться Яндексом лишь как вторым поисковиком, когда нужно посмотреть кэш страницы, недоступной в данный момент.

7. Ориентироваться на большинство вместо того, чтобы предоставить возможность и меньшинствам настроить поведение поисковика под свои нишевые нужды (благо ничего сверхсложного в этом нет) - это просто способ сократить свою аудиторию. Да, в некоторых случаях коммерчески выгоднее "не заморачиваться", особенно если игнорировать репутационные издержки и существование такой вещи как конкуренция. А ведь нишевые нужды - это одновременно и более направленная и, соответственно, дающая бОльшую отдачу реклама. Ну, да, кому это интересно... Не Яндексу же ;)

 

А по поводу данной в обсуждении рекомендации пользоваться языком поисковых запросов - учитывая то, что с какого-то момента расширенный поиск утратил значительную часть своей гибкости, рекомендация весьма ценная.

 

Вполне допускаю, что некоторые запомнившиеся мне претензии к поисковой выдаче уже не актуальны. Это говорит только о том, что когда очень ценную во многих случаях возможность внедряют дубиной - наиболее яркими откладывающимися впечатлениями становятся как раз негативные, хотя и позитивные тоже были.

На Хабре как раз обсуждают интересную ситуацию по поводу "грамотности" Яндекса. Забавно ) http://habrahabr.ru/blog/yandex/39606.html
на мой взгляд, это мегафича. я ею пользуюсь, когда перепроверяю назначения педиатров (почти все педиатры делают орфографические ошибки в названиях препаратов). с другой стороны, могу себе представить случаи, когда это может быть неудобно. например, если ты лингвист и изучаешь орфографические колебания в русском интернет-языке.
sasch.gorbunov2010
3 апреля 2011, 08:56

оптека

Да уж... оптимизация под ошибки канула в лету... Кстати, данная "работа над ошибками" работает минимум месяца два. Видимо только сейчас решили объявить официально.
А если мне нужно найти именно слово с опечаткой? Как это можно сделать?
Ламченко Андрей
12 апреля 2008, 01:51
все эти движения и нововведения мне напоминают обезьяну с гранатой.
вообще-то это боян, и этому бояну почти уж как месяц http://mexboy.ru/?p=45
Здравствуйте. Функция замечательная, но, пожалуйста, откройте API для всех. Чтобы нуждающимся не приходилось так нагло и некрасиво выкручиваться - http://pipes.yahoo.com/exp30/yamsp Неудобно же :) А вообще, на самом деле всё больше нравятся ваши сервисы. Увлечённые люди у вас работают. Спасибо.
Да, пожалуйста, откройте API
дайте доступ для народа к этому апи
Откройте API, поможете всем честным и белым.
Поддерживаю, откройте API для всех.
тоже за! откройте API для народа!
Поддерживаю. API был бы полезен, сразу бы на его основе плагинов для популярных CMS понаделали для разных форм комментировния (а то и самого содержания), а значит интернет стал бы грамотнее в целом.
А что случилось? Никакого уведомления не было, при этом сообщение моё не появилось в списке комментариев. Не то что бы баг, но нехорошее поведение сервиса, т. к. оставляет недоумение у пользователя.
А-а-а... вон что, тут была ещё ссылочка "+ 8 ответов". Всё равно не правильно - после комментария нужно перекидывать сразу сюда :)
пожалуйста, дайте доступ для народа к этому апи
Очередной заскок у команды Яндекса - теперь решают что и как искать пользователям.

А как можно скормить поисковику новое слово, которое он еще не знает? 

Ищущим сайт budist.ru ("Будист" с одной "д" – от слова "будить") людям, которых изо дня в день становится все больше, Яндекс отдает неправильную выдачу, исправляя запрос на "буддист" (исправляет как при поиске кириллицей, так и латиницей).

При этом если кликнуть на запрос с "опечаткой" – там уже нормальная выдача, в основном про будист.ру и всякие записи в блогах, где люди действительно пытались написать про буддизм.

Как можно исправить эту ситуацию?

А как быть в такой юморситуации: ищу  - "Аратовский художник", поисковик "исправляет" на "Саратовский художник" и сует мне этого дяденьку? А известного художника-карикатуриста Аратовского он от меня скрывает. И что?

Разработчикам "лекарства от ошибок"

 Как же вы достали! Где ваши мозги? Почему до сих пор нет галочки - отключить автозамену? Причем на самом видном месте!

Ищу кабель АППВ-ХЛ - меняет на АПВ-ХЛ

Набираю просто АППВ - все находит

И это не единичный случай, когда в наименовании товара яндекс самовольно меняет индексы и ничего естественно не находит!

(-1)

 

Наконец-то я нашел как эту автозамену отключить!

http://help.yandex.ru/search/?id=486817

Не совсем конечно, но перестало мозг мне вскрывать.

 

Весьма полезная информация! :)

"Когда Яндекс считает замену уместной, запрос исправляется автоматически. При этом над результами поиска появляются сообщение об автозамене и ссылка на выдачу по запросу, написанному с ошибкой. "

Враньё. Ищу " Киниет Татанов", яндекс находит "Кинет Татанов", ссылки на выдачу запроса, написанного с ошибкой НЕТ. Киниет - это имя, а не кидалово

firstlena.pershina
6 июля 2015, 13:04

В большинстве случаев такие автоисправления действительно помогают, но в данном случае, действительно, оно отработало странно. Сейчас проверяем, в чем дело. Спасибо большое, что обратили на это наше внимание.

Добрый день, а у нас с запросом "Домофонд" беда. Выдает "Домофон" даже не делая подсказки. Тем более странно что запросов домофонд до октября 2015 г. по яндекс.вордстату больше!!!!! чем запросов "домофон". КАК ТАК!?

У нас идет ТВ компания, а яндекс людей на покупку домофонов отправляет! написали в службу поддержки, мол зарегистрированный товарный знак, миллионная аудитория. В ответ - Я передал Ваш пример соответствующим специалистам, они проанализируют ситуацию с указанным запросом и при необходимости внесут поправки в работу программы.

Логично бы было не исправлять на сравнимую по частоте альтернативу + смотреть частоту не за 100500 лет, а в том числе за последний месяц, например

Хотелось бы ясности. Спасибо за понимание.


firstlena.pershina
13 января 2016, 15:37

Добрый день! Продублируйте ваш запрос в поддержку Вебмастера с аккаунта, под которым подтвержден сайт. Посмотрим, что тут можно сделать. Для того, чтобы написать туда, нужно зайти на страницу информации о подтвержденном сайте и перейти по ссылке «Обратная связь», которая находится внизу данной страницы.

Ура, все заработало! Злая автозамена была побеждена!

Да бывает, что это хорошо. Исправили, спасибо, ищем. Но если это не опечатка разве трудно кнопку (НЕ ФИКСИРУЕМУЮ - ТОЛЬКО НА ТЕКУЩИЙ ЗАПРОС) "НЕ ИСПРАВЛЯТЬ" и все. Еще раз набираю, как я хочу и ищу.
ВАШЕЙ ФАНТАЗИИ НЕ ХВАТАЕТ ДЛЯ ПОНИМАНИЯ МОИХ ЗАПРОСОВ. ТАК ЗАЧЕМ НАВЯЗЫВАТЬ ИСПРАВЛЕНИЕ. ПРИШЛОСЬ ПЕРЕЙТИ НА ГУГЛ
зачем так категорично исправляется "опечатка" в поиске? мне не нужен эвалар, я ищу Эвлар, причем такой вариант поиска даже не допускается. Шибко грамотный поиск Яндекса знает только  Эвалар. Видимо придется отказываться
Достали грамотеи! Похоже, не только хозяин тындекса, но, и разработчики русским языком не владеют! Перестаньте автоматически исправлять слова в поиске. Сами разберёмся. А для ЕГЭшников можно особый вариант соорудить.
Сергей Цуканов
28 сентября 2016, 23:25
нет слов. поиск тупо игнорирует "не" и "без" перед словами. хуй знает ищу ли я то что хочу или хаваю то что пропихивают?
Минус , когда я ввожу (  . ) то есть точку. Яндекс исправляет ее на - Точка знак препинания , как это исправить?