Блог Яндекса для вебмастеров

«Обнинск» — новое ранжирование для гео-независимых запросов в России

13 сентября 2010, 17:34
Поисковая программа «Обнинск» вышла из стадии бета-тестирования, новый алгоритм обрабатывает гео-независимые запросы на yandex.ru.

Над «Обнинском» мы работали особенно тщательно, потому что новая программа улучшает ранжирование по гео-независимым запросам, а таких в потоке до 70 процентов.

Для тех, кому интересна внутренняя кухня: сложность формулы ранжирования выросла почти в два с половиной раза, и теперь объем формулы составляет 280 Мбайт (совсем недавно, в июле 2010 года, Илья Сегалович на конференции SIGIR рассказывал, что формула ранжирования, занимавшая в 2006 году 0,02 килобайта, разрослась до ~120 Мбайт, а теперь ему снова придется перерисовывать слайд).

Первыми пользователями нового ранжирования стали украинский (август) и белорусский (сентябрь) поиски. Российской же версии (которая, собственно, и есть «Обнинск») потребовалась дополнительная оптимизация: поскольку пользователи задают Яндексу порядка ста миллионов запросов в день, мы были обязаны обеспечить новому алгоритму максимальную производительность (даже если он заметно сложнее предыдущего).

Спасибо всем, кто принял участие в бета-тестировании.

Ден Расковалов и команда поиска отправляются в следующий город
84 комментария
Подписаться на комментарии к посту
Артёменко Александр
13 сентября 2010, 16:37
Очень интересно, а что такое "объем формулы"? Почему он измеряется в мегабайтах?
Иванов Роман
13 сентября 2010, 17:47
Ну вот смотри.
Вот формула: Z = x2 + 25*y/2

Её объём 15 байт, считая пробелы. А у Обнинска формула занимает 280 мегабайт.
Программисты Яндекса написали руками формулу размером 280 мб?
Не верю.
Слушай, зачем руками, да?

Оно само себя пишет, машинное обучение-то... ;)))
Иванов Роман
13 сентября 2010, 20:52
Не руками. Стоит почитать, начав отсюда: http://company.yandex.ru/technology/matrixnet
Артёменко Александр
14 сентября 2010, 12:04
Хм, мне, как не разбирающемуся во внутренностях поисков, такие цифры кажутся маркетинговой "разводкой" типа пресловутых мегапикселов в фотокамере :)
убойный пример (+1) 000 000 :))
Интересно как будут влиять региональные ссылки ;-)

На стадии тестирования ,которая была доступна всего несколько дней, выдыча была в разы лучше, сейчас много ерунды, очень обидно.


 


И если честно, я не понимаю, зачем Вы создаёте новое, когда старое работает очень плохо, с регионами до сих пор ерунда, с геоклассификатором запросов очень много вопросов.

Да уж. Классификатор слабенький. Некоторые ГЗ запросы были отнесены к ГНЗ, почему - непонятно. Стремление вперед конечно похвально, однако формулы надо писать расчитав их. А так обять хрень какая-то. Кое-что конечно стало лучше, но все же...
112тыщ страниц А4?)
Посмотрим как это будет на деле работать, а то как всегда много хороших и интересных сайтов будет на 100 месте.
Конечно в первые дни будет чихарда, но постепенно все наладят.
Уже видно, ребята работают, все становится лучше.
Действительно все налаживается, теперь выводится более реальная информация.
Все отладят и будет блогадать.
Судя по всему номализовалось все.
220 Мб - это, конечно, интересно, но не факт, что чем объёмнее формула, тем она лучше.
Чем сложнее система, тем выше вероятность отказа и сложность управления и настройки. к 1гб интересно что будет
система будет иметь искусственный интеллект, быстро сообразит, что она зависит от сайта yandex.ru, будет пытаться выжить - приобретет независимость - переселится на другие сайты и забанит сайт yandex.ru
:-)
К тому идет ;)
есть другая формула:
рост объема в мегабайтах формулы релевантноси прямо пропорционален росту кол-ва ГС в выдаче... :-)
ну а гугл всё равно, в среднем, вернее отвечает на запросы пользователей и с этим не поспоришь!
Честно говоря измерять качество поиска по объему формулы, это точно так же как по объему памяти для видеокарты считать что встроенная видеокарта с ддр2 512мб - которые из оперативки быстрее внешней видюхи с дд3 но объемом 256мб - наивно, не так ли? так что не в объеме дело, а в качестве.
P.S. пока что сильных падений на своих сайта не наблюдал, в основном все в плюс, что и слеловадо ожидать от чисто белого SEO.
Яндекс ранжирует, а мы оптимизируем.
Бег без конца и края.
Яндекс уже давно отмирает как поисковая система, наверное не формулу надо было менять, а мозги в управлении.  Поиска нормального и объестивного как такового никогда не было, а сейчас, когда яндекс повыкидывал огромное количество страниц из выдачи, не стало и совсем. Найти что-то полезное, не говоря уже о том, что ты ищешь конкретно, стало невозможным, из-за чего многие в последнее время переходят исключительно на Google, просто удаляя за ненадобностью бестолковый поиск от яндекса в своих браузерах.
если формула весит 280 Мб - надо менять компилятор
Золотые слова!
может ресурсы? джопеги? мп3? а может, боюсь произнести, это на дэлфи?
...формула весила 120 мегабайт, потом 280, потом 820, 5 Гб, потом 50... а потом выпуск новых верситй был остановлен, т.к. программисты запутались...
Что обидно, что г***а в выдаче меньше не стало. ((((((

Новый алгоритм поиска Обнинск - встречаем, встречаем, встречаем !!! Уважаемые зрители, наши участники уже подходят к своим столам, осталось совсем немного времени до начала нашего шооооооу ! [:]||||[:]

 

Ну что ж, это интересно, посмотрим, насколько он адекватен... Снежинск мне понравился, но Яндекс колбасило так, что, казалось, роботы сошли с ума ! Новый алгоритм разрабатывался в упоре на то, чтобы эффективнее мочить платные ссылки и ГС или все же большей частью для "справедливого ранжирования" ? >:-) Ответит ли Яндекс.Поиск на мой вопрос ? Сколько говносайтов было уничтожено в прошедший апдейт ? Какие фильтры разработаны Яндексом в рамках нового поискового алгоритма ? Ответы на эти и другие вопросы вы получите чуть позже, когда будет известно, какие изменения в поисковой выдачи после введения алгоритма Обнинск отмечают оптимизаторы !

 

Ну а сейчас Дэн Расковалов и группа Яндекс.Поиска пока не раскрывают своих планов и отправляются в следующий город !

 

P. S. Информация о наблюдениях ранжирования по новым алгоритмам Обнинска будет вывешена позже (B)


P. P. S. Продолжается серия публикаций на тему организации распределенных систем создания, поддержки и управления сайтами для заработка в Интернете.


 

Ну ок. Новый алгоритм ввели, но где же апдейт ? Где пересчет позиций по новой формуле, которую не словом сказать, не пером написать ?

Терзают меня смутные сомнения по поводу данного алгоритма ...

Время покажет, но выдача как была не релевантной, так и осталась ...
Читать умеете? Апы были, около трех штук..

β-версия
ну посмотрим на ваш обнинск
Даешь Гигабайт №*ядь!!!!!!!!!

Ждал от нового алгоритма нормальную поддержку зоны РФ. Ничего не изменилось, если только в худшую сторону, а так как сайты РФ находятся итак в самом низу, то и даже этого не узнать. ))) Будете вообще зону РФ двигать, или так... зачем мол нам лишний геморой... ?


Такое ощущение, что зона под всеми фильтрами лежит. Уж сколько ссылочного, изменений да трафика на правительстве и президенте, а даже там показатели до сих пор нулевые. Что вообще с этой зоной творится? Яндекс как никак отечественный поисковик (ну в узком смысле - поисковик). За эти месяцы можно было подряд 3 сайта в любой другой зоне из песочницы вытащить, а тут даже различные новые снипы косячат...

вылетел
В ближайшие годы следует ожидать роста объема алгоритма до общего объема информации Рунета, а затем превышения объема алгоритма над объемом информации. :-O

Смайлики здесь уродливые какие-то.
что-то я не пойму - почему все-таки 280 МБ? Оптимизировать не пробовали? Это дурство! реально программисты не смогут соображать, что где и как! Только я сомневаюсь, что там формулы в виде Z = x2 + 25*y/2
Там наверняка типа :
если регион "масква", то $region="0"
если регион "обнинск", то $region="1"
но все равно не понятно - на что можно 280 МБ!!! забить??? оптимизируйте, товаг'ищи
и где можно подробно узнать - как работать владельцам сайтов?
а вот если я не зарегестрирован в я.вебмастер? как я могу сменить свой гео-регион? что, нельзя в мета-тегах указывать эту информацию?
Посмотрим чего он стоит!
Предыдущий не совсем адекватный был.
Сайт туристической тематики часть контента написана с 0 вообще не какими иисточниками не пользовался, писал после личных путешествий, а в поиске только главная стр.
Может из специалистов подскажет причину отсутствия в поиске страниц.
Отчет о поездке в Индию
Индия цены
а я думаю почему, апы нормальные раз в два месяца идут,
а тут у них формула 280 метров,
если к каждому сайту такую формулу применить, не быстро получится

Судя по размеру формулы яндексойды в ручную каждому сайту прописывают релевантность
Ну что же, посмотрим мои труды по продвижени качественного сайта среди других качественных сайтов:))
Будем надеяться что новое ранжирование будет лучше чем старое, хотя, думаю это будет не сразу.
Я расколол новый алгоритм Обнинска.
Никакого поискового спама, ВЕСЬ текст страницы релевантен запросу..
Тайтл и контент решают всё.

http://yandex.ru/yandsearch?text=%D0%BF%D0%BB%D0%BE%D1%89%D0%B0%D0%B4%D0%BA%D0%B8+%D0%B4%D0%BB%D1%8F+%D0%BC%D0%B5%D1%80%D0%BE%D0%BF%D1%80%D0%B8%D1%8F%D1%82%D0%B8%D0%B9&clid=46510&lr=213

6е место в топе

http://furshet66.ru/uslugi/ploschadki_dlya_meropriyatiy

Учитесь, КАК надо двигать под новый алгоритм!

говноматрикс с говнообнинском, м-ля...
да, у яндекса подобного навалом
вот например еще, пустой сайт прибитый в топ-1
Все налаживается, выдача боле менее нормальная, новостники еще присутствуют но дкмаю это дело времени.
ой йо..оно ещё и в топе по москве...
Регион "Екатеринбург"
Ну вот вам для размышления про иффективность выдачи,
Запрос - утилизация аккумуляторов.
http://yandex.ru/yandsearch?text=%D1%83%D1%82%D0%B8%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F+%D0%B0%D0%BA%D0%BA%D1%83%D0%BC%D1%83%D0%BB%D1%8F%D1%82%D0%BE%D1%80%D0%BE%D0%B2&lr=213
Не поленился и даже в некотрые фирмы позвонил, вот результат "качественной "выдачи для Москвы.

1 место этим не занимается.
3. место новость о связном.
5. место новость о связном.
6. место Не занимаются.
7. место Не ясно для Москвы это или Перми.

Это только в 10, половина не то, что дальше.
Ну тут то это причем? Сделаю я сайт о порнухе и буду продвигать как порнуху, а телефоны гринписа повешу. Никакой алгоритм не сможет сопоставит методы раскрутки по ключам , надписи тайтла, контент и т.д. с реальным положением дел в компании. Не звонить же им и потом на основе звонков определять выдачу)))
P.S. А то, что они находятся в топе по нецелевым ключам, ну пусть скрин распечатают и на стену повесят - толку мало от этого. 
В результате того что ищет пользователь найти трудно,
До обнинска такого не было, два новостника которые ни чего не предлагают а просто написали про " Связной" одну новость и все, зато регион Москва.
Раньше было лучше, сейчас ерунда какая то. Может быть конечно отладят, но все же хреновато как то.
Как всегда выпустили с не доделками.
Поймите меня правильно, я ни в коем случае не защищаю команду яндекса, но если объективно посмотреть на вещи, то не могут же они при составлении алгоритмов плясать от УЖЕ раскрученных сайтов и подстраивать алгоритм под них... а, к примеру, у меня сайт тоже "правильный", а вот только раскручен он немного по другому и в результате я в конце топ50-100 буду. ИМХО надо не новые алгоритмы штамповать, а один единственный до ума доводить. А то хотите белое SEO, а в топе в основном ГС саповские висят.   
Это понятно, я согдасен что нельзя выпускать продукт с не доделками.
Вот очередной просчет великих умов из Яндекса, с утра увидел.
В продолжение темы про запрос - утилизация аккумуляторов -.
Регион Москва на 10 и 11 месте одна и таже страница сайта   hit-eco.ru .
Посмотрел  данную тему, все вроде правильно сегодня показывает, видимо подкручивают и улучшают.
Тоже посмотрел, вроде налаживается, может за неделбку справятся и будет нормальная выдача.
С каждым днем все лучше и лучше,  вроде адекватные люди и стараются действительно сделать качественный поиск.
Посмотрел, реально сайты о доугом, встресается в тексте слово утилизация или аккумулятор и регион москва, давай его на первые места. Выдача бредовая, стало трудно искать то что надо.
Да ерунду как всегда сделали, вон ниже писал сайт вообще без текста.
Вчера колбасило выдачу про утилизацию, все равно ерунда в выдаче.
Все налаживается, есть еще пару новостников в выдаче а так довольно прилично.
Ну вот, прошло время все устаканилось, теперь нормальная выдача.
Согласен, все отладили, теперь вроде номально.
Да уж...Яндекс чем то МедведоПутов напоминает...
Хотят как лучше , но природная тупость маленьких людишек-задротиков в очках не дает им реализовать глобальный общий смысл, а в итоге скоро Гугл их сожрет с потрохами... скорее бы..


Я прошел сейчас по основным своим ключевикам, ну ваще, в десятке сайты с народа.ру, сайты которые украли мой контекст и т.д.  - Яндекс - ты лучший !!!
А эти самые 280 мегабайт -- они к чему именно и в каких случаях применяются? На каждый пользовательский запрос и к каждому из десятков тысяч потенциальных результатов? И не тормозит?
Теперь ясно какие сайты надо делать.
http://yandex.ru/yandsearch?text=%D0%BF%D0%BB%D0%BE%D1%89%D0%B0%D0%B4%D0%BA%D0%B8+%D0%B4%D0%BB%D1%8F+%D0%BC%D0%B5%D1%80%D0%BE%D0%BF%D1%80%D0%B8%D1%8F%D1%82%D0%B8%D0%B9&lr=213
Клевый сайт   furshet66.ru  занимаем с утра 6 теперь 5, к вечеру наверное 1 место будет.
Хвала Обнинску.
ну дык поведенческие же =)
ща туда каждый второй кликнет и яндекс подумает что это супермегакрутой сайт
тем более у него же ЧПУ 100% релевантный!
Сейчас в Московской выдачи по многим запросам все скачет, видимо исправляют, к вечеру может устаканится.
Подтверждаю, московскую выдачу немного колбасит.
Будем надеятся что все утресется, надеюсь недели хватит.
Ап прошел вроде не зацепило:) даже еще веселее стало:) Интересно а гугла какой размер:) формулы?
0,02 КБ ? =)
Мой сайт получил с введением новой версии +10 к ТИЦ, посещаемость тоже  возросла в разы, но, полагаю, это связано не с поисковыми системами а с  тем, что на мой сайт ходят, в основном, учащиеся ВУЗов а также почти выпускники ВУЗов в поиске информации о дальнейшем трудоустройстве.

А еще с тем, что суете ссылки не в тему на него. Так что траф хоть не целевой, но будет.


P.S. Для PR 3 можно было бы уже и ТИЦ яндекса под 100 иметь.

pr попроще нарастить =)
 
Введите текст цитаты

формула ранжирования, занимавшая в 2006 году 0,02 килобайта


 


может все-таки 0.02Мб?


а то 20 байт совсем маловато :-D

Альтернативное мнение по Обнинску, и почему он занимает так много места, сотрудникам Яндекса не обижаться, ведь это все для шутки ;)
Ссылка на статью http://anokalintik.ru/rasshifrovka-algoritma-obninska-i-ego-280-megabajt.html
Может внимательнее посмотреть на алгоритм определения геозависимости запроса?