Не так давно мы открыли новую версию поиска по блогам, в которой, помимо других новшеств, появился рейтинг блоггеров. Однако, описание принципов построения рейтинга было не очень понятным, некоторые блоггеры (например, lleo, labas и другие) задали ряд справедливых вопросов о рейтинге, и мы решили более ясно описать то, как он строится и какой мы видим его роль в блогосфере.
Главной целью, которую мы ставили перед собой при создании рейтинга, было создание места, где можно будет найти наиболее интересных, популярных, вызывающих наибольшую полемику блоггеров, пишущих на разные темы. Не стоит абсолютизировать рейтинг. Мы не пытались и не пытаемся сказать, что кто-то из блоггеров лучше или хуже, или выделить тех, кто пишет о политике или о разведении кроликов; наоборот, мы прилагаем все усилия, чтобы в рейтинге были представлены все блоггеры, которые пишут о том, что может быть интересно людям.
Рейтинг блогов создавался с учетом сложившегося в Яндексе подхода к ранжированию сайтов в поисковой выдаче. Прежде всего, рейтинг строится строго автоматически и любое ручное вмешательство с целью изменения позиции блоггера исключено на программном уровне. В некоторых аспектах задача ранжирования поисковой выдачи другая, поскольку известен запрос, но есть и общие моменты: на позицию страницы в выдаче поиска по вебу влияют внешние (например, ссылки на страницу) и внутренние (свойства самой страницы) факторы, разные факторы учитываются с разными весами, которые могут меняться с течением времени.
Простая сортировка по количеству известных нам читателей блога привела бы к сильной неравномерности рейтинга — очень сильное преимущество получили бы крупные блог-хостинги, а автономные блоги оказались бы за бортом рейтинга, так как для них информация о читателях часто не является публичной.
Поэтому было решено выбрать в качестве основного фактора, влияющего на положение в рейтинге, ссылки на блог с других блогов: эта информация доступна для всех существующих типов блогов. При этом, как и при учете любых других ссылок в интернете, у них может быть разный вес. На вес ссылки влияет множество факторов, наиболее важны из них следующие:
насколько давно ссылка появилась: блоги меняются часто и свежие ссылки ценнее «древних»;
количество ссылок на данный блог из разных блогов: хорошие друзья ежедневно друг на друга ссылаютcя, но это почти не влияет на позицию в рейтинге;
на какое количество разных постов одного блоггера ведут ссылки: авторитет — понятие, которое по смыслу противоречит однодневной сенсации;
кто именно ссылается: ссылка с авторитетного блога даёт больше авторитета, чем ссылка с блога с низкой авторитетностью.
Кроме того, как и в большом поиске Яндекса, помимо внешних ссылочных факторов, учитываются и внутренние — характеристики самого блога. Их тоже много, и у них тоже разные веса. Вот наиболее важные: время существования блога, средняя активность его автора, текущая активность автора, количество читателей блога (читателей как через friend-ленту, так и через RSS-аггрегаторы: Яндекс.Ленту; синдикацию в Livejournal; для автономных блогов также учитываются данные FeedBurner.com, если блог транслируется через него и статистика читателей не закрыта). Но, повторимся, эти факторы не являются основными, они только дополняют основную формулу, делая её более стабильной.
Рейтинг блоггеров уже пытаются накручивать — это судьба любого рейтинга. Одновременно алгоритм меняется так, чтобы им было труднее манипулировать. Например, если робот счёл, что та или иная ссылка поставлена в целях искусственного увеличения рейтинга (в том числе при помощи автоматического спама), то вес ссылки может быть понижен.
Что касается заданного вопроса об исключении блога из рейтинга, то сейчас такой возможности нет, так как рейтинг является зеркалом блогосферы, которое формируется полностью автоматически: ссылки на блог из других блогов будут продолжать индексироваться и учитываться.
Очевидно, что текущий вид формулы не финальный: мы стараемся найти новые факторы, которые позволят сделать рейтинг более интересным, более соответствующим его основной цели. По мере появления новых существенных факторов мы будем добавлять информацию о них в помощь Поиска по блогам и писать посты в наш корпоративный блог. Если у вас есть идеи, как сделать рейтинг лучше, мы будем очень благодарны за ваши предложения.
"Очевидно, что текущий вид формулы не финальный: мы стараемся найти новые факторы, которые позволят сделать рейтинг более интересным, более соответствующим его основной цели." -
Такое замечательное прошлогоднее заявление вероятьо имеет продолжение.
Именилась ли формула в этом году, если да, то как?
На мой взгляд нельзя составлять общий рейтинг блогов. А то получается, что профессиональный блог в рейтинге стоит ниже блога какой-нибудь дуры, которая пишет о своих любовных переживаниях.
Мне кажется, что твиттер с его смсками вообще нужно убрать из общего рейтинга, пусть будет отдельный рейтинг, и не буду поазывать пальцем, но некоторые блоги из верхней части рейтинга, не содержат уникального контента, а просто копируют его с других ресурсов, зачастую без ссылок на оригинал, но даже если и ссылкой, то не понятно почему блог, ворующий контент, находится на высоких позициях
У меня читателей в моем твиттере показывает 155, а на самом деле у меня 2093 читателя, как такое может быть, как вы можете так Врать!!! По каким принципам и критериям вообще строится и оценивается ваш рейтинг, кто больше отвалит вам бабок??? Почему у вас в топ рейтинг блогов попадают совсем неуникальные твитты и блогеры, почему там на первых местах VIP-персоны и чиновники, как они вообще туда попадают, почему твитты типа: Я встала сегодня утром, умылась и вышла в магазин, чтобы купить буханку хлеба или не съесть ли мне еще одну булочку попадают на первые места в рейтинги, в чем их уникальность? А мой блог находится вообще Черт знает где на 195088 месте и на 3902 странице?
Почему вообще мой твиттер-аккаунт https://twitter.com/Eiffel82 никак не индексируется в поисковике Яндекса, если я есть даже на Google? Ваш поисковик предвзято находит твитты блогеров и их аккаунты, сколько я не добавлял в ваш робот свой тви-аккаунт, он как не отображался в поисковике, так и не отображается!!! Это Безобразие!