Блог Яндекса для вебмастеров

Яндекс начал искать по зарубежному интернету

4 апреля 2008, 14:52

Российские пользователи интернета не ограничиваются русскоязычными ресурсами -- им интересны страницы и сайты на разных языках. Примерно 15 процентов запросов к Яндексу не содержат кириллицу.

Яндекс давно индексирует иностранные документы, размещенные в так называемой русскоязычной зоне интернета (домены государств СНГ и крупные сайты со всего мира, полезные русскоязычным пользователям). Теперь мы существенно расширили базу за счет зарубежного интернета. Пока в выдачу по запросу попадает не более одного иностранного документа из этой зоны. Ранжирование происходит в соответствии с общими правилами, то есть, такой документ окажется на первом месте, только если он наиболее соответствует запросу.

Размер базы зарубежного интернета -- примерно 1 млрд веб-страниц, и эта цифра будет расти.

Примеры:

Подмешивание документов из зарубежного интернета в основную выдачу сейчас носит экспериментальный характер. После сбора статистики и пользовательских отзывов ранжирование для таких документов будет значительно улучшено.

 

Команда поиска Яндекса

48 комментариев
Подписаться на комментарии к посту
А на китайском, японском, корейском языках индексирует?
Ну все, теперь по запросам типа: "kia ceed" придется с буржуй нетом конкурировать :) Яша жжот как всегда :)
Научитесь сначала нормально русскоязычные сайты ранжировать, а потом уже для "понтов" вгоняете млрд страниц буржуев.
Нормально - это когда андрюшины сайты в топе? :))
Канешн Сереженька ;)
И шо, еще не научились так ранжировать? Или разучились? :))
Ещё чуть-чуть и снова научатся "так" ранжировать. ;) Ты не переживай так! :) Как погодка в Туле? У нас жарко!
Та я не переживаю. Это ты переживаешь, ревнуешь к импортным сайтикам ;) Погодка шепчет: "Займи и выпей" :))
Та я тоже, прост поиск по рунету гавно.. зачем прикручивать поиск не по рунету? Непонятно. :)
Да ладна. Отличный поиск ;) Вот бы еще остальные продажные морду фильтранули бы, ввобще б была красота. :))
Хахаха :)
А что, элегантное решение для поиска зарубежных офсайтов. Особенно радует уверенность Яндекса, что офсайт чаще всего будет первым в "зарубежной выдаче". 1. "Зарубежный интернет - это страницы / сайты на иностранных доменах, на которых доля кириллицы ничтожно мала? 2. Так, а когда я ищу с параметром &lang=en - все равно в выдачу попадает только один документ из зарубежной зоны? 3. Скажите тогда волшебный параметр, позволяющий искать только по зарубежному интернету. :-)
gaudeamus-omskcity
4 апреля 2008, 14:40
Во-о-он чего... Я грешным делом сначала как об этом сегодня узнал, подумал что индекс значительно всё же социалками пополнили... А это вон что... Хи-хи, интересно, а как будет ссылочное ранжирование происходить? Анкоры ссылок ведь на английском, к примеру, да? Яндекс собирается пристегнуть к этому делу спецов с филфака МГУ, а заодно команды обоих московских "ин.яз.ов"?
тогда уж и перевод иноязычных страниц нужен... по примеру гугла, совместно с абби или промт :)
Не больше одного в выдаче - это ладно, но почему не больше 20 документов с сайта? http://www.yandex.ru/yandsearch?p=10&serverurl=www.imdb.com&serverurl_manually=true&rd=0&text=tales
Это была ошибка, ее исправили. Спасибо за внимательность.
Теперь не больше 40. Лучше, но все равно мало. http://www.yandex.ru/yandsearch?p=10&serverurl=www.imdb.com&serverurl_manually=true&rd=0 Или апдейта сначала подождать?
Точнее, не больше двух страниц. А количество результатов зависит от настроек количества документов на страницу.
gaudeamus-omskcity
4 апреля 2008, 14:58
Наверняка эти "15 процентов" в значительной своей части - имена и собственные наименования. Ради чего тогда?
Незачот много где... Если поискать какую-нибудь команду из NHL, NBA, NFL, MLB, MLS, официальные сайты команд почти не находятся, за редкими исключениями.
Вообщем, вывод один. Это чистой воды пыль в глаза. :)
Пока рано делать такой вывод, подождем недельку-другую.
ага, подождем резил yandex.com - поиск по буржуйским сайтам, вот кто им будет пользоваться... другой вопрос =) а так, непонятно зачем выдавать по запросу nokia два сайта, nokia.ru и nokia.com :D
Вот именно, пока "Подмешивание документов из зарубежного интернета в основную выдачу сейчас носит экспериментальный характер. После сбора статистики и пользовательских отзывов ранжирование для таких документов будет значительно улучшено."
А в выдаче по русскоязычным запросам Википедия "отмодерирована" на вторые роли :)
Что-то по наблюдениям замечаю что страница должна содержать весьма низкий процент скажем английского, чтобы она определялась именно как англоязычная. Как с этим?
Стало быть и ссылочки с этих западных страниц будут работать.
Сомнительное утверждение.
А почему нет? Чем обоснованы сомнения?
А почему да? Подмешивать, не значит учитывать какой-то вес...
Не просто подмешивать, а ещё и ранжировать. Если они ранжируются, то уж наверное какой то вес и страницам придается.
спор ни о чем
Ну наконец-то появилась возможность свалить с гугла
Мда, странно что ее у вас раньше не было)))
Ага наверное для этого и подняли цену на регистрацию в ЯКе, чтоб с буржуев тоже заработать.....
Не с этим ли связано одновременное выпадение многих рускоязычных сайтов из индекса последние 2-3 дня?
Считаю совершенно нецелесообразно перемешивать русские сайты с зарубежными. Всего 15% процентов запросов не содержащих кириллицу? Удивлен, что так мало. В России большинство техники и обоудования иностранного производства и если я спрашиваю у поисковика: "sony", "toyota", "nokia", "indesit", "samsung", "nissan", "canon" и т.д. и т.п это не означает, то мне нужны англоязычные сайты. Я ищу эту продукцию здесь, в России и ожидаю получить сайты на русском языке. Стал замечать, что в результате эксперимента в результатах поиска стали появляться статьи из англоязычной Wikipedia (к чему?), если бы выдавались из русскоязычной Wiki, то это было бы куда более логичнее. Google ищет в мировом Интернете, но для русских он делает выдачу по русским сайтам, для японцев - по японским, для французов - на французком и это правильно.
> в выдачу по запросу попадает не более > одного иностранного документа из этой зоны
Да - не более одного, но когда он в первых строчках поисках, то это недоумевает. Пример: по запросу "ipod", на 3м месте в выдаче ссылка на: en.wikipedia.org/wiki/IPod И я бы с удовольствием прочитал этот документ, но на ru.wikipedia.org/wiki/IPod, а так людям непонятно - "может, Яндекс глючит?"
Как-то не очень-то он и ищет. Есть сайт знакомого в зоне com (висит уже 2 года). Сайт на английском, русском и немецком. Большая на английском. Так вот к чему я это всё, в индексе yandex всего-лишь одна страница на русском языке, остальных как небыло, так и нет ... Хотя русскоязычных страниц штук 15 (контент уникальный, сайт строго тематический, не переспамлен ключевыми, ссылки не продаёт).
Хм, и ссылочное тоже будет с этих сайтов учитываться?
Правильное нововведение для Яндекса. Лишь бы импортные сайты не превалировали над отечественными (лучше было бы дополнить функионал, позволяющий отключить участие в ранжировании зарубежных сайтов для пользователя). Жаль только, что он идет за Гуглом не опережая его по каким-либо концепциям.
Иероглифы не ищет. "Задан пустой поисковый запрос". Просто поддержки было бы достаточно. Можно было бы находить двуязычные страницы, они зачастую очень полезны для перевода
по запросу "Soho Dolls - Ribbed Music for the Numb Generation" в топ 10 выдаёт два забугорных сайта (4 и 5 место): http://yandex.ru/yandsearch?text=Soho+Dolls+-+Ribbed+Music+for+the+Numb+Generation&clid=9582 Идея с поиском по зарубежным ресурсам - НЕ ПОНРАВИЛАСЬ! Если я хочу посикать по ENнету я иду на яху или гугл. Яндекс тем и крут, что ищет только по рунету! Лучше качество, чем количество!!! Уж если Вам так хочется быть вездесущими, сделайте отдельный поиск по иностранным сайтам.
Зато по рунету искать разучился. Сначала был бан доменов в зонах com.ru, net.ru, org.ru, а теперь и в зоне ru. Не думаю что случайно сложилась такая ситуация.