23–26 мая 2006 года в Эдинбурге состоится международная конференция WWW2006, в программу которой включены два стендовых доклада от Яндекса. Конференции этой серии являются важным событием для исследователей, представителей индустрии и визионеров интернета всего мира.
При разработке сервисов мы часто проводим исследования. Наработки не всегда удается привести в вид, пригодный для публикации, но Яндекс поддерживает сотрудников в стремлении «не прятать» полученные результаты и делиться ими с научным сообществом.
Первая статья “Extracting News-Related Queries from Web Query Log” посвящена методу выделения запросов, относящихся к недавним, текущим и предстоящим событиям реального мира. Выделенные таким образом запросы используются на сервисе Яндекс.Новости для кластеризации и ранжирования сообщений.
Вторая статья “Automatic Geotagging of Russian Web Sites” описывает метод автоматического определения географии сайта, основанный на анализе IP-адреса, URL и содержания сайта. По мере того, как Рунет все больше «прирастает регионами», локализация веб-ресурсов приобретает все более важное значение.
Павел Браславский, менеджер проектов, отдел Веб-поиска