Новый вариант статистики:
По регионам (на воскресенье) >>>
Исследования показали, что посчитанная нами в прошлый раз статистика не совсем верна. Оказывается, пока листаешь страницы топа, пользователи что-то рисуют и меняются в топе местами. В результате, некоторые попадаются дважды, а кого-то пропускаешь. Пришлось поднапрячься - теперь мы перелистываем топ по нескольку раз, чтобы никого не пропустить.
Статистика по регионам - это наше новое изобретение. Считается методом Монте-Карло - поскольку изучить все объекты в НЯК нельзя (их очень много), рассматриваем только некоторое количество случайных (мы взяли около 25 000) - и приблизительно считаем, что остальные распределены в такой же пропорции.
Возник, еще вопрос с границами - как, зная координаты точки, определить, к какому региону она относится? В НЯК границы субъектов РФ нарисованы, но недоступны для использования сторонней программой. Тут нам помог проект OpenStreetMap - в нем все нарисованное доступно для использования. На первое время мы взяли границы из базы данных OpenStreetMap PostGIS, которая содержит только страны бывшего СССР, за исключением Эстонии, Латвии, Литвы и Молдовы.
Результат, кстати, очень интересен. Наиболее активно в НЯК рисуются Московская область и Москва - вместе они составляют почти четверть объектов проекта. Это сравнимо с суммой по следующим за ними в рейтинге 11 регионам вместе взятым!