Клуб Народной карты

Сводная статистика

Гладилин Сергей
28 февраля 2011, 19:39

Поскольку Яндекс не публикует данных по общему количеству объектов на карте и кривую роста проекта, мы решили взяться за это сами. За основу взяли топ пользователей Народной Карты. Там про каждого пользователя написано, сколько объектов какого типа он создал. Если просуммировать эти цифры по всем пользователям, то как раз получится сводная статистика. Правда, обнаружено, что при удалении объекта в НЯК он не вычитается из статистики создавшего его пользователя, поэтому показатели априори завышены. Надеемся, удалённые объекты составляют не очень большую долю от неудалённых.

Вот что получилось по состоянию на 16 февраля:

Здания: 384387

Населённые пункты: 43300

Станции: 4956

Остановки: 30186

Дороги: 502.09 тыс. км

Железные дороги: 142.65 тыс. км

Реки: 210.21 тыс. км

Леса: 123.87573 тыс. км²

Водоёмы, в т.ч. моря: 1039.31099 тыс. км²

Другие объекты: 85916

План на будущее:.собирать указанные данные регулярно, чтобы можно было посчитать кривую роста

Что скажете?

36 комментариев
Подписаться на комментарии к посту
Интересно и информативно. Ростем, товагищи!

В общем -- интересно...

Особенно динамика роста :)

P.S. а с чем связана задержка почти в 2 недели с данными статистики и написанием данного поста? :)

Гладилин Сергей
28 февраля 2011, 20:43

Да всё откладывал написать. В будущем постараюсь более оперативно.

Насчет динамики роста - Яндекс, у которого есть даты создания всех объектов мог бы нам эту динамику легко предоставить. А так придется ждать, пока у меня статистика наберется...

ясно.

не забрасывайте это дело, если нужна помощь - велкам :) , поможем, чем сможем...

Насчет "Яндекс  мог бы нам эту динамику легко предоставить" - это понятно, но сколько людей на сервисе - столько и (требований/хотелок от каждого)*50.... так что они даже если захотят -- физически не смогут... со временем -- все будет, но пока будем обходится сами. :)

Я за
Отличная статистика, но, судя по цифрам, преждевременная. Понимаю, почему Яндекс-команда, не выкладывала её.
Почему преждевременная?
Гладилин Сергей
1 марта 2011, 08:28
Я уже говорил - мерять надо не пользователей, а объекты, ими нарисованные.

Ты не говорил то же самое, перечитай своё и вышенаписанное внимательнее.

Мерять надо не новые объекты, а существующие. По новым объектам можно оценить только скорость роста. Тоже интересно, но на главный вопрос - кто круче? - не отвечает.

Ха :) За попытку подменить тему со статистики нарисованных объектов на количество пользователей незачёт.

Но я понимаю, почему вы это сделали. Чтобы уйти от невыгодного сравнения по другим параметрам.

Яндекс тоже самое сделал: количество пользователей показал, а всё остальное скрыл. Остальное, мягко говоря, не блещет.

Маркетинг такой маркетинг :)

Гладилин Сергей
3 марта 2011, 15:44

Ох, как же тяжело понимать, что Вы хотите сказать. Что именно и где я не посчитал?  Ну почему бы это не написать сразу в комменте? Ну поймите же, без конкретизации это выглядит просто как поливание грязью...

Гладилин Сергей
3 марта 2011, 16:23

Еще раз описываю алгоритм работы моей статистики:

1) берем топ пользователей

2) заходим на персональную страницу каждого пользователя, например

http://n.maps.yandex.ru/users/kokoshkino/

3) видим что-то типа:

СтатистикаВнес 9793 правкиСоздал 8075 объектов:
Площадные объекты
Здание3 928
Населенный пункт220
Лес, парк972 км²
Водоем400 км²
Другое781
Линейные объекты
Участок дороги623 км
Участок железной дороги4 313 км
Участок реки1 295 км
Точечные объекты
Остановка1
Ж/д станция17

4) Суммируем по всем пользователям указанные цифры.

Вопрос - откуда можно узнать объекты в штуках?


Гладилин Сергей
3 марта 2011, 16:34
уже понял, ответил рядом
Гладилин Сергей
3 марта 2011, 16:34

Или просьба просуммировать общее число объектов независимо от типа (в примере - 8075)? Специально для Вас сделаем ;-)

Но толку от этого, ИМХО, совсем не много, т.к. озеро из двух сегментов (ну так делают, чтобы максимальную площадь не превышать) посчитается за 2 объекта. А две пересекающиеся дороги - за 4 объекта (т.к. в месте пересечения каждая дорога оказывается разделенной на 2). Еще интереснее с мостами - дорога с мостом - это 5 объектов - сам мост (А=мост, Б=мост), заезд (А=нормальный, Б=мост), съезд (А=мост, Б=нормальный) и собственно 2 куска дороги по разные стороны моста.

Гладилин Сергей
3 марта 2011, 16:53

ОК, сделаем. Статистика OSM, считающая объекты -это, ИМХО, тоже маловнятная штука. Во всяком случае для тех же дорог. Поэтому сейчас сооружаем статистику по километрам, как в НЯК. Вот первая попытка посчитать по состоянию на 1 марта:

http://forum.openstreetmap.org/viewtopic.php?pid=145929#p145929

Кстати, состояние НЯК на 28 февраля тут:

http://clubs.ya.ru/narod-karta/replies.xml?parent_id=9618&item_no=9556&with_parent=1#reply-narod-karta-9618

Можно увидеть динамику по сравнению с 16 февраля.

Ну вот создано в НЯК 1283444 объектов. И что? Это завышенная цифра или заниженная? И насколько?

В OSM PostGIS мы имеем 919788 точек, 2229892 полигона и 1509259 линии. Итого 4658939 записей.

Тебе стало легче?

И что за 5 лет? Судя по этому видео http://vimeo.com/16146087 максимум - четыре :) Только в 2007 начали появлятся первые города на территории РФ. 

©ШвЕц АрTёМ
1 марта 2011, 02:08
Очень интересно! Спасибо! И сразу вопрос (предложение): сколько пользователей, тоже интересно знать (но лень ползать в самый конец)
И еще сколько у вас ушло времени на такой титанический труд?
Комментарий удалён
©ШвЕц АрTёМ
1 марта 2011, 07:52
Ого! Я отстал от жизни, как-то смотрел было 6 000
41598 на ЭТУ минуту. Почти тыща за неделю! Но сколько из них "мёртвых душ"?

Этот титанический труд не в браузере и калькуляторе делается )

Очевидно был написан простейший краулер http://en.wikipedia.org/wiki/Web_crawler

Гладилин Сергей
1 марта 2011, 08:32
мы применили средства автоматизации ;-)

Как посчитать число объектов, по которым Яндекс показывает только длину/площадь?

Даже если удастся считать число сегментов дорог - какой в них смысл? Если пересечь одну дорогу другой - обе будут поделены пополам. Вместо двух дорог получится 4.

Как можно занижать рост НЯК, считая СУММУ всех созданных объектов, которая и так завышена за счёт неучёта удалённых объектов?

Как, в конце-то концов, считать "новые объекты"? Где-нибудь есть их вменяемый список разумного для скачивания объёма? 40 тыс. страниц пользователей качаются не так уж и быстро.

Как сравнивать дорогу по пересечённой местности длинной 1000 км с дорогой по клеточно-прямоугольному посёлку из пяти кусочков по 100 метров? Число объектов - характеристика неинтересная, потому что отражает число несравнимых сущностей.
ДИНАМИКУ-то как раз можно. Различайте производные от первообразных.
ДИНАМИКУ-то как раз можно. Различайте производные от первообразных.

Хорошая идея, жалко, что нет данных за прошедший период.

Или их можно вытащить? На 1 мая, 1 июня и т.д.

Также хорошо бы добавить в таблицу число пользователей.

Потом надо построить график и отметить на нём такие этапы, как: реклама карты в отдельных регионах, отображение в МЯК, выход новых фич, переход из беты в релиз (надеюсь, это произойдёт), появление ссылки на главной странице и т.п.

Вот тогда будет наглядно и интересно.

Кстати, маркетологи Яндекса должны бы сами это делать.

Владиcлав Грызунов
1 марта 2011, 17:50
Нужно ещё посщитать сколько объектов в Народной Карте.
Гладилин Сергей
1 марта 2011, 18:14
Это невозможно, т.к., например, непонятно что такое "сколько объектов железной дороги". В Топе пользователей Яндекс указывает для железной дороги километраж, но не число объектов.

Создай любой новый объект и посмотри его id, вот тебе и будет ответ на вопрос.

Только вот, как праивльно сказано, по линейным объектам это абсолютно бесполезный показатель, километраж для них куда более информативен.

А удалённые объекты как учесть?

Вон в OSM id точек уже перевалили за миллиард, а общее их количество по-прежнему меньше миллиарда.

Владиcлав Грызунов
3 марта 2011, 19:31
Я имел введу сколько контурных, точечных и линейных объектов вместе в Народной Карте.

Во-первых, таких данных нет.

Во-вторых, для некоторых видов объектов количество не имеет смысл. Что такое "10 объектов железной дороги"? Если я порежу дорогу кусочками по 1 км - это нормально?

Неплохая идея я за)))

Вечер 28 февраля:

Здания: 413504 (+29117)
Населённые пункты: 45465 (+2165)
Станции: 5418 (+462)
Остановки: 48739 (+4307, а также от бота yatransport +14246)
Дороги: 521.21 (+19.12) тыс. км
Железные дороги: 147.23 (+4.58) тыс. км
Реки: 216.73 (+5.79) тыс. км
Леса: 131.38 (+7.51) тыс. км²
Водоёмы: 1052.40 (+12.69) тыс. км²
Другие объекты: 90906 (+4990)

Было бы еще лучше прдеставить все в виде инфографики, популярной в настоящее время. Но тут вопрос желания)) А информация конечно интересная, другое дело, что собирать ее периодически дело хлопотное, но если для вас это не преграда, успехов!