Клуб Яндекс.Метрики

Три счетчика - Три значения

Андрей Волкъ
13 апреля 2010, 11:45

Использую три сервиса по сбору статистики: Метрику, Google Analytics и LiveInternet - все сервисы хвастуют о том, что у них самая точная статистика и все дают разные результаты (погрешность от среднеарифметического примерно 10-15 %).

 

Есть ли какой сервер статистики дающий правдивые результаты?

 

Заранее спасибо за ответы.

21 комментарий
Подписаться на комментарии к посту
По каким параметрам такое расхождение ?
Например, у меня по географии, ОС, браузеру в пределах 1% различие.
Можно самому собирать и анализировать логи сервера.
Читать логи сервера не каждый может, этому учиться надо, простому пользователю гугл-аналитик в самый раз
тут каждый для себя решает, как я понимаю, здесь была претензия к точности и наверно правильно, что надо пользоваться инструментами которые считают точнее, если разница на 15% - это большая разница, то предлагается выяснить откуда она.
Для того чтобы как-то с этим жить конечно можно наугад ткнуть в один счетчик и сказать что будем пользоваться им, но можно промахнуться. Лично я считаю, что Метрика считает точнее других аналогичных счетчиков, например, за счетчиком ГА было замечено, что иногда(довольно часто) он делает сомнительные предположения приписывая прямой трафик поисковику google и т.п.
Если нужна точность из первых рук, то только так. К тому же есть программы для обработки, можно написать/заказать свою. Не обязательно же смотреть на странные длинные строчки
0
Если честно сказать не очень понятно о каких программах идет речь и какой смысл их писать. И еще про какие длинных строчки идет речь, о логах сервера что ли
О них. Писать имеет смысл если не устраивают те, что есть, например.
Конечно с одной стороны ты права, но опять же хочется сказать, что не все могут читать логи сервера, но с другой стороны учение свет, а не ученье тьма.
Ну, тут уж или учится их анализировать, или забить на погрешность, которую дают счетчики )
Многие предпочитают забить, а ты как справляешься с этим, читаешь логи сервера? Извини за вопрос просто интересно.
Мне хватает точности внешних систем статистики. По логам я смотрю только специфические для моего сайта вещи )
Извини еще раз, какие например? Век живи век учись, так по моему сказал кто то из великих. Поделись опытом.
Ох, ну у нас очень специфично на самом деле. У нас есть некая внутренняя система (лежит на отдельном сервере) к которой есть выход через веб. В основном смотрю время отработки запросов (это важно, ибо они тяжелые), ну и по-мелочи: как человек переходит по страницам сервиса, когда кто отваливается. Опять же можно посмотреть, если сервис лежал: когда упал, когда подняли.
спасибо за ответ, правда ничего нового, но все таки еще раз благодарю, а про какой ресурс идет речь, на твоей странице не нашел твоего сайта.Если не секрет конечно.
если такое большое расхождение, то
1) возможно вы забыли установить на каких-то страничках какие-то из счетчиков? как ни странно такое часто случается.
2) разные алгоритмы подсчета статистики, например Метрика выкидывает из данных по просмотрам рефреши; могут по разному считаться визиты, например какой-нибудь счетчик может обрывать визиты по границы дня и начинать новый в новом дне, в Метрике визит ассоциируется с временем его начала и может переходить через границу дня.
3) посмотреть точные значения можно в access.log на вашем сервере, это самый правильный подход - посмотреть access.log и сделать для себя вывод о точности счетчиков (число уников можете приблизительно посчитать по числу уникальных ip-шек, это число должно быть похоже на число уников отображаемых в статистике по счетчику).
Насчёт третьего пункта - может быть не верно, особенно для маленьких и средних сайтов, так как заходы роботов (большинство из них не считаются внешними счётчиками типа Метрики, Google Analytics, Liveinternet, но видны в access log) могут составлять значительную долю.
Для примера, на одном из сайтов - 4000 хитов - люди, 18000 - роботы (Яндекс, Google), IP адресов у роботов тоже полно.
А еще играет разница во времени серверов у Метрики у ГуглАналитик.
Не знаю даже что и сказать , каждому свое, это вернее всего. У меня стоит и аналитик и метрика, ощутимых расхождений не вижу, но обычно использую аналитик интерфейс просто мне больше нравиться их
Можно рассмотреть несколько видов различий:

1. Различия количестве посчитанного трафика. Например, какой либо счётчик может терять часть хитов. Я уверен, что Метрика учитывает максимум возможного. У Метрики маленький код, который быстро грузится, серверы быстро отрабатывают запрос, код работает даже при отключенных картинках или javascript, а также при отключенных cookies. Размер кода важен, так как пользователь может закрыть страницу, пока код не загрузился.

2. Различия в определениях. Например, нельзя сравнивать количество визитов и количество посетителей, так как это разные вещи. Примеры тех вещей, которых часто ошибочно сравнивают:

В Метрике - визиты, в Liveinternet - переходы (в одном визите может быть больше одного перехода).
В Метрике - глубина визита, в Liveinternet - просмотров на посетителя (один посетитель может сделать несколько визитов).
В Top.Mail.ru визитами называются хиты, их нельзя путать с визитами в Метрике.
В Google Analytics неправильно считается источник трафика: вместо источника первого перехода в визите, используется источник какого либо из первых переходов для посетителя (при этом, переход может быть совершён даже не в выбранном отчётном периоде), при этом предпочтение отдаётся AdWords и поиску.
Клики Директа в Метрике и визиты с рекламного трафика в Метрике (в одном визите могло быть несколько кликов, при чём, с разных рекламных систем).

3. Различия в точности рассчёта.
Для таких простых метрик как количество хитов, количество IP адресов сложно реализовать неправильный подсчёт. Именно их и следует сравнивать, чтобы понять, какая система посчитала больше трафика. (хотя не всегда следует отдавать предпочтение системе, которая показывает больше хитов - ведь в ней может происходить дублирование данных при рассчёте). Но для более сложных - источники трафика, браузер посетителя и т. п. разработчикам системы следует тщательно следить за правильностью рассчёта.

Например, Google Analytics знает меньше поисковых систем, это может быть ещё одной причиной отличающихся данных об источнике трафика.
Также, в любом случае, следует с осторожностью сравнивать количество уникальных посетителей, так как это одна из самых сложных для рассчёта метрик. Например, если какая либо система считает слишком много посетителей, то это может говорить о недостаточно хорошей их идентификации (один посетилель посчитался несколько раз), а если слишком мало - о потере трафика. Таким образом, если одна система посчитала больше посетителей, чем другая - никаких выводов сделать нельзя.

4. Время обновления данных.
В Яндекс.Метрике данные в интерфейсе видны с задержкой около 15 минут от реального времени. В других системах задержка может составлять несколько часов или сутки. Это значит, что если сравнивать данные за "сегодня", то в Метрике будет посчитано больше данных.

5. Неправильная установка кода счётчика.
Часто бывает, что счётчик одной системы стоит на всех страницах, а другой забыли поставить на все. Для этого следует сравнивать отчёт "популярное содержание" в Метрике и аналогичный отчёт в другой системе.
Также, код счётчика может не работать или работать только в некотрых браузерах, если его некорректно установить. Некоторые CMS могут "портить" код при установке. Для проверки, следует после установки посмотреть HTML код страницы сайта и сравнить код с тем, который выдаётся. (В Яндекс.Метрике есть автоматическая проверка правильности установки кода - статус виден на странице со списком счётчиков). Если есть различия, следует обратить внимание на отчёт "браузеры" и аналогичный отчёт в другой системе.

6. Различия в способе отображения данных.
Например, Метрика предоставляет удобный древовидный режим в большинстве отчётов. Были случаи, когда значения для браузера Internet Explorer в Метрике (всех версий) ошибочно сравнивают со значением для первой попавшейся версии Internet Explorer 7 в Liveinternet, потому что в Liveinternet нет древовидного режима (и для правильного сравнения, потребовалось бы суммировать данные для Liveinternet вручную).

7. Наконец, различия в пределах нескольких процентов можно считать допустимыми - срабатывание счётчика зависит от случайных факторов на стороне посетителя.
Андрей Волкъ
13 апреля 2010, 19:10
Огромное спасибо з такой подробный ответ! Очень хорошо все объяснили - завтра потрясу it, пусть проверяю, что там ставили, а то я по их вине не могу отчет по рекламной компании составить!

Еще раз огромное спасибо за ответ!
Спасибо! Возьму на заметку!