Блог Яндекс.Метрики

Семплирование

13 января 2015, 16:12

Метрика 2.0 позволяет произвольно сегментировать содержащиеся в ней данные. Но у этой замечательной возможности есть обратная сторона: данные для запрошенного отчёта нельзя подготовить заранее — ведь Метрике не известно, какие условия сегментации будут использованы и какие именно визиты потребуется отобрать.

В результате при каждом новом запросе Метрика заново просматривает все визиты в выбранном временно́м интервале и, отобрав нужные, считает запрошенную статистику. Если визитов очень много, просмотр может занять ощутимое время. А запрошенный отчёт хочется получить буквально через несколько секунд после клика.

Для решения этой проблемы и применяется семплирование: Метрика может рассмотреть не все визиты, а какую-то их часть (например, 1/10).

Предположим, речь о прямых заходах на сайт. Посчитав, сколько их было в 1/10 от всех визитов, Метрика может умножить результат на 10 и получить примерное число прямых заходов. В результате времени на получение ответа понадобится в 10 раз меньше, но полученный ответ будет приблизительным, а не верным с точностью до визита. Семплирование является балансом между скоростью получения ответа и точностью данных.

Конечно, надо соблюсти ещё ряд условий: выборка должна быть равномерной (некорректно было бы, например, строя статистику за год, рассмотреть только первый месяц и умножить результат на 12), да и выборку надо делать не по визитам, а по уникальным посетителям. Всё это в Метрике соблюдается.

Механизм семплирования включается в том случае, если в выбранный вами временно́й интервал попадает более чем 1 000 000 визитов. И в этом случае вы сразу увидите, что отчёт построен по какой-то доле визитов:

1.png

По умолчанию Метрика выберет долю визитов так, чтобы отчёт был успешно построен за несколько секунд. Но, если вы хотите получить точные данные, вы всегда можете изменить это соотношение "скорость/точность" так, как вам удобно:

2.png

Выключив семплирование и немного подольше подождав отчет, можно получить предельно точный отчет.

Кстати, если вы запрашиваете очень узкий сегмент на счётчике большого сайта или за большой период, а в ответ получаете "Нет данных" — обязательно обратите внимание на долю визитов, по которой построен отчёт. Если он построен не по 100% данных — возможно, ваш сегмент не является пустым. Просто он на столько мал, что в выборку не попало ни одного визита, удовлетворяющего критерию сегментации. Попробуйте перестроить отчёт по всем визитам и посмотреть на результат.

4 комментария
Подписаться на комментарии к посту
Добрый
Добрый день,
Оставьте пожалуйста возможность пользоваться старой метрикой. Для простых пользователей она более проста понятна. Сейчас метрика превращается в инструмент для профессионалов, а таким маленьким сайтам как у меня - это не надо.
Оставьте возможность пользоваться старой метрикой, пожалуйста!
Поддерживаю мнение друзей по несчастью, оставьте старую метрику))