изображение

изображение

Большая конференция Яндекс Рекламы 22 октября

13 янв
2015

Семплирование

Метрика 2.0 позволяет произвольно сегментировать содержащиеся в ней данные. Но у этой замечательной возможности есть обратная сторона: данные для запрошенного отчёта нельзя подготовить заранее — ведь Метрике не известно, какие условия сегментации будут использованы и какие именно визиты потребуется отобрать.

В результате при каждом новом запросе Метрика заново просматривает все визиты в выбранном временно́м интервале и, отобрав нужные, считает запрошенную статистику. Если визитов очень много, просмотр может занять ощутимое время. А запрошенный отчёт хочется получить буквально через несколько секунд после клика.

Для решения этой проблемы и применяется семплирование: Метрика может рассмотреть не все визиты, а какую-то их часть (например, 1/10).

Предположим, речь о прямых заходах на сайт. Посчитав, сколько их было в 1/10 от всех визитов, Метрика может умножить результат на 10 и получить примерное число прямых заходов. В результате времени на получение ответа понадобится в 10 раз меньше, но полученный ответ будет приблизительным, а не верным с точностью до визита. Семплирование является балансом между скоростью получения ответа и точностью данных.

Конечно, надо соблюсти ещё ряд условий: выборка должна быть равномерной (некорректно было бы, например, строя статистику за год, рассмотреть только первый месяц и умножить результат на 12), да и выборку надо делать не по визитам, а по уникальным посетителям. Всё это в Метрике соблюдается.

Механизм семплирования включается в том случае, если в выбранный вами временно́й интервал попадает более чем 1 000 000 визитов. И в этом случае вы сразу увидите, что отчёт построен по какой-то доле визитов:

1.png

По умолчанию Метрика выберет долю визитов так, чтобы отчёт был успешно построен за несколько секунд. Но, если вы хотите получить точные данные, вы всегда можете изменить это соотношение «скорость/точность» так, как вам удобно:

2.png

Выключив семплирование и немного подольше подождав отчет, можно получить предельно точный отчет.

Кстати, если вы запрашиваете очень узкий сегмент на счётчике большого сайта или за большой период, а в ответ получаете «Нет данных» — обязательно обратите внимание на долю визитов, по которой построен отчёт. Если он построен не по 100% данных — возможно, ваш сегмент не является пустым. Просто он на столько мал, что в выборку не попало ни одного визита, удовлетворяющего критерию сегментации. Попробуйте перестроить отчёт по всем визитам и посмотреть на результат.

Поделитесь материалом в соцсетях

Подпишитесь на новости

8 800 234-24-80

Звонок из регионов России бесплатный