Точность и скорость. Семплирование

Вычисление показателей по большому количеству (более миллиона) визитов может потребовать значительного количества времени. Для уменьшения времени расчета показателей можно использовать семплирование. В этом случае расчет производится не по всем визитам, а по какой-то их части.

Предположим, речь идет о прямых заходах на сайт. Посчитав, сколько их было в 1/10 от всех визитов, можно умножить результат на 10 и получить примерное число прямых заходов. В результате времени на получение ответа понадобится в 10 раз меньше, но полученный ответ будет приблизительным. Семплирование позволяет выбирать необходимое соотношение между скоростью и точностью расчета.

Однако, случайная выборка определенной доли визитов обладает рядом недостатков. Метрика накапливает историю действий каждого посетителя. В случае выборки по визитам, связь между посетителем и визитом теряется. Это, например, делает невозможным сегментацию по параметрам посетителей. А расчет количества уникальных посетителей практически всегда будет приводить к ошибке в сторону увеличения их количества.

Метрика сначала формирует выборку заданной доли уникальных посетителей, затем вычисляет показатели на основе параметров их визитов, равномерно распределенных по времени.

Возможность семплирования становится доступной, если в выбранный период времени попадает более 1 000 000 визитов. В этом случае в отчете отображается дополнительный элемент управления Точность:



При загрузке отчета или изменении периода времени Метрика автоматически выбирает точность таким образом, чтобы время построения отчета не превышало нескольких секунд. После загрузки отчета соотношение между скоростью и точностью можно изменить.



Уменьшение точности может привести к тому, что в выборку не попадет ни одного визита и, соответственно, отчет не будет содержать данных. Это может произойти, например, в том случае, если выбран очень узкий сегмент и (или) очень большой период времени. В этом случае имеет смысл проверить показатели, выставив точность 100%.