Семплирование и выборка
- Что такое семплирование
- Механизм семплирования в Метрике
- Когда семплирование может применяться в Метрике
- Как управлять семплированием
- Как получить отчеты по 100% данных
При построении отчетов Метрика использует детальные данные о визитах и посетителях. Вычисление показателей по большому количеству данных может потребовать значительного количества времени и ресурсов, поэтому для построения отчетов Метрика может использовать только часть из них, то есть применять семплирование. Так Метрика обеспечивает быструю скорость построения отчетов.
Что такое семплирование
Семплирование — это статистический способ обработки данных, при котором общее представление о них строится на основе определенной части всех данных, называемой выборкой.
Предположим, речь идет о прямых заходах на сайт. Посчитав, сколько их было в 1/10 от всех визитов, можно умножить результат на 10 и получить примерное число прямых заходов. В результате времени на получение ответа понадобится в 10 раз меньше, но полученный ответ будет приблизительным.
Механизм семплирования в Метрике
Алгоритм семплирования выбирает данные равномерно по посетителям сайта, сохраняя корреляцию и распределения атрибутов в семплированном отчете относительно полного.
- Семплирование применяется только при построении аналитических отчетов в Метрике. При этом исходные данные не удаляются и не изменяются.
- Семплирование не применяется в отчетах группы «Директ» в Метрике.
- Сегменты Аудиторий создаются и сохраняются по 100% данным в отчете.
- В отчетах в Директе отображаются полные данные.
- Семплирование не влияет на эффективность рекламы.
Когда семплирование может применяться в Метрике
Семплирование может применяться при построении отчетов как в веб-интерфейсе, так и в API.
Семплирование может применяться при превышении 500 000 визитов в исходной выборке запроса (или 2 млн просмотров в соответствующих отчетах). Коэффициент семплирования динамически определяется таким образом, чтобы обеспечить построение отчета по максимальному количеству данных в зависимости от нагрузки.
Как управлять семплированием
Вы можете изменять уровень семплирования в отчетах с помощью Выборки.
В случае увеличения выборки отчет может строиться дольше или не сформироваться. Чтобы обеспечить загрузку отчета, Метрика может ограничивать ручное увеличения выборки, если количество визитов в исходных данных больше 500 000.
Как получить отчеты по 100% данных
- Уменьшить период построения отчета
-
Семплирование начинает применяться при превышении количества исходных данных в запросе. Вы можете скорректировать запрос таким образом, чтобы в него попадало не больше 500 000 визитов, уменьшив период построения отчета.
Например, если у сайта посещаемость составляет порядка 100 000 визитов в месяц, то коэффициент семплирования будет следующий при построении отчета за разные периоды:
Период отчета Всего визитов в исходной выборке Доля данных, которые будут использоваться при построении отчета Один месяц 100 000 100% Пять месяцев 500 000 100% Шесть месяцев 600 000 83,3% Двенадцать месяцев 1 200 000 41,7% Период отчета Всего визитов в исходной выборке Доля данных, которые будут использоваться при построении отчета Один месяц 100 000 100% Пять месяцев 500 000 100% Шесть месяцев 600 000 83,3% Двенадцать месяцев 1 200 000 41,7% - Подключить Метрику Про
-
В Метрике Про можно задать уровень выборки на уровне 100% в любой момент времени. Посмотрите другие преимущества и условия подключения в разделе О Метрике Про.
- Стать партнером Рекламной сети Яндекса
-
Возможность построения любого отчета по 100% данных доступна партнерам РСЯ, если объем видимых показов стабильно составляет не меньше 10 млн в месяц.