Семплирование и выборка

  1. Что такое семплирование
  2. Механизм семплирования в Метрике
  3. Когда семплирование может применяться в Метрике
  4. Как управлять семплированием
  5. Как получить отчеты по 100% данных

При построении отчетов Метрика использует детальные данные о визитах и посетителях. Вычисление показателей по большому количеству данных может потребовать значительного количества времени и ресурсов, поэтому для построения отчетов Метрика может использовать только часть из них, то есть применять семплирование. Так Метрика обеспечивает быструю скорость построения отчетов.

Что такое семплирование

Семплирование — это статистический способ обработки данных, при котором общее представление о них строится на основе определенной части всех данных, называемой выборкой.

Предположим, речь идет о прямых заходах на сайт. Посчитав, сколько их было в 1/10 от всех визитов, можно умножить результат на 10 и получить примерное число прямых заходов. В результате времени на получение ответа понадобится в 10 раз меньше, но полученный ответ будет приблизительным.

Подробно о семплировании

Механизм семплирования в Метрике

Алгоритм семплирования выбирает данные равномерно по посетителям сайта, сохраняя корреляцию и распределения атрибутов в семплированном отчете относительно полного.

Примечание.
  • Семплирование применяется только при построении аналитических отчетов в Метрике. При этом исходные данные не удаляются и не изменяются.
  • Семплирование не применяется в отчетах группы «Директ» в Метрике.
  • Сегменты Аудиторий создаются и сохраняются по 100% данным в отчете.
  • В отчетах в Директе отображаются полные данные.
  • Семплирование не влияет на эффективность рекламы.

Когда семплирование может применяться в Метрике

Семплирование может применяться при построении отчетов как в веб-интерфейсе, так и в API.

Семплирование может применяться при превышении 500 000 визитов в исходной выборке запроса (или 2 млн просмотров в соответствующих отчетах). Коэффициент семплирования динамически определяется таким образом, чтобы обеспечить построение отчета по максимальному количеству данных в зависимости от нагрузки.

Как управлять семплированием

Вы можете изменять уровень семплирования в отчетах с помощью Выборки.



В случае увеличения выборки отчет может строиться дольше или не сформироваться. Чтобы обеспечить загрузку отчета, Метрика может ограничивать ручное увеличения выборки, если количество визитов в исходных данных больше 500 000.

Примечание. Ограничение начнет действовать с сентября 2023 г.

Как получить отчеты по 100% данных

Уменьшить период построения отчета

Семплирование начинает применяться при превышении количества исходных данных в запросе. Вы можете скорректировать запрос таким образом, чтобы в него попадало не больше 500 000 визитов, уменьшив период построения отчета.

Например, если у сайта посещаемость составляет порядка 100 000 визитов в месяц, то коэффициент семплирования будет следующий при построении отчета за разные периоды:

Период отчета Всего визитов в исходной выборке Доля данных, которые будут использоваться при построении отчета
Один месяц 100 000 100%
Пять месяцев 500 000 100%
Шесть месяцев 600 000 83,3%
Двенадцать месяцев 1 200 000 41,7%
Подключить Метрику Про

В Метрике Про можно задать уровень выборки на уровне 100% в любой момент времени. Посмотрите другие преимущества и условия подключения в разделе О Метрике Про.

Стать партнером Рекламной сети Яндекса

Возможность построения любого отчета по 100% данных доступна партнерам РСЯ, если объем видимых показов стабильно составляет не меньше 10 млн в месяц.

 Написать в чат

Обратите внимание: служба поддержки не обзванивает пользователей. Не следуйте указаниям людей, которые вам звонят и представляются службой поддержки Яндекс Метрики.

Обратите внимание: служба поддержки не обзванивает пользователей. Не следуйте указаниям людей, которые вам звонят и представляются службой поддержки Яндекс Метрики.