18 нояб
2016

Logs API: выгружайте сырые данные из Метрики

Теперь вы можете забирать из Метрики сырые данные за любой период — и распоряжаться ими по своему усмотрению: решать сложные аналитические задачи или импортировать в другие системы аналитики. Выгрузку сырых данных обеспечивает новый программный интерфейс — Logs API.

Мы всегда старались сделать веб-аналитику как можно более гибкой — поэтому в Метрику можно передавать неограниченный объём данных и при этом управлять семплированием. А с сегодняшнего дня вы можете ещё и забирать из Метрики сырые данные за любой период — и распоряжаться ими по своему усмотрению: решать сложные аналитические задачи или импортировать в другие системы аналитики. Выгрузку сырых данных обеспечивает новый программный интерфейс — Logs API.


Чем сырые данные отличаются от агрегированных

Агрегированные, или обобщённые данные, которые вы видите в интерфейсе Метрики или выгружаете через API отчётов, рассчитываются для определённой группы визитов. Например, метрика «время на сайте» вычисляется для всех переходов из какого-либо источника трафика, всех визитов от посетителей мужского пола или всех визитов с планшетов.

А основой для этих расчётов служат сырые данные — записи об отдельных визитах или просмотрах. Таблица с этими записями и передаётся через Logs API, при этом каждая запись дополнена полезными сведениями из Метрики. Это подробные данные по Директу и по электронной коммерции, страна и город посетителя, а ещё — различная техническая информация о визите: например, браузер и модель мобильного телефона.


Зачем нужны сырые данные

С агрегированными данными удобно работать: они уже собраны в готовые показатели эффективности, и вам остаётся только сделать выводы. А сырые данные необходимы, чтобы получить новую статистику помимо той, что доступна в отчётах. 

Вот несколько примеров использования неагрегированных данных:
 

Сложные воронки продаж 

Чтобы детально изучать пути к покупке, вы можете отслеживать историю переходов на ваш сайт для каждого посетителя в отдельности — и выделять закономерности, важные для вашего бизнеса. Скажем, исследовать, как разнесены по времени визиты, в которых посетитель совершает целевые действия, и какие каналы обычно приводят клиентов на каждом шаге воронки.


Собственные модели атрибуции

В Метрике есть три готовых модели атрибуции: по первому, последнему и последнему значимому переходу. Работая с сырыми данными, вы сможете создавать любые другие модели и подробно анализировать вклад разных маркетинговых каналов в конверсии. Например, отслеживать, как влияет на продажи медийная реклама в том случае, если она хотя бы один раз приводила посетителя на сайт — но при этом не была первым или последним источником перехода. 


Объединение данных из разных источников

Сырые данные из Метрики можно добавлять к вашим данным из других систем — например, чтобы собирать в одной точке всю статистику по рекламным расходам. Или на своей стороне связывать данные из Метрики с данными в вашей CRM.


Контроль над расхождениями в статистике

Бывает, что цифры в других системах аналитики не сходятся с цифрами в Метрике. Обычно такие нестыковки связаны с разными принципами подсчёта: анализируя сырые логи, вы сможете понять, как каждая система обрабатывает данные — и выбрать для себя тот подход, который лучше отвечает вашим задачам. 


Как работать с Logs API

Сырые данные передаются в стандартном формате tsv — такой файл можно легко импортировать в большинство систем управления базами данных. В их числе — ClickHouse, бесплатное открытое решение, на котором работает и сама Метрика. ClickHouse умеет обрабатывать сложные запросы в реальном времени, легко настраивается и не требует больших вычислительных ресурсов. А автоматически подгружать свежие данные в ClickHouse можно с помощью скрипта, подготовленного командой Метрики. 

Документация по Logs API, подробное описание схемы данных и скрипт выгрузки в ClickHouse доступны на сайте технологий.
 

Поделитесь материалом в соцсетях

Подпишитесь на новости

8 800 234-24-80

Звонок из регионов России бесплатный