Статьи
Оценка дополнительной ценности мультиканальной атрибуции
Постановка задачи
«Что нам это даст?» — этот вопрос справедливо задают даже те, кто хорошо знаком с недостатками стандартных моделей атрибуции. Если вы не знаете, какая модель атрибуции используется в вашем проекте, то скорее всего это Last Non-Direct Click — вся ценность от транзакции атрибутируется на последний непрямой визит. Эта модель настроена по-умолчанию в большинстве аналитических сервисов, в том числе в Google Analytics.
Все знают, что Last Non-Direct Click не учитывает взаимное влияние каналов. Но как это померить в деньгах? Какую долю дохода искажает Last Non-Direct Click и в какой мере мы можем на это повлиять?
Не все цепочки одинаково полезны
Если в вашем проекте используется
Google Analytics 360
или
OWOX BI Streaming
, то у вас есть доступ к несемплированным данным в Google BigQuery
и вы можете проверить любую гипотезу на полных данных. Но если в вашем распоряжении только стандартная версия Google Analytics, то вечер перестает быть томным
найти ответ будет непросто.
Посмотрим на отчет по длинам мультиканальных последовательностей:

В качестве типа конверсий необходимо выбрать только транзакции. В результате мы узнаем, какая доля доходов приходится на заказы, сделанные с первого визита. В нашем примере (мультиканальный ретейлер со средней посещаемостью) 72% дохода пришлось на мультиканальные цепочки, в которых было два и более визита.
Но искажение в 72% — выглядит нереально большим; сложно поверить, что даже Last Click настолько искажает распределение дохода.
Давайте посмотрим внимательнее на то, какие цепочки с двумя и более визитов являются наиболее популярными. Для этого откроем отчет Top Conversion Paths:

Обратите внимание:
- Цепочки 1,3,4,6,8 и 9 заканчиваются Direct визитом и распределение в них не отличается от Last Non-Direct Click;
- В цепочке 7 первым идет слабо управляемый канал трафика — органический поиск. Знание о том, что мы занизили его ценность плохо применимо на практике.
Здесь мы приходим к важным выводам. Для того, чтобы объективно оценить потенциал применения мультиканальной атрибуции необходимо рассматривать цепочки, удовлетворяющие следующим условиям:
- Распределение ценности в цепочке должно отличаться от Last Non-Direct Click;
- Управляемый канал трафика должен быть не последним в цепочке.
К управляемым каналам относятся, как минимум, платные источники трафика. Чтобы выделить такие последовательности, применим фильтр к цепочкам каналов:

В качестве регулярного выражения необходимо указать следующую строку:
(Paid Search|Display|Affiliates|unavailable|Email|Other).*>.*(Paid|Display|Affiliates|unavailable|Email|Social|Organic|Referral)
В переводе с регулярного выражения на русский язык здесь сказано, что в последовательностях должна встречаться цепочка из управляемого источника, а потом любого, кроме Direct. Соответствие групп каналов источникам подробно описано в справке.
После применения фильтра, мы получим только те цепочки, в которых распределение последовательности на управляемые каналы отличается от Last Non-Direct Click.

Обратите внимание:
- В группировке каналов по умолчанию к unavailable отнесется весь не распознанный трафик с utm-метками, поэтому мы его тоже учитываем;
-
Если решите изменить регулярное выражение, не забудьте, что Google Analytics поддерживает
синтаксис RE2. В нем не поддерживаются некоторые конструкции, например, исключения
(?!re)
.
Теперь значение Conversion Value в отчете Top Conversion Paths нам покажет, что если учесть взаимное влияние каналов, то изменится распределение $19,7M, что составляет 40% доходов:

Перераспределение бюджета с учетом взаимного влияния каналов, по нашему опыту, дает прирост ROAS от 20 до 50% в данном сегменте.
В итоге дополнительную ценность от перераспределения бюджета можно оценить как
Дополнительный доход = Перераспределенный доход * Прирост ROAS
Перераспределенный доход — это доход, который при оценке каналов по модели Last Non-Direct Click не учитывает мультиканальное влияние и может быть перераспределен.
Прирост ROAS — это увеличение эффективности в данном сегменте дохода.
В нашем примере дополнительный доход составит:
$19.7M ∗ {20%; 50%} = от $3.8M до $9.6M в месяц.
Чтобы понять, насколько это важно для вашего проекта, подставьте свои цифры и спросите себя, как изменится ваше настроение, если при том же рекламном бюджете продажи упадут на эту сумму? А если увеличатся?
Принятые допущения
Перед применением полученных результатов следует остановиться на влиянии принятых допущений.
- Multi-Funnel Channel отчеты в Google Analytics анализируют цепочки в рамках одного cookie (clientId). Поэтому если ваша модель использует объединение пользовательских цепочек на разных устройствах с помощью userId (например в Google BigQuery), то средняя длина цепочки возрастет и потенциальная дополнительная ценность станет еще выше;
- Если вы заранее знаете, что уже исчерпали емкость определенных каналов, например брендовых каналов или узкоспециализированных площадок, их лучше отнести к неуправляемым каналам — увеличивать бюджет на них скорее всего не оправданно;
-
Самое главное: если после применения фильтра к цепочкам каналов вы получили предупреждение о семплировании — поздравляем, вас ждет бонус-трек!
1,000,000 — это достаточно большая выборка. Но так как она используется для построение большого числа небольших сегментов, то итоговая погрешность может быть колоссальной. Несемплированный результат может отличаться в несколько раз. Чтобы получить ответ необходимо исключить из отчета сегментацию по всевозможным разновидностям цепочек. К счастью, это можно сделать с помощью Multi-Channel Funnels API даже в стандартной версии Google Analytics.
Для этого создадим отчет со следующими параметрами:

Чтобы увидеть насколько группировка по каналам влияет на результат можете добавить в Dimensions: «mcf:sourceMediumPath,mcf:basicChannelGroupingPath».
Вот сравнение результатов с семплированием и без для проекта с посещаемостью порядка 500K сессий в день:

Применение полученных данных
Мы ответили на вопрос «Что нам это даст?». Следующий вопрос который за ним возникает — «Что нам с этим делать?».
В первую очередь поздравьте себя — у вашего проекта есть потенциал роста и возможность более эффективно вкладывать деньги в рекламу.
Следующее, что нужно сделать, это определить модель атрибуции, с помощью которой вы будете оценивать мультиканальные цепочки. Мы рекомендуем метод атрибуции на основе вероятностей прохождения воронки. В отличии от ассоциированных конверсий или смешанных моделей, он не атрибутирует больше, чем вы заработали и обеспечивает полностью прозрачные расчеты.
Порядок его применения и оценки мы подробно рассмотрим в отдельной статье. Главное, при оценке результатов любой мультиканальной модели атрибуции помнить общее правило: оценивать необходимо изменения в целом по сайту, а не в конкретном канале. Потому что как и у любого тренера, задача проекта максимизировать командный результат, а не индивидуальное достижение каждого игрока (кампании) в отдельности.