Как обнаружить фрод с помощью метрик CTIT, VTIT и CTCT

Автор: Иван Мажаров Fraud Scanner, Lead Data Scientist

17 декабря 2020

Мы в MyTracker не понаслышке знаем о проблеме мобильного фрода в рекламе, и сегодня расскажем о том, как его обнаружить и обезопасить свой бюджет. Мобильный фрод — очень распространённое явление в рекламе, оно затрагивает всех владельцев мобильных приложений, которые хотят заниматься продвижением и привлекать пользователей.

Почему проблема мобильного фрода актуальна? Согласно недавно опубликованному исследованию Forrester, около трети маркетологов крупных компаний полагают, что как минимум 40% их бюджетов на закупку рекламного трафика подвержены риску фрода. С учётом того, что в современных компаниях рекламные бюджеты достаточно большие, ущерб может составлять миллионы долларов. Поэтому, чтобы ваш маркетинговый бюджет не уходил недобросовестным площадкам, с фродом нужно бороться.

Начнём с определения фрода в мобильной рекламе. Этим термином мы будем называть разные формы мошенничества, такие как перехват кликов, накрутка показов рекламы, имитация устройcтв и другое, которые искажают результаты рекламных кампаний и съедают бюджет.

Обычно есть действия пользователей, за которые вы платите деньги рекламной сети. Разделим их на два типа:

события до установки: это может быть просмотр рекламного ролика или клик по рекламному баннеру;
события после установки: сама установка приложения или какое-нибудь целевое действие (к примеру, просто установка или достижение определённого уровня), которое пользователь совершил в игре.

Особенность событий до установки в том, что информацию о действиях пользователя в рекламных сетях вы можете получить только от самой рекламной сети. Если пользователь в конце концов не установил приложение, то вы не можете напрямую узнать о его действиях, а значит, платите деньги рекламной сети по информации, которую она же вам и предоставила. И самый простой случай фрода в такой ситуации — отдавать клиентам недостоверные и сгенерированные данные о кликах или просмотрах и получать за это деньги.

Ещё один пример мобильного фрода, который сразу приходит на ум, — это бот-фермы. Этот способ мошенничества более утончённый и сложный, он нацелен на «дорогие» целевые события, например, платежи или иные действия в игре. Мобильная реклама — быстрорастущий бизнес, поэтому запросы клиентов постоянно увеличиваются, как и возможности рекламных сетей. Если платить только за те события, которые вы можете отследить (например, установки), то часть фрода можно обойти. Более крупные рекламные сети предоставляют возможность создавать сложные события, за которые вы будете платить (например, платёж в игре или продолжительная игра более N часов). Бот-фермы же могут пытаться генерировать поведение простых пользователей и выполнять целевые действия рекламной кампании. При этом современные боты могут довольно точно прятать свою сущность, эмулируя нажатия на экран и прочие действия пользователя, а также характеристики реальных мобильных устройств.

Теперь перейдём к некоторым способам обнаружения фрода. Для начала будем пытаться искать нечестные рекламные сети, которые пытаются нас обмануть, например, продать воздух в виде сгенерированных данных или украсть пользователя у другой рекламной сети. Предполагаем, что мы можем получить от рекламной сети данные о кликах и просмотрах.

CTIT — Click to Install Time

Главная идея следующая: будем рассматривать время, прошедшее между последним кликом по рекламному баннеру, перед установкой приложения и самой установкой. Сразу оговоримся, что установкой будем считать первый запуск приложения. Между этими событиями происходит целая цепочка действий:

пользователь переходит по рекламной ссылке в магазин приложений;
возможно, оценивает само приложение;
нажимает на кнопку установки;
вводит пароль, если нужно;
скачивает файлы приложения;
устанавливает его и запускает.

Все эти действия занимают время и сократить его кардинально в большинстве случаев нельзя.

Будем считать, что время, затраченное на такое поведение пользователей, должно следовать логнормальному распределению. Мы проверили это на органическом трафике (пользователи, которые установили приложение не переходя по ссылкам, а естественным, органическим путём). На органике обычно нет фрода, потому что за него мы не платим. Вот пример логнормального распределения.

На графике по оси X разница во времени между последним кликом и установкой приложения (дельта), а по оси Y доля пользователей из множества рассматриваемых с такой дельтой.

Пользователи распределены по скорости интернета (то есть по времени скачивания) и по заинтересованности (пользователь мог открыть приложение в магазине, но не начать его скачивание). Не будем забывать, что пользователь уже нажал на рекламу, а значит, скорее всего, он заинтересован в приложении и хочет его скачать. Таким образом, у распределения времени пик должен быть смещён влево, а также должен иметься большой хвост (медленный интернет, не сразу скачали приложение и т.п.). Теперь перейдём к самому важному вопросу. Как отделить честных пользователей от сгенерированных? Вопрос сложный, но попробуем разобраться.

Первым делом давайте посмотрим на график, а потом поясним, как мы понимаем, какой трафик фродовый, а какой нет.

Самое точное замечание, которое можно добавить и которое всё поставит на свои места такое: «Мы считаем фродовым трафиком любой, который выбивается из логнормального распределения».

Но тут тоже не всё так просто, ведь не всегда у нас есть миллионная выборка и не всегда эта выборка не содержит выбросов. Так что первым делом надо очистить трафик от выбросов, которые могли быть из-за неверных расчётов или сбоев в системе сбора данных (самый простой пример — отрицательные значения по оси X). После того как мы получили более-менее очищенный график, можно построить гистограмму и оценить, насколько она похожа на логнормальное распределение. Дальше уже можно выделить трафик, который под него не подходит. Если же трафика остаётся мало, то один из самых простых подходов — это попытаться расширить выборку, добавив в неё похожий трафик или увеличив рассматриваемый временной интервал.

VTIT — View to Install Time

Метрика очень похожа на CTIT. Но теперь мы будем рассматривать не время между последним кликом и установкой, а время между последним просмотром рекламного баннера и установкой. Мы считаем, что это распределение тоже должно быть похоже на логнормальное, но теперь минимальное время до установки увеличивается, так как после просмотра (а может быть, просмотр без клика) пользователи потратили время на то, чтобы найти приложение, а потом уже его скачать. Многие нечестные рекламодатели пытаются выдать просмотр своей рекламы на другой рекламной сети за свой, поэтому такие метрики их быстро выдают.

На графике по оси X разница во времени между последним просмотром и установкой приложения (дельта), а по оси Y доля пользователей из множества рассматриваемых с такой дельтой.

CTCT — Click to Click Time

Главная идея в том, чтобы обратить внимание на время между последним и предпоследним кликом.

Как сказано выше в метрике VTIT, есть много нечестных рекламодателей, которые пытаются украсть клик (или просмотр) у другой рекламной сети. С помощью этой метрики мы в большинстве случаев будем выявлять именно такой тип фрода, что может нам помочь распределить будущие рекламные бюджеты в другой пропорции, так как у нас будет понимание, что некоторые из наших рекламных сетей не приводят новых пользователей, а просто крадут тех, которые бы и так к нам пришли. В случае с этой метрикой понятно, что если пользователь кликнул на приложение, то он, скорее всего, им заинтересовался, перешёл в магазин приложенийи начал загрузку. Будет странно, если за очень маленький временной промежуток у нас есть два клика по разным рекламным баннерам и ещё более странно, если от двух разных рекламных сетей. Потому что, даже если пользователю не понравилась страница в магазине приложений, он, скорее всего, вернулся к игре или сайту, на котором проводил время до клика, а не стал ходить по другим сайтам. Так что в этой метрике мы тоже ожидаем увидеть логнормальное распределение и будем работать с ней очень схожим с CTIT образом.

В этой метрике важно отметить, что мы считаем фродовой рекламную сеть, которая нам предоставила последний клик, так как именно она пытается украсть пользователя. Метод не стоит использовать на просмотрах, так как они обычно независимы, и пользователь может ходить по множеству сайтов или смотреть много рекламы в приложениях.

Заметить кражу рекламных просмотров намного сложнее, но в большинстве случаев и не так необходимо, ведь реклама, нацеленная на просмотр, в наше время стоит очень мало по сравнению с другими типами.

Заключение

Последнее, что надо отметить относительно этих метрик, это временной интервал их применения. Все три метрики стоит рассматривать только в первые 10-15 секунд, так как они измеряют, что то или иное событие произошло очень быстро.

Метрики, которые мы рассмотрели, больше нацелены на плохие рекламные сети, но не на пользователей. Это важно понимать для переговоров с партнёрами или при планировании мер против фродовых пользователей.

Если вы хотите закупать более чистый трафик и платить за реальных пользователей, то можете отсечь достаточно большое число недобросовестных партнёров с помощью перечисленных метрик. К сожалению, это только верхушка айсберга и большинство рекламных сетей умеют хотя бы частично обходить эту защиту.

При работе с метриками CTIT, VTIT и CTCT необходимо соблюдать некоторые условия:

сбор и хранение большого числа событий о своем приложении;
интеграция и сбор данных от рекламных партнеров;
умение проводить атрибуцию установок и остальных событий;
наличие вычислительных мощностей и времени аналитиков, чтобы собрать все данные и и исследовать показатели фрода.

Мы знаем, что анализировать все данные вручную достаточно сложно, поэтому разработали Fraud Scanner. Он умеет автоматически распознавать все типы мобильного фрода и защищает на каждом этапе работы с приложением.

Метки: антифрод

Вам может быть интересно

Топ-5 бесплатных инструментов от MyTracker для аналитики сайтов и приложений 01 октября 2024 Единая метрика для обнаружения ботов и виртуальных устройств 20 февраля 2023 MyTracker Fraud Scanner теперь выявляет фрод в веб-трафике 02 ноября 2021