Мошенничество с установкой приложений - горячая тема в мобильной индустрии уже несколько лет. Этот факт подтверждается тем, что 78% маркетологов брендов обеспокоены мошенничеством с рекламой и трафиком ботов (по оценкам прошлого года, экономические потери из-за мошенничества с ботами в мире в 2017 году составили около 6,5 млрд долларов США, в частности, мошенничество с установкой приложений убытки составили более 3,6 млрд долларов). Для рекламодателей приложений проблема мошенничества актуальна как никогда. Поддельные установки влияют на показатели приложения, вынуждая маркетологов бросать все больше и больше денег в трубу. Мошенничество - это адаптивное преступление, поэтому для его обнаружения и предотвращения требуются специальные методы интеллектуального анализа данных. Посмотрим, на что стоит обратить внимание в борьбе с мошенничеством с мобильной рекламой.

Решения по борьбе с мошенничеством и методы их работы

Проблема развивается: стратегии мошенничества развиваются и становятся все более изощренными. И проблема в том, что число самых сложных видов мошенничества растет. По оценкам Scalarr, с января по март этого года доля миксов (смесь различных видов мошенничества или смесь реальных пользователей и мошенничества с установкой приложений) увеличилась на 118,7%. Борьба с мошенничеством без соответствующего решения по борьбе с мошенничеством становится невозможной. Но выбор правильного решения для обнаружения мошенничества с соответствующей технологией может быть не так просто, как кажется, поскольку рынок насыщен различными услугами по борьбе с мошенничеством. При детальном рассмотрении рынка решений по борьбе с мошенничеством становится легко разделить все существующие решения на две группы в зависимости от технологий, которые они используют для обнаружения мобильного мошенничества: решения по борьбе с мошенничеством на основе правил и на основе машинного обучения. Решения из этих двух групп имеют существенные различия в способах выявления мошеннических действий:

1. Решения по борьбе с мошенничеством, основанные на правилах, универсальны - они обучены делать то, что запрограммировано, без добавления интеллекта. Они следуют двоичному представлению о том, выполняются ли критерии правил или нет, и не могут обнаруживать новые (неизвестные) и измененные модели мошенничества. Это приводит к большему количеству ложных срабатываний или ложноотрицательных результатов и низкой точности обнаружения мошенничества. Хотя решения на основе правил служат своей цели в определенных сферах, их способность адаптироваться к современному миру больших данных ограничена.

2. Решения по борьбе с мошенничеством на основе машинного обучения - алгоритмы машинного обучения автоматизируют исследование большего количества данных, чем возможно для человека, сопоставляя тысячи типов данных, таких как время установки, IP-адрес, домен, основные города, страны, устройства, время. до 1-й транзакции после регистрации, аномальных покупок и т. д. Решения на основе машинного обучения могут учиться на основе данных так же, как человек учится на собственном опыте. По мере того, как вы углубляетесь в тему решений для машинного обучения, вы можете обнаружить, что они могут использовать разные алгоритмы, которые определяют способ их работы и обнаруживают мошеннические установки. В целом алгоритмы машинного обучения можно разделить на три типа в зависимости от того, как они «узнают» о данных для принятия решений и прогнозов для борьбы с мошенничеством с мобильной рекламой: контролируемое (SML), частично контролируемое (SSML) и неконтролируемое обучение (UML).

Контролируемое обучение названо так потому, что ему нужно задать набор предикторов (независимых переменных). Другими словами, у него есть руководство в лице специалиста по данным, которое обучает алгоритм, как он должен работать и какие выводы он должен выводить. Исходя из этого, SML показывает хорошие результаты при обнаружении уже известных видов мошенничества. Но когда дело доходит до новых развивающихся видов мошенничества, эффективность SML значительно снижается. С другой стороны, неконтролируемое машинное обучение уже способно выявлять сложные процессы и закономерности посредством кластеризации и сегментирования входных данных в различных группах для конкретного вмешательства без какой-либо целевой переменной для прогнозирования или оценки. Алгоритмы UML самообучаются. Такой алгоритм будет более эффективным для обнаружения новых мошеннических действий, которые еще не изучены из существующего набора данных. Однако, несмотря на то, что UML дает наиболее точный результат, этот результат очень трудно интерпретировать, чтобы указать на причины мошенничества. Для этой задачи отлично подходит алгоритм Semi-Supervised ML, который использует небольшой объем помеченных данных с большим объемом немаркированных данных. Использование SSML в дополнение к UML может значительно повысить точность и полноту идентификации мошенничества и позволяет легко интерпретировать причины мошенничества в удобочитаемой форме. В результате хорошо продуманное решение использует эти типы алгоритмов для построения моделей прогнозных данных, которые помогают компаниям предотвратить любую угрозу мошенничества.

Помимо различий между моделями на основе правил и машинного обучения, мы должны сказать, что системы на основе правил, модель которых основана на показателях, помечают до 50 процентов пользователей как подозрительные и требуют дополнительной проверки со стороны человека. На этом этапе менеджерам по привлечению пользователей может быть сложно отличить весь мошеннический трафик от не-мошеннического. Особенно с учетом того, что из партнерских сетей в «траст» стали активно просачиваться мошенники. Доля мошенничества, которую мы сейчас можем исследовать в таких источниках, колеблется в среднем от 2 до 14%, но еще несколько лет назад такие цифры были невозможны. С другой стороны, решения машинного обучения могут дать однозначный результат, будь то мошенничество или нет. Ниже представлена ​​упрощенная рабочая модель решения Scalarrs по борьбе с мошенничеством:

Как с умом бороться с мошенничеством с рекламой, устанавливаемой мобильными приложениями

Как мы упоминали выше, идентификация на основе машинного обучения показывает самый высокий уровень обнаружения мошенничества среди других методологий. Он может находить закономерности, которые не очевидны для человека. И этот момент имеет решающее значение, поскольку общая доля мошенничества умных ботов уже превышает долю атрибутивного мошенничества среди наших клиентов на 37%.

True ML - это функция решения, которая непрерывно изучает и генерирует персональную модель выявления мошенничества для каждого мобильного приложения. Он учитывает все объективные и поведенческие особенности и географические различия. Таким образом, у каждого клиента такого решения есть свой специфический и персональный алгоритм машинного обучения. Наличие такой технологии имеет решающее значение для максимальной полноты обнаружения мошенничества (выявления всех известных типов мошенничества с рекламой при установке мобильных приложений) и точности обнаружения мошенничества (способности решения выявлять мошенничество с минимальным уровнем ошибок).

Машинное обучение - отличный кандидат для обнаружения мошенничества с возможностью масштабирования с относительно быстрыми и качественными результатами. Цель ML - предоставить точный результат, когда системы, основанные на правилах, либо отклонят установку, либо задержат установку до дорогостоящей ручной проверки. Решение по борьбе с мошенничеством на основе машинного обучения в пять-десять раз лучше в обнаружении мошенничества, чем решения, основанные на правилах.

По оценкам Скаларра, разработчики теряют в среднем от 10% до 40% своих маркетинговых бюджетов, что составляет 6,5 миллиардов долларов глобальных экономических потерь, о которых мы упоминали в начале. И, согласно нашему прогнозу, уровень мошенничества вырастет на 20% в 2018 году и станет самой большой угрозой для рекламных расходов в следующие 5 лет. Итак, пора ополчиться против похитителей маркетинговых бюджетов.

Более подробную информацию по этому поводу вы можете получить на сайте Scalarr.