Использование машинного обучения и big data для выявления фрода

Главная > Статьи > Использование машинного обучения и big data для выявления фрода
5 минут на чтение

Представьте ситуацию: вы сидите дома, вдруг раздается звонок из отдела по борьбе с мошенничеством с кредитными картами, и вас спрашивают, делали ли вы покупку в магазине. Вы ничего не покупали, карта была все время в кармане. Каким же образом банк определил, что эта единственная покупка похожа на мошенническую?

Компании-эмитенты кредитных карт заинтересованы в идентификации незаконных транзакций. Ставки велики. По данным исследования Federal Reserve, американцы использовали кредитные карты для оплаты покупок на сумму $ 26.2 миллиарда в 2012 году. Потери по несанкционированным транзакциям в тот год оцениваются в $6.1 миллиарда. Федеральный Закон о честном выставлении счетов по кредиту ограничивает максимальную ответственность держателя за неавторизованные транзакции $50, а остальные потери должны компенсировать компании-эмитенты кредитных карт. Все компании-эмитенты кредитных карт должны проходить аудит безопасности ежегодно. Но это все равно не останавливает мошенников.

В банковской индустрии крайне важна оценка риска. Главная цель – способность определить мошенническую транзакцию почти мгновенно, еще до того, как произойдет потеря. Как это работает? И кто побеждает в борьбе между ворами и банками?

 

Собираем силы

С точки зрения потребителя, выявление мошенничества сродни магии: процесс происходит мгновенно, без участия человека. Но за этой внешней быстротой и автоматизацией стоят сложные технологии из различных областей – от финансов и экономики до законодательства и IT.

Конечно, есть и простые механизмы: например, хороший индикатор фрода – неспособность указать правильный почтовый индекс, связанный с картой, когда она используется в необычном для клиента месте. Но мошенники уже научились проходить этот простой тест – выяснить почтовый индекс жертвы может быть так же просто, как сделать поиск в Google.

Ранее вычисление фрода основывалось на анализе данных, который требовал участия человека. Алгоритм помечал подозрительные случаи, они тщательно анализировались операторами, которые могли позвонить держателю с вопросом о совершенной операции. Сейчас у компаний такое огромное число транзакций, что им приходится полагаться на анализ Big Data. Развивающиеся технологии – машинное обучение и облачные вычисления – переводят поиск мошеннических операций на новый уровень.

Изучаем что законно, а что нет

Машинное обучение включает в себя самообучающиеся алгоритмы, которые предопределенным образом выполняют особые правила с помощью компьютера. Компьютер начинает с модели, а затем улучшает ее методом проб и ошибок. Далее он строит предположение о рисках, связанных с финансовой транзакцией.

Алгоритм машинного обучения по определению фрода сначала обучается на нормальных транзакциях большого числа держателей. Последовательность транзакций – пример типа данных для обучения. Например, человек обычно заправляет бензин один раз в неделю, покупает продукты дважды в неделю и т.д. Алгоритм изучает и запоминает эту нормальную последовательность транзакций.

Далее транзакции пропускаются через алгоритм в реальном времени. Результатом является оценка вероятности фрода (например, 97%). Если система настроена блокировать транзакции с вероятностью фрода более 95%, то оплата на точке будет отклонена мгновенно.

Алгоритм оценивает множество факторов для квалификации сделки как мошеннической: уровень доверия к торговой точке, покупательские привычки владельца карты, включая время и место, IP адрес, т.д. Чем больше данных, тем точнее решение.

Такой процесс делает возможным обнаружение фрода в реальном времени. Ни один человек не оценит тысячи данных за долю секунды.

Алгоритм знает, используется ли карта в ресторане, в который вы ходите каждую субботу, или на заправочной станции на расстоянии двух часовых поясов в 3 часа ночи. Он также проверяет, не является ли последовательность транзакций необычной? Если карта дважды за день использовалась для снятия наличных, чего никогда не было ранее, то такое поведение повышает вероятность мошеннической операции. Если эта вероятность выше порогового значения, то после быстрого анализа оператором алгоритм даст команду торговой точке отклонить транзакцию. Покупки онлайн обрабатываются по той же схеме.

В таких системах участие человека уходит в прошлое, так как это замедляет принятие решения. Однако, человек может анализировать уже совершившийся фрод или, после массового отклонения транзакций, связаться с клиентом и предупредить о блокировке карты.

Компьютерные детективы в облаке

Количество финансовых операций — это настоящие Big Data. Но машинное обучение как раз основывается на горах данных – бОльшее количество информации повышает точность алгоритма, помогая снизить число ошибочных отклонений транзакций (отклонений операций, которые в действительности законны, например, когда карта используется в неожиданном месте). Слишком много подозрений так же плохо, как и ни одного.

Для обработки таких массивов данных требуются мощные компьютеры . Например, PayPal обрабатывает более 1.1 петабайта данных от 169 миллионов клиентских счетов в единицу времени. Такое количество данных (один петабайт – это около 200,000 DVD-дисков), хорошо для обучения алгоритмов, но требует особой компьютерной инфраструктуры в компании. Выходом может быть использование облачных вычислений: они масштабируемы и не ограничены собственной компьютерной мощностью компании.

Поиск фрода – соревнование между плохими и хорошими парнями. Кажется, что сейчас хорошие парни побеждают благодаря применению новых технологий – чипов, пин-кодов, машинного обучения, Big Data, облачных вычислений и пр.

Но мошенники тоже не стоят на месте и пытаются найти лазейки в системе обнаружения фрода. Изменения в системах приема электронных платежей также влияют на уровень фрода. Ваш телефон может хранить информацию о карте и использоваться для бесконтактной оплаты, что создает новые уязвимости. К счастью, современные алгоритмы обнаружения фрода не зависят от технологий платежей.

 

Автор: Jungwoo Ryoo

Источник: https://theconversation.com/machine-learning-and-big-data-know-it-wasnt-you-who-just-swiped-your-credit-card-48561