بدیهی است که با ایجاد هر سیستم مالی، بسیاری از افراد با کشف خلا امنیتی سیستم، سعی در کسب منابع مالی با کمترین زحمت را دارند. در زمینه مبارزه با تقلب، دو نگاه کلی وجود دارد: اجتناب از تقلب و شناسایی آن و طراحی سیستمهایی با امنیت بالا و برای مثال طراحی رمز دوم یا OTP که جزو طبقه اول این دستهبندی است. گاهی سیستم امنیتی بسیار دقیق طراحی شده است؛ در این موارد متقلبین سعی میکنند با فریب افراد به مقاصد خود نائل شوند. از اینجا به بعد، سیستمهای شناسایی تقلب برای جلوگیری از جابهجایی پول، کاربرد پیدا میکنند. یک موسسه تحقیقاتی در زمینه مالی میزان کلاه برداری از طریق دزدی مشخصات در سال ۲۰۲۰ را حدود ۵۶ میلیون دلار تخمین زده است.
لازم به ذکر است که سیستمهای کشف تقلب باید بهطور مداوم، در طول زمان تکامل یابند، زیرا زمانی که دستهای از تقلبها کشف میشوند، استراتژیهای قدیمی کنار گذاشته و با استراتژیهای جدید تقلب جایگزین میشوند.
سیستمهای کشف تقلب از الگوریتمهای یادگیری ماشین، تحلیلهای سری زمانی، تحلیلهای آماری و ریاضیاتی و تحلیل گراف برای کشف تقلب استفاده میکنند. تقلب را میتوان نوعی ناهنجاری در دادهها به حساب آورد؛ بنابراین میتوان از این به بعد بهجای اصطلاح کشف تقلب، شناسایی نمونههای ناهنجار را به کار برد. ناهنجاریها در دادهها سه نوع مختلف دارند که لازم است در کشف هر تقلب دقت کنیم کدام یک از انواع ناهنجاری در حال رخدادن است؛ در این صورت احتمال شناسایی خطا پایین میآید. این ناهنجاریها عبارتند از:
-
ناهنجاریهای نقطهای: زمانی که یک داده بهصورت معناداری از بقیه دادهها متفاوت است. برای مثال، اگر موجودی یک کارت به صورت میانگین در هر روز برابر پنج هزار تومان باشد، موجودی برابر با پنج میلیارد تومان در یک روز تصادفی، ناهنجاری نقطهای نامیده میشود.
-
ناهنجاریهای مبتنیبر زمینه: زمانی که یک داده با توجه به درنظرگرفتن شرایط موجود یا همان زمینه حضور، ناهنجار رفتار میکند. برای مثال، میزان برداشت از کارت در مواقع خاصی از سال مانند اسفندماه (قبل از نوروز) افزایش مییابد. این افزایش برداشت در اسفندماه رفتاری معمول است، در صورتی که همین افزایش برداشت در ماههای دیگر سال رفتاری ناهنجار محسوب میشود.
-
ناهنجاریهای تجمعی: زمانی که مجموعهای از دادههای شبیه به هم در نسبت با بقیه دادهها ناهنجار رفتار میکنند. برای مثال پولشویی نمونهای از این دست ناهنجاری است.