编者按:Catherine Lu是DataVisor的技术产品经理,本文阐述了人工智能打击欺诈行为的三种主要方法。
人工智能将成为未来的主流。它会在联网的家里、车里以及其他任何地方出现。虽然它并不像外星人一样吸引眼球,但是人工智能在侦查欺诈行为上起到了重要的作用。牵制欺诈行为是一场持久战。这场战争中的双方——好人阵营和坏人阵营,都在不断快速进行调整,以让人工智能发挥它的最大作用。
人工智能当前有三种主要的方法对抗欺诈行为,分别对应人工智能的开发领域。它们是:
1.规则和信誉列表
2.监督机器学习
3.无监督机器学习
规则和信誉列表
在今天,很多现代的组织利用规则和信誉列表打击欺诈,这个类似于“专家系统”,它在1970年代首次进入人工智能领域。专家系统是结合了领域专家制定的规则的计算机程序。它们易于启动和运行,并且有人的理解能力,但它们同样也受到了不灵活性和需要大量人力这两方面特性的限制。
“规则”是指人编码的一个逻辑语句,它用来侦查有欺诈的账户和行为。举个例子,一个机构可能会制定一个规则:“如果一个账户花费了超过一千美元买一个东西,坐标在尼日利亚,且登录时间小于24小时,那就阻拦这笔交易。”
信誉列表,相似地,建立在已知的不良行为的基础上。信誉列表就是一个显示一些IP地址、设备类型以及其他个别特征及其对应的信誉评分的列表。然后,如果一个账户的IP地址出现在黑名单列表上,你就去阻拦它们。
虽然规则和信誉列表是侦查并预防欺诈的一个好方法,但是它很容易被网络罪犯玩弄于股掌间。如今,数字服务比比皆是,导致注册过程变得越来越容易。因此,欺诈者只需花一点的时间就可以创建几十个甚至数千个账户,然后利用这些账户去学习规则和信誉列表。犯罪者可以方便地访问云托管服务、虚拟私有网络、匿名电子邮件服务、设备仿真器以及移动设备闪存,从而逃过信誉列表的怀疑。
自1990年代以来,专家系统在很多领域都失宠了,它输给了更先进的技术。显然,我们应该有更好的反欺诈的工具。然而,现代公司中的很多反欺诈团队仍在用这种基本的方法去侦查欺诈,这导致了大量的人工评估开销、误报以及不良的侦查结果。
监督机器学习(SML)
机器学习是人工智能的一个分支,它尝试着去解决当前灵活性缺失的问题。研究人员想让机器从数据中得到信息,而不是为计算机应该主动寻找的东西编程(与专家系统不同)。机器学习在1990年代开始取得卓越的进步,到了2000年代它被有效地用于反欺诈。
监督机器学习可应用于欺诈是一个很大的进步。它与规则和信誉列表有很大的区别,因为它不再只是通过简单的规则看几个特征,而是参考所有的特征。
这种方法有一个缺点。一个用于侦查欺诈的监督机器学习的模型必须使用历史数据来判断欺诈账户和行为,并识别好的账户和行动。随后,模型可以浏览与账户相关的所有的特征来做出决定。因此,模型只能找出和原先的攻击相似的欺诈行为。许多狡猾的现代欺诈者仍然可以避开这些监督机器学习的模型。
应用于侦查欺诈的监督机器学习是一个正在发展的活跃领域,有很多的监督机器学习的模型和方法。例如,将神经网络应用于欺诈是非常有帮助的,因为它可以自动化特征过程,而这个步骤是非常昂贵并且需要人为干预的。这个方法相对其他监督机器学习模型,可以减少误报和漏报的发生频率,例如支持安全虚拟机和随机森林模型,因为隐藏的神经元可以比人类编出更多的特征可能性。
无监督机器学习(UML)
相比监督机器学习,无监督机器学习减少了领域的问题。在侦查欺诈领域,无监督机器学习在过去并没有发挥足够的作用。常见的无监督机器学习(例如k平均方法和分级群聚、无监督神经网络以及主成分分析)还没有在侦查欺诈中取得好的结果。
针对欺诈的无监督方法很难在内部构建,因为它需要同时处理数十亿个事件,且目前没有能即插即用的有效无监督模型。然而,有些公司在这一领域已取得了长足进步。
它能够用于反欺诈的原因就是它可以剖析欺诈攻击。正常的用户行为是混乱的,但是欺诈者有固定的工作模式,不管他们是否已经意识到了这点。他们以一定的规模快速工作。一个欺诈者不会试着去从一个在线服务中一下骗取十万美元。他们宁愿从成千上万的账户中分别骗取几分到几美元。但是这些活动会不可避免地创建出模式来,非监督机器学习可以侦查到它们。
使用非监督机器学习的主要好处:
1.你可以更早地发现新的攻击模式
2.掌控所有的账户,打断欺诈者骗钱的途径
3.误报的概率减少很多,因为你在做出侦查决定前已经收集了很多信息
组合拳出击
每个方法都有优点和缺点,而我们可以从各个方法中受益。规则和信誉列表方法在不需要人工智能的情况下,可以廉价并快速执行,但是它需要不断更新,并且只能阻拦最缺乏经验的欺诈者。监督机器学习已经成为了一个即插即用的技术,它能够考虑所有的单个账户的所有属性或事件,但它并不能发现新的攻击模式。无监督机器学习是新一代技术,它可以发现新的攻击模式、识别和一次攻击有关的所有账户以及提供一个完整的全局视图;而另一方面,它在阻拦个人欺诈者的低等级攻击上并不是很高效,并且很难在内部执行。不过,对于那些希望阻拦大规模或不断进行的攻击的公司来说,它当然还是首眩
一个健全的欺诈侦查系统一般都同时使用了这三种人工智能方法来反欺诈。如果合理地同时使用它们,我们可以对每一个方法都扬长避短。
人工智能在侦查欺诈领域将会继续进步,最终会远远超出上述的已发明的技术。我们很难去把握下一个前沿。不过有一件事是确定的,那就是犯罪分子也会道高一尺、魔高一丈。使用人工智能去侦查犯罪和使用人工智能去隐藏罪行之间的竞赛,还会继续进行下去。
翻译来自:虫洞翻翻 译者ID:盖里君 编辑:郝鹏程