新闻详情

Data Driven Symbolic Modeling: XrayBot的金融风控实践与解决方案

发表时间:2021-04-26 11:08

上次我们通过实例简单介绍了爱科思瑞铂特利用人工智能技术赋能证券行业数字化转型的部分实践经验。金融行业因本身与数据有高度的相关性,自然而然地成为了大数据人工智能技术最先落地的领域。


而在除证券行业的其他金融领域,我们也有着成型的解决方案,之前我们已经介绍过让计算机获得基于知识和记忆的高级判断、推理能力的核心技术——知识图谱,这次我们介绍基于知识图谱+机器学习技术搭建风控模型的例子。


知识图谱作为人工智能重要的技术,已渗透到金融行业的多个应用领域,提供更深入的信息分析和挖掘能力。


近几年,知识图谱成为金融行业反欺诈“利器”。原因在于,知识图谱从本质上来说是一种大规模的语义网络,以海量的业务数据为基础,综合运用语义理解、知识挖掘、知识融合、知识补全等技术,提炼出高精度知识,将真实业务中的实体及其之间的关系通过图结构来表示,构建大规模的高精度、高质量的知识图谱


银行数字化转型


艾瑞咨询近日发布的《2020年中国面向人工智能“新基建”的知识图谱行业研究报告》指出,无论是传统金融还是互联网金融领域,信用评估、反欺诈和风险控制都是最为关键的环节。随着近些年金融数据的爆发式增长,传统风控系统逐渐力有不逮,而应用机器学习算法和知识图谱的智能风控系统在风险识别能力和大规模运算方面具有突出优势,逐渐成为金融领域风控反欺诈的主要手段。


目前,不少金融行业技术人员感叹,在积极尝试新技术应用和新系统改造的过程中,遇到了“拦路虎”。比如系统数据缺乏有效的内外部整合,行内大量的金融数据都沉积在文档、PDF文件、图像和视频中,成为了“结构化数据之墙”,同时由不同渠道而流入银行系统的数据无法有效与行内数据相适配。再者,随着科技的发展和黑产产业链日趋成熟,个人金融服务领域的诈骗、套现、薅羊毛、盗卡盗刷等欺诈行为不断出现,传统的风险防控手段无法及时、准确评估客户风险,进而无法有效应对新型的欺诈手段。另外,传统风控模式轻策略重运营,轻线上重线下,在获客、预筛、审批、授信、交易等各个环节都面临不同的困境。


知识图谱精耕反欺诈


针对以上痛点,目前金融行业达成共识的是,利用知识图谱与机器学习相结合,重塑金融领域智能风控。


金融行业信息技术人员认为,金融数据就像埋藏在地底下的石油,如何将这些非结构化的多模态数据以结构化知识的形式提取出来,是当前发展最大的瓶颈。而知识图谱应用可以通过权威经验和规则创建本体模型和抽取实体的范围,根据实体间关系形成关联数据网的图谱形式,打通相关数据,动态、实时地描画囊括个人基础信息、金融行为、社交网络行为等用户综合画像,并结合业务场景,根据画像的情况与模型对应,形成具有金融业务特性的风控体系。


那么,在实践中,金融行业如何更好地利用知识图谱技术实现反欺诈?

现在电话诈骗的案例越来越多,就连我们在打车的时候也能听到系统语音提示“如果您收到陌生人的来电向您索要身份证,银行卡等个人信息时请及时报警”,可见现在的电话诈骗不仅频频发发生,诈骗手段也是层出不穷。

而我们可以利用知识工程的原理建立社会关系图谱,通过图谱,可以计算筛选出许多异常点,例如:一些没有共同关系网络(亲属,朋友等)的人共用一个手机号码,这在我们实际生活中可以说也是异常行为;又或者通过用户经常使用的IP地址进行异常发掘,发现一个用户突然产生了之前没有使用过的IP地址,而这个地址也经常有别的用户会突然使用,这就产生了多用户的异常行为,这些都对反欺诈信息的初筛提供了有效帮助。现如今,电信数据、金融数据越来越多,知识图谱的初筛可以有效地提高监控效率,节约成本。



反欺诈常见的知识图谱有以下几项:

  手机号码维度

也是最常用的一个纬度,个人的手机号几乎是时时刻刻跟随着我们,在我们联系他人,注册APP等活动时都需要用到手机号码,所以手机号成了与个人一对一的象征,成为了一项重要的特征参数

  IP维度

IP维度可以通过集合、设备等信息,可以有效识别用户的风险。用户访问系统,所有的网络请求都会带有信息,因此天然的成为访问者的身份标识。虽然地址极容易通过技术手段进行篡改,但是由于移动用户的特殊性,识别成为用户身份反欺诈的主要依据。

  地理信息维度

地理位置信息是指通过定位或者基站定位的技术来获取手机或终端用户的位置信息(经纬度坐标),在电子地图上标出被定位对象的位置。通过结合设备等信息,可以有效识别用户的风险。


采取人工智能机器学习调优境外模型、新建智能风控网联模型、设计立体化预警规则网络,引入知识图谱技术等多项重点举措,欺诈交易止付精准率提升数倍。

“欺诈交易的监控识别犹如‘大浪淘沙’,系统基于过往已发生的欺诈交易样本不断学习、分析其特点,然后在当前的全量交易中去识别符合样本特征的可疑交易”,当前欺诈盗用的类型、手法、技术在不断“推陈出新”,风控系统既要小心“漏网之鱼”,又不能频繁打扰客户,影响客户正常交易,而人工智能有强大的自学习能力,能够实现7×24小时智能巡检,无感守护持卡人用卡安全,动态平衡欺诈盗用风险防控与客户用卡体验。


知识图谱+机器学习助攻反洗钱


除了反欺诈之外,在反洗钱领域,我们同样有利用知识图谱+机器学习的方式发现问题的解决方案。

反洗钱风险监测已经历了纯人工判断、规则策略引擎、量化指标引擎(Scoring)这几种方式,并进一步往机器学习模型(智能)引擎方向发展。以制裁合规风险监测手段的发展为例,包括七个阶段。




目前传统金融行业大多处于第4阶段往第5阶段过渡的进程中,其中部分技术较先进、更具前瞻性的金融公司已经跨入第5阶段,而具金融科技优势的互联网金融公司普遍已经处于第5阶段,并开启了对第6阶段的探索。在反洗钱、反欺诈,如客户洗钱风险评级、交易监控等工作场景中,所使用的风险评估和监测方法也大致遵循与制裁合规风险监测手段一样的发展进程,只是各不同领域的场景多样性和模型复杂程度不同,所使用的基础数据和机器算法有差异,例如在交易监控方面,非监督学习算法更有利于发现新型犯罪活动特征。


在机器学习技术应用于金融风控以前,金融机构重视传统的风险管理及监管合规习惯,设计和选择风险监测手段时将方法原理的可解释性作为一个重要关注方面,这期间的监管考核也以规则的原理解释与证明、个案审查为主要手段。

随着金融业务模式的发展,基于规则策略的传统风险监测方法在准确性和处理效率方面遇到困难,越来越不适应线上业务发展和海量交易数据处理要求,如反洗钱系统有效性提升速度不及业务规模增长速度,则须使用更多的人工处理来弥补系统能力缺失,给金融机构造成持续增长的人力成本压力和越来越大的操作风险敞口。机器学习模型引擎的出现是为适应互联网在线业务特点及满足海量交易监测需求,以准确性和高效率为目标;基于人的判断行为训练监测模型,风险识别过程不易受外部因素干扰,理论上可实现比人工更加精准的判断。



例如我们可以通过用户基本信息、金流转关系、股权关系、亲属关系等数据建立知识图谱,为银行构建一套涵盖种种特征的庞大语义网络,然后通过有监督的学习和无监督的学习解决复杂关系连接下的异常模式识别。有监督的学习:比如将历史上洗钱案例的关键实体及关系连接降维到计算机可处理的数量级,构建训练数据集,通过图神经网络算法构建模式识别模型,借助高性能计算技术,全面扫描图数据库,发现蛛丝马迹。无监督学习,通过对图谱中的关系和属性赋值,利用聚类算法发现异常离群或聚集的实体集合,发现超出过去经验范围以外的新的异常模式,从而及早采取干预措施。

未来的人工智能模型,将越来越多地构建于知识图谱之上,随着图谱技术和算法技术的不断演进,越来越多的组合模型和解决方案会被不断创造出来。

其实,利用人工智能的技术解决风控问题的方式有很多,以上介绍的只是冰山一角,而在其他领域,我们也有不同的解决方案,后续我们一一讨论。


分享到:
联系方式

企业微信:瑞泊 联系邮箱:HR@xraybot.com 联系电话:010-88973588 联系地址:北京市海淀区中关村南4街4号
               
扫码关注公众号