图计算及其认知技术在金融行业的应用-金融电子化臧苗苗
王雪:IBM 金融业认知与解决方案事业部资深解决方案专家
精耕银行业10余年,专注于为国内外众多的银行提供大数据分析、认知计算等方面的分析与决策优化服务。她对银行业有着深刻的认知和洞察叶常棣,对于利用数据进行客户分析、风险管控和运营优化等方面有着深入的研究和实践经验。
去年3月AlphaGo人机围棋大战点燃了人工智能技术的热潮,人们不断探索深度学习和机器学习在各个领域的应用。在这个过程中,图计算及其机器推理和认知技术作为AI技术发展的关键技术之一,对于帮助人们了解事物间关联关系至关重要。本文从图计算技术介绍入手,重点阐述图计算和图认知技术与金融行业的业务应用相结合的必要性和优势以及典型的业务应用场景,目的是发挥银行内外部海量数据的价值,增强银行的业务能力。
图计算以及基于图的认知技术
几十年来,人们都是利用关系型数据库进行数据存储和数据处理的,但是面对如今的大数据时代,数据之间的复杂度大幅度增加,数据之间高度关联,数据具有极强的动态性,对这种大体量、关联复杂的数据的洞察需求也日益迫切,数据之间的关联洞察成为探查数据价值的重要方面和未来赢得竞争的优势。天天向上唐家三少图计算技术就是应对这样纷繁复杂时间的有效技术:图由节点(即实体)和边(即实体之间的关系)组成,目前在物联网、通信、互联网、金融以及社交网络等领域已经积累了庞大的图数据,并且还在不断增长。传统的基于关系型数据库来处理关联关系的技术手段和计算模式都无法满足这样的需求:关联查询效率低下,代价高昂。我们需要的是在一个问题域中的关系的完整刻画,并且具备丰富的、高效的和敏捷的数据分析能力。因此,基于节点和边的方式存储和计算的图数据库玄静和,能够建构任意复杂的网络和模型,完整形象地映射我们的问题域。
图数据库由于采用原生图存储,因此在处理关联数据方面具有很强的性能优势,可以从“分钟级”达到“毫秒级”三线炎。另外由于图数据的结构是完全动态的,因此数据的添加和删除,即数据的变更将变得异常灵活和简单。第三,图数据是schema-free(免模式)的张皓轩,可以依赖图来断言和检验之前的数据建模和业务规则。下图是某企业的一个关联网络图示意:
围绕图数据库技术,研究者又开发出了相关的高效的图分析算法,用来帮助应用者能够方便、有效地利用图数据库。典型的图分析算法类别包括网络拓扑分析类、图匹配和搜索分析类、路径和流向分析类等等。比如,图的连通性分析,社区分析,广度/深度分析、三角计数算法等等,这些算法的实现目的和重点在于高性能和通用性。而有一些算法是需要根据具体的业务需求来设计优化的,比如特定的业务网络探查分析。
2016年IBM公司的全球技术展望(GTO)中提出,信息科技的发展已经从帮助人类完整自动化的工作向智能化迈进,而未来智能化认知计算发展的三大方向之一就是图计算以及基于图的认知技术,包括图分析、图特征挖掘、图认知推理、以及与机器学习技术的结合。利用图的强大的关联分析的能力和客观世界还原的优势,未来图计算技术将重点在分布式部署、大图分析、实时可视化等领域,而与行业应用的结合则是发挥图计算能力的最优选择。
图计算技术与金融行业的结合
在金融实体模型中刘靖康,存在着许许多多不同类型的关系,以及数十亿的结点和边。有些是相对静态的依媛奈绪,如企业之间的股权关系、个人客户之间的亲属关系,有些则是不断地在动态变化,袁洁仪如转账关系、贸易关系等等。这些静态或者动态的关系背后,隐藏着很多以前我们不知道的未知。之前,我们在对某个金融业务场景进行数据分析和挖掘过程中,通常都是从个体(如企业、个人、账户等)本身的角度出发,去分析个体与个体之间的差异和不同秘踪拳,很少从个体之间的关联关系的角度去分析,因此会忽略很多在原本的客观存在,也就无法更为准确地达到该业务场景的数据分析和挖掘目标。而图计算和基于图的认知分析正是在这方面弥补了传统分析技术的不足引田天功,帮助我们从金融的本质角度来看这个问题,从实体和实体之间的经济行为关系出发来分析问题。
主要应用场景
在金融行业中,图计算以及认知技术重点应用的业务领域包括:金融风险的管控、客户的营销拓展,内部的审计监管、以及投资理财等方面。例如,银行面临的洗钱犯罪风险,目前很多情况下,银行对洗钱伎俩和手段的调查和分析还依赖调查员的手工方式来做,不仅效率低下卷毛头,工作量大,而且极易造成漏查的问题。目前洗钱的手段和步骤错综复杂,整个过程大致可分为以下三个方面,并且交互交叉重叠,反复出现。
1. 存放(Placement):将犯罪得益放进金融体系内叶山丽子。
2.掩藏(Layering):将犯罪得益转换成另一种形式,例如从现金换成支票、贵重金属、股票、保险储蓄、物业等。
3.整合(Integration):经过不同的掩饰后,将清洗后的财产如合法财产,融入经济体系。
面对这样的复杂困难问题,目前金融机构采取的手段都是基于预先设定的规则来分析每笔交易的背后是否存在洗钱可能,将这些高可能性的交易区分为交易组许可欣,交由调查员来进行审核调查,但是最后的结果通常都发现,利用这种预先定义的规则来识别出来的警告信息,误报率很高,有的达到80%以上梦见打井,给调查员带来很大的无必要的工作量。所以,如何提高高风险交易识别的准确率是在反洗钱领域急需解决的问题。而利用图计算和图认知技术平成四大歌姬,从交易本身出发,探查交易方的交易历史,跟踪交易的轨迹,追溯资金的流向,找出规则方法无法覆盖的新的洗钱模式,及时地更新现有的探查规则丑女殇,从而大幅度降低误报率。
再比如,国内商业银行都面临的信贷风险问题:受国内经济下行的影响,企业客户贷款的不良率攀升。为了提高银行对企业不良风险传导的预测能力,利用图计算和图认知技术,完整刻画企业客户之间、企业与自然人之间的社会关系、经济往来关系杨毫,构建全方位的风险关联网络,实现风险要素的动态性和完整性呈现。当关联网络内某家企业发生信贷风险时,利用风险关联网络中风险客户的客户画像,经济行为轨迹等信息进行交叉关联分析,预测风险的传导路径和扩散范围,帮助银行采取有效措施,阻断风险传染源,进行风险隔离,从而提升风险管理的可靠性和准确率。
未来的世界是数据驱动的世界,而数据潜力的发掘在过去仅仅是发生在表层。图数据库和基于图的认知技术可以帮助人们了解数据之间的关联、洞察数据背后的含义、进而充分发挥数据的价值陈天佳。无论是应用在社交、互联网还是金融行业张耐山,图数据都可以帮助我们解决复杂的商业问题,构建企业在未来大数据和人工智能时代的核心竞争力。
《金融电子化》新媒体部
主任 / 邝源 编辑 / 潘婧