作者:
四川省农村信用社联合社信息科技中心
夏浩淳 邓宏 宋疆 何怡桦 太思梦
来源:中国信用卡
近年来,为了进一步规范信贷业务,促进贷款业务健康发展,监管机构针对当前消费贷款市场存在的问题多次发文,严禁消费类贷款资金违规流入股市、房市及其他投资性领域,要求商业银行加强对信贷资金用途的监控,以保证其申贷用途与实际用途一致。2020年7月,银保监会发布《商业银行互联网贷款管理暂行办法》,规定商业银行应当与借款人约定明确、合法的贷款用途,并且应当采取适当方式对贷款用途进行监测,发现借款人违反法律法规未按照约定用途使用贷款资金的,应当按照合同约定提前收回贷款,并追究借款人相应责任。
目前,商业银行针对信贷资金用途的监控手段较为有限,信贷资金违规行为仍具有普遍性,主要原因有以下几方面。
一是违规行为具有隐蔽性、欺骗性。目前银行贷款往往采取自主支付方式发放,部分客户在贷前包装、伪造信息,在贷后组织多次、多人转账,即便是受托支付,其对手方也可帮助客户规避银行资金监测,导致难以形成资金流向跟踪监测闭环。二是商业银行识别信贷资金流向的方式单一且效率低下。一方面是通过受托支付和约定资金用途的方式来约束借款人的贷款资金流向,另一方面是人工核查贷款借据、合同和档案资料等,实地调查借款人的借款用途和担保情况,工期长,耗时费力。三是商业银行贷款业务发展迅猛,业务数据急剧膨胀,传统IT技术构建了多层的泛关联关系,并以此为基础实现深度链接关系的信息洞察,但仍存在着固有的技术缺陷,难以有效挖掘多维复杂关系并进行可视化展示。
相较于传统IT技术,知识图谱是目前构建大规模关系和基于图进行知识发现的最有效工具之一,以知识关联为基础的知识图谱能够多角度、多层次刻画事物关联的事实与规律。本文将以商业银行贷款资金流向监测作为切入点,利用信贷资金流向的数据信息,构建商业银行贷款资金流向知识图谱,进行可疑资金流向挖掘,并通过探索辖内借款人的实际信贷资金流向,进一步加强对商业银行贷款用途的监控和识别,为商业银行贷款贷后风险识别提供一种新的监测方法。
一、商业银行信贷资金流向知识图谱的构建
作为一种大规模的语义网络,知识图谱由顶点(Vertex)和边(Edge)组成。每个顶点表示现实世界中存在的“实体”,每条边表示实体与实体之间的“关系”,其层次一般分为模式层和数据层。本文构建的贷款资金流向知识图谱模式层是知识图谱的核心,用于构建知识图谱整体框架,数据层则是结合现实数据对模式层进行实例化。构建贷款资金流向关系图谱,有助于商业银行快速分析贷款资金流向是否与贷款用途匹配,并筛选出可疑贷款信息。信贷资金流向知识图谱构建框架如图1所示。
1.模式层构建
本体表示法被广泛应用于模式层的构建,是一种可以将本体表示为形式化、概念化的规范。根据贷款资金流向网络特征,本文将网络中的本体划分为客户本体和账户本体。客户本体是贷款资金流向知识图谱的重要组成部分,是研究的主要关注点,但客户间关联主要通过账户之间的资金流向体现,通过资金交易的方式连接多个客户,因此有必要构建一个独立于客户的账户本体。
为简化资金流向分析,本文删除了年龄、性别、职业、学历等与研究内容无关的属性。简化后的客户本体属性包含客户名称、客户类型、当前活跃贷款起贷日期、当前活跃贷款止贷日期等;账户本体属性则包含账号、是否受托支付、所属行业等;本体间主要关系包括亲属、账户归属、担保、信贷资金流出、还款账户、受托支付、资金流出等7类,其关联关系类型及定义见表1。
贷款客户类型一般分为对公客户和个人客户,本文所构建的商业银行信贷资金流向本体如图2所示。对公客户业务量较小,但单笔业务金额较大;个人客户业务量较大,但单笔业务因用途不同金额有较大区别,通常情况下均小于对公客户。
2.数据层构建
构建数据层的目的是将数据融合到知识图谱构建过程中,通常包含以下四个步骤,知识抽取、知识融合、知识加工与知识更新,该层通过对模式层实例化,实现了基于知识图谱的应用。
(1)知识抽取
知识抽取是指把蕴含于各种数据源的知识(数据)抽取出来,并将数据加载到知识图谱中的过程。一般而言,商业银行信贷资金流向知识图谱的数据可根据数据来源分为三种类型:结构化数据、半结构化数据、非结构化数据。结构化数据是基于传统关系型数据库获取的数据,包括MySQL、Oracle、DB2等,在银行信息系统中,核心系统、CRM系统、ECIF系统等的数据一般为结构化数据;半结构化数据更具动态性和灵活性,诸如银行调用外部服务器返回的数据(XML、HTML、JSON等);非结构化数据具有不规则或不完整的数据结构,不方便用数据库来表现,这类数据包括图像、音频、视频、银行的企业财务报表等。
抽取后的信息以三元组的形式(客户/账户,关系,客户/账户)(客户/账户,属性,属性值)保存在数据组中,形成商业银行信贷资金流向关系网络中的知识关联。
(2)知识融合
知识融合指将不同来源的知识进行对齐、合并,形成全局统一的知识标识和关联。本文主要通过数据标准化、实体链接等方法实现知识与知识库的融合。
(3)知识加工
通过知识抽取和知识融合,得到的是碎片化的事实,然而这些事实本身并不等于知识,要想将这些碎片化的事实转化为网络化、结构化的专业知识并构建成专业知识体系,就要经历知识加工的过程。知识加工包括三个子过程:构建本体、知识推理和评估质量。本文主要对前两项子过程做简要介绍。
构建本体的目的是对前两阶段提取的实体及其属性关系进行提取总结,阐明相关的概念及逻辑关系。方法可分为两种:自顶向下和自底向上。自顶向下是从宏观角度预先定义本体概念和逻辑关系,该方法有利于整体观察,但可能会造成内容遗漏和缺失;自底向上是从微观角度考察个体情况,该方法能够广泛覆盖数据且考虑更全面,缺点是实施起来过于繁琐,目前大部分知识图谱都采用该方法。本文采用自底向上和自顶向下相结合的本体构建方法,在模型层自顶向下,从宏观角度定义相关本体概念和层次结构;在数据层自底向上,从微观角度构建顶层本体模型,并从历史存量数据中提取实体,选择符合宏观定义的实体加入到知识库中,最终完成顶层本体模式的构建。
知识推理是通过对现有知识间关联情况的分析,构建实体间的新联系。在商业银行信贷资金流向知识图谱中,交易关系是客户间最普遍的联系方式。因此知识推理可以对账户间的转账关系和客户、账户的关联关系进行分析,进而推断客户间存在的隐式关系,识别商业银行信贷资金风险。具体的推理规则见表2。
(4)知识更新
知识更新是指对知识图谱进行更新的过程。知识图谱可分为静态和动态两种类型,静态知识图谱是指仅依赖现存数据构建的图谱,动态知识图谱是根据知识更新的动态数据构建的图谱。很明显,静态知识图谱只能反映出时点数据上的商业银行信贷资金流向网络情况,相较于动态知识图谱具有一定的局限性和时滞性。为了让信贷资金流向监测具有时效性和前瞻性,本文结合外部信息变化数据,运用知识抽取、融合、加工等方面的知识更新和数据中台“流批一体化”技术,实现商业银行贷款客户资金交易情况的动态化呈现,从而构建动态商业银行信贷资金流向知识图谱。动态商业银行信贷资金流向知识图谱可实时反映银行资金流向状况,并对未来信贷交易对象等进行预测,进而指导和支持相关研究。
3.知识图谱可视化
本文依据部分商业银行历时一年观察期的行内信贷资金流水数据构建了商业银行信贷资金流向知识图谱。该知识图谱包含2200万个节点、5017万条边,通过该知识图谱可以较为明晰地了解该商业银行信贷资金流向,并对资金闲置、申贷用途与贷款实际用途不符、受托支付对手公司成立时间短、借款人和还款人不一致、受托支付对手方打款给借款人、信贷资金转出给亲属、担保人借名贷款等七种贷款挪用和借名贷款情况进行重点筛查,找出可疑账户、客户及其关系。
二、商业银行信贷资金流向知识图谱的应用
一是监控资金闲置。通过银行放款日期和客户首次动账日期之间的时间差评估客户的实际资金需求程度,对贷款金额较大且资金闲置时间较长的贷款持续监控,进一步确定其是否存在贷款用于虚增存款规模的风险。
二是呈现信贷资金用途转移。如通过知识图谱重点筛查经营类、消费类贷款在放贷之后是否违规流入房市和股市的流水数据,进而计算转出资金的金额及比例,以确定风险程度,为排查提供充分的依据。又如,可加强对资金流动的信贷记录检测,尤其是受托支付对手方将信贷资金转回借款人的行为,表明贷款可能被挪作他用。
三是实现借名贷款监测。重点筛查担保客户借名贷款、受托支付借名贷款、借款人与还款人不一致等三类常见情况。担保客户借名贷款排查主要是针对具有担保关系的借款人和担保方之间是否存在信贷资金全额转入担保方账户的行为。受托支付借名贷款主要排查受托支付的对手方公司是否成立时间过短,如成立时间过短,则意味着该对手方账户有可能是没有实体经营的空头公司,借款人有可能提供虚假受托支付,目的是将信贷资金转到其关联账户,完成贷款挪用。在实际业务中由于信用、资质等问题,借款人可能会以亲友名义贷款,导致借款人与还款人不一致的情况发生。
依据上述建模的思路及方法,四川省农信构建了商业银行信贷资金知识图谱,并在实际应用中取得了良好的效果,对于监管上的重点和难点问题实现精准打击,相较于人工排查方法,节省了人工投入,使风险识别效率进一步提高,风险防范能力进一步加强。
三、总结与展望
本文通过构建商业银行信贷资金流向知识图谱,进行可疑资金流向挖掘,通过设置可疑关系的条件范围,筛选挖掘出了客户之间的可疑关系和借名贷款可疑账户等,证明了资金流向关系图谱可以识别借名贷款、贷款用途改变等行为,这种量化监测和呈现关系的方法具有可行性,可供同业借鉴和应用。
因条件所限,本文所使用的数据以商业银行辖内客户资金流出数据和担保数据为主,若客户资金转入他行,则无法进一步监测资金流向。未来,商业银行可通过拓宽信息来源渠道,依托监管部门信息共享、多方安全计算等方式融合交易数据,从更广阔的维度进行研究,助力相关部门进一步管控信贷资金流向,打击信贷资金非法流入股市、房市等;进一步迭代、丰富金融违规行为监测规则与模型,并将其广泛应用于实践,高效赋能业务,切实保障信贷资金流向实体、信贷资金用于消费等真实用途。随着数字技术的不断发展,金融行业将融合计算智能、感知智能、认知智能等新科技,实现全场景、全领域深化细分和人机结合深度挖掘,不断加深对新应用的探索,利用供应链网络等方法有效化解金融风险,智胜金融未来。
本文刊于《中国信用卡》2021年第12期
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。
原文地址"商业银行信贷资金流向之知识图谱探索":http://www.guoyinggangguan.com/dkzs/170.html。
微信扫描二维码关注官方微信
▲长按图片识别二维码