干货 商业银行数字化转型中的风险数据集市建设

同盾科技金融交付专家 小新
2021-08-25 14:08:35
来源: 时代在线

风险数据集市是商业银行风险管理体系的重要支撑,这绝非一句空话。

将于2021年9月1日正式实施的《数据安全法》,对数据分级分类及重要数据识别等作出了明确的制度安排,对于各领域的数据安全治理、管理、技术、基础支撑等各层次的问题提供法律依据。

对于商业银行来说,提升数据的分级分类管理及运用水平,使数据系统涵盖银行所有的业务场景,为各业务场景风险管理需要提供依据,已成为业内共识。在此背景下,在银行风险管理中构建风险数据集市也成为必然选择。

事实上,我国《商业银行信用风险内部评级体系监管指引》第186条也明确规定,商业银行应在数据仓库基础之上建立风险数据集市,内部评级体系中模型的开发、优化、校准和验证应基于功能完整、强大的风险数据集市。

风险数据集市是银行风控体系的基建之一

那么问题来了。数据仓库、风险数据集市是什么?我们先简单回顾一下历史。

1988年,为解决企业的数据集成问题,IBM的两位研究员提出了一个新术语:数据仓库(Data Warehouse)。根据“数据仓库之父”的比尔·恩门给出的定义,数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理中的决策制定。

商业银行是数据密集型机构,拥有海量的金融基础数据,且必须对数据实施统一管理,形成共建共享的资源池。这如同国家的铁路网、交通网,必须站在全国角度统筹规划,而不能由各省各自建设;假如那样的话,省区边界断头路等问题将造成交通体系非常低效。商业银行的数据仓库建设也是一样,不能由各部门根据业务分工和职责范围,各自建设数据系统,而是需要统一规划管理,满足全辖业务、监管报送等全局性需要。

数据仓库作为商业银行数据统一管理的资源池,从这一概念延伸出来,数据集市则像是从水池中舀出来的一个个“瓶装水”。一池泉水经过过滤、蒸馏、除菌可以成为纯净水;经过提取、有益元素调配就成了矿泉水;经最小限度处理过的泉水则是天然水。

这些对数据仓库的“挖掘”和“搬运”后按照不同的品类和用途进行封装,就是数据集市典型特征。从理论角度讲,数据集市是满足特定的用户或场景的需求,面向某个特定的主题,解决灵活性与性能之间的矛盾,为特定用户存储预先计算好的数据。

那么问题又来了:有了数据仓库,为什么还要建设面向各个主题的数据集市?笔者认为,其原因在于银行系统复杂、数据海量、统计维度众多,因此,如果风险、营销、运营、监管、财务管理等各类应用系统直接从数据仓库调取数据,这样的数据使用方式存在明显弊端:数据仓库中,面向各主题性质的数据被分散存储,例如,风险相关数据散落在各个不同的数据源中,数据使用者需要花费大量精力理清各个系统间的关系,数据质量也参差不齐;同时,各风险应用系统计算的指标重复度较高,也会造成系统运算资源的浪费。

为此,在数据分析与应用及数据仓库之间建设风险数据集市,针对风险数据主题进行统一的数据清洗和整合,提供面向业务的风险数据,并梳理和理解数据之间的逻辑,支撑各业务场景的风控需求,可有效提升商业银行的数据使用效率、风险管理效率。如上图所示,左边部分业务前台直接使用数据仓库,造成像蜘蛛网一样交叉纵横,让人眼花缭乱。右边经过业务领域数据集市建设,则简练、清晰、高效,让人一目了然。

对公风险数据集市建设

商业银行的风险数据集市建立在数据仓库之上,其数据大部分来自数据仓库,以风险计量所涉及的数据为主,为商业银行对公、同业、零售、信用卡业务等各种风险管理场景提供数据支撑。这其中,对公、同业、零售等风控需求既有共性,又有各自不同的特点。本文中,笔者以同盾科技对公业务风险数据集市的建设方案为例阐述。

社会学家查尔斯·培洛在其理论中认为,容易造成系统崩溃的是复杂系统失效,尽管复杂系统必然会有多种安全防控机制;但是,任何防控机制都不是完美的。安全工程里的“奶酪片理论”也有一个观点:每片奶酪片代表一层防控,每层都有一两个漏洞,正常情况下,漏洞位置不同,连光线都不过;但是在很极端的情况下,每层的漏洞都串到一起,一个小失误就有可能穿透层层关卡,酿成大祸。

笔者认为,商业银行的风险防控是一个复杂系统,我们需要在每一层都严防,设置关卡,建立对公风险数据集市,就是为了设立统一的防线,把业务中的风险在第一层就尽早、尽可能的处置掉。

在实践中,同盾对公风险数据集市打破了商业银行风险管理“烟囱式”各自开发的现状,解锁“网状式”的数据链路,通过建设集中式业务领域集市,为打造共享式业务数据中台奠定基础。

同时,也能协助商业银行平衡灵活性与稳健性之间的矛盾,可以在一定程度上缓解数据仓库集中访问的压力。

对公风险数据集市的建设大致分为整合、分层、应用三个流程。第一步首先以大数据平台对内部数据、外部数据、产业数据为基础进行有效整合,然后进行精细化的集市分层,同盾对公风险数据集市主要分为基础层、汇总层和服务层,这样的设置是呼应商业银行的实际应用,为各下游应用提供数据服务,例如:

  1. 对公客户评级数据集市将为对公评级系统提供所需的合同、贷款帐户、财报指标等数据。采集其PD、LGD、EAD计量结果。

  2. 零售信用风险评级数据集市将为对零售评级系统提供计算PD和LGD所需的变量来源数据、基础风险指标加工结果。采集零售客户分池后PD、债项分池后LGD值等信息。

  3. 市场风险:数据集市将为市场风险提供市场及资金交易数据、基础风险指标加工结果。采集一般风险价值(VAR),压力风险价值(SVAR)等信息。

  4. 操作风险数据集市为操作风险提供公司融资、支付与清算、资产管理等八大条线三年总收入信息和部分损失数据;采集操作风险资本占用计量结果。

  5. 流动性风险数据集市为流动性风险提供负债类业务、资金业务数据。采集流动性风险计量结果信息。

  6. 数据管控提供风险数据集市的相关风险数据质量的监控。

同盾数据集市建设方案三个优势

笔者认为,实践证明数据集市的建立,有助于解决商业银行在数据管理与应用方面的挑战,它通过创新的数据管理方法、流程、技术,在满足法律法规要求的前提下,充分应用好数据资源,让数据创造价值,加快商业银行的数字化转型。

凭借技术、方案、人才等方面的综合能力,同盾数据集市建设方案目前已经在多个银行客户中得到应用和部署,为多个客户的风控建设和智能中台建设起到支撑作用。

  1. 深厚的业务积累:同盾在金融、互联网、制造、物流、大健康、零售、智慧城市、政务等领域沉淀了丰富的数字化专业知识,服务企业客户超10000家。

  2. 体系化的方法论:同盾在自有数据体系建设以及与各行各业的合作中,沉淀了体系化的数据集市建设方法论和实践经验;同盾基于对模型、策略及数据分析所需风险数据的梳理,整理各场景相关的数据需求,搭建服务于企业风险管理的主题数据集市。

  3. 经验丰富的团队:同盾汇聚了阿里、IBM、Paypal、银联、FICO、SAS、麦肯锡等顶级科技、金融和咨询公司的成员,规模超千人,60%为硕士以上学历。

笔者认为,随着商业银行数字化转型的加速,面向不同应用场景和产业领域的数据集市建设将进入一个发展高峰。



本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com

扫码分享