美章网 资料文库 浅析初创期信贷产品申请评分建模方法范文

浅析初创期信贷产品申请评分建模方法范文

本站小编为你精心准备了浅析初创期信贷产品申请评分建模方法参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

浅析初创期信贷产品申请评分建模方法

当前,我国经济发展进入了新时代,金融信贷产品不断创新,尤其是在金融科技发展的带动下,各种信贷新渠道和新产品层出不穷,新产品和新渠道投产初期统称为“初创信贷产品”。根据《巴塞尔协议Ⅲ》,建立评分模型需要大量的历史数据。一般来说,样本容量越大,坏客户比重越大,所建立模型的精度或预测能力就越高,模型也越稳健。初创期信贷产品没有数据积累或者仅有少量数据,无法给新用户建立量化监督模型,这是信贷产品初创期风险控制的一大难题。许多金融工作者认为,信贷产品的经营是风险经营,在产品创立初期如何控制风险是亟待解决的重点问题,对于各银行尤其是农商行、城商行以及互联网公司、小额贷款公司等新兴助贷公司而言,大数据风控能力已经成为其开展信贷业务的核心竞争力。

一、研究背景

不同金融机构都有各自的风险容忍度指标,由于地域、客户、政策、产品特性等差异影响,新产品不可能照搬套用其他机构或本机构其他产品的模型,因此难以建立统一标准的贷前申请评分模型。随着金融体系不断完善,征信体系建设也越来越迫切,包括人民银行征信中心在内的各大征信机构都在积极探索社会征信体系建设,这些信用评分在市场上受到金融机构的青睐,有些机构直接使用征信评分作为准入授信的依据。当然,这些评分在数据、模型以及场景上都有其局限性,因此,各大机构仍然积极建设专属量化评分模型。对于信贷产品投产初期申请评分建模的学术研究较少,国内外金融机构也在积极探索寻找解决这一问题的新途径,很多金融企业已经运用统计方法或者其他策略来控制风险,但是并没有公布使用效果和具体操作流程。本文归纳出初创期信贷产品申请信用评分建模的几种方案,讨论其适用场景及优缺点,抛砖引玉,为信贷部门新产品信用风险控制提供解决思路。

二、建模方法介绍

来自多家银行的数据表明,信贷产品上线早期不采取量化模型方法,而仅仅依托经办人员和系统规则很难综合评估客户的信用风险以识别出高风险客户,因此,随着时间窗口的扩大,较早以前准入的客群不良率普遍较高。针对产品初创期基本无数据积累的特点,可以考虑以下几种建模方案。1.类产品模型在一个新的信用产品推广初期,可以找到与之相类似的产品,用类似产品的样本建模是一个不错的选择,当然,这需要金融机构有类似的产品和相应数据积累。这种方法的优点是只需要按照原有思路调整建模,缺点是难以保证相同产品客户结构的一致性,毕竟相同产品、相同渠道产品的几率较低,企业不会重复开发同类产品,当客群结构不一致时,模型会失真,因此,这种方法应慎用。少数银行使用这种方法作为参考,但是并不作为主模型决策使用。2.伪风险模型开放准入条件,允许一部分客户进来,客户数量要达到建立分类模型需要的最低样本量,但是坏样本还没有那么多,这时候可以考虑人工标注好坏样本,选择一些有丰富经验的信审人员挑选出坏客户,利用标记样本建立临时的监督模型。这种方法建立的模型准确率会存在偏向性,只可以作为初期模型,后期需要继续完善。这种模型的缺点是代价较高,要求金融机构能承担一定的风险,而且需要人工标记样本,存在一定的操作风险,因此,很少有金融机构采用此方法建模。3.综合评价法综合评价法是将多个指标通过数学变换转化成一个综合指标,重点在于评估指标体系设计和权重的确定,综合评价法有因子分析、灰色综合评价、TOPSIS评价、DEA、模糊数学等方法。金融机构可以组织专家,也可以借鉴评分卡相关变量确定信用风险综合评价指标体系,然后选择综合评价方法确定各指标的权重,加权计算出每个申请人的风险评分。这种方法的优点是操作简单,权重确定主要从数据角度出发,而非主观确定,缺点是指标体系建设需要专家级的信审人员,而现实中往往缺乏足够的专家级人员。4.相似度模型相似度模型主要采用聚类算法,根据不同特征,将好坏客户分成不同的群体,当然我们要基于一定假设,即选择的模型能区分好坏客户。这种方法比较粗糙,直接将坏客户作为异常样本识别出来。聚类分析按照业务规则进行判别,拟合正常行为的分布,寻找离正常数据分布较远的异常值数据。通过聚类分析可以帮助我们分析用户的特点,查找各群体内的异常用户。聚类分析的基本思想是根据样本的多个属性指标,寻找一个统计量来度量样品之间的相似程度,以该统计量为分群的标准,将相似程度较大的样品聚为一类。关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到划分为合理的群体为止。具体步骤是将样品分类,然后在每个聚类中寻找在某种意义上与该聚类中的大多数样品不同的样品。首先,通过快速聚类将样品进行初步归类,选择规模较大、群体相似度较高的群对应的种子(也就是选择聚类种子时剔出异常点);然后,以这些种子作为初始化的聚类种子对样品再次进行聚类,这样就将距离较远的群体或个体聚到每个大类下,再选出离质心距离较远的个体作为离群点。这一步往往只能依靠研究人员的经验和关键指标在不同类别上的显著性检验来确定。5.第三方通用评分当前,中国信贷市场高速发展,信用服务市场向好,市场化信用服务机构正通过各种方式解决问题,政府及各行业数据共享进程不断加快。从行业上看,第三方评分主要有以下几种:一是政府权威机构的数据,主要是人民银行征信报告和征信1000分,基本融合国内所有银行的信贷数据及政府数据,如公积金、水电煤燃等信息;二是互联网金融公司的数据和评分,如首批获得个人征信牌照的八家征信金融机构等的数据和评分;三是具有运营商背景的如电信旗下的甜橙金融开发的甜橙分以及中国联通的沃信用分;四是市场上数据服务公司的评分,如同盾科技信用分、百融金服信用分等融合多数据源形成的评分。从目前使用覆盖率来看,人行征信分和芝麻信用分覆盖人群多,覆盖面广,是最受金融机构欢迎的第三方信用产品。直接用“通用化评分”对客户进行信用评级操作简单,但是需要一定的成本,由于数据孤岛的存在,不同评分都依托特定场景,行业或场景针对性强。

三、评分模型的迭代更新

就中国目前的情况而言,征信体系不够发达,消费信用产品还比较单一,有关消费信用分析的专家还不多,这些问题都会影响以上方案的有效性。因此,金融机构可以根据具体情况选择使用多种方法综合控制信用风险,例如,可以运用第三方评分和专家评分等构建决策矩阵模型,通过相似度模型识别出异常客户。此外,要基于跨行业联防联控理念,以客户提供信息为基础,利用海量数据和职能模型的关联分析,对申请人的风险倾向作出更多的信息评估,运用于授信和客户定价,为银行提供更精准的信贷决策方案。模型迭代更新伴随着产品的生命周期而进行,产品初创期使用的模型随着产品的成长成熟需要不断迭代。随着好坏客户样本的不断累积,模型不断积累经验,形成自学习、自适应学习、半监督学习和对抗学习,生成对抗神经网络的方法,利用判别模型和生成模型之间形成对抗学习,实现两个神经网络模型的交互信息均衡,可部分解决建模样本不完备和不均衡的问题,提高对申请模型的识别能力。

作者:王方春 宋洁 单位:徽商银行信用卡中心