• 移动端
    访问手机端
    官微
    访问官微

    搜索
    取消
    温馨提示:
    敬爱的用户,您的浏览器版本过低,会导致页面浏览异常,建议您升级浏览器版本或更换其他浏览器打开。

    中诚信征信:AutoML小微企业云税贷解决方案

    来源:中国电子银行网 2019-08-02 18:18:43 中诚信征信 科技企业案例
         来源:中国电子银行网     2019-08-02 18:18:43

    核心提示“2019中国金融科技创新大赛 ”是由中国电子银行联合宣传年、中国电子银行网与战略合作机构未央网、和讯网联合主办,致力于推动金融科技在中国的产品研发及应用,激发金融行业的创新能力。

    2019中国金融科技创新大赛

    参赛单位:中诚信征信有限公司

    案例名称:AutoML小微企业税贷解决方案

    案例简介:

    AutoML 小微企业税贷解决方案,该项目是由中诚信征信与山东省城商行联盟深度合作,为山东省城商行联盟提供了一整套 AutoML(自动机器学习)小微企业云税贷解决方案,通过运用以税务数据为基础的“N维多源风控数据+1个AutoML 建模平台+N层税贷风控模型”的“N+1+N”模式为成员行的云税贷产品提供风控护航,实现将小微企业的纳税信用转化为信贷信用,实现以税定贷、以税管贷、以贷促税、税贷促信的良性循环,有效发挥了数据价值,解决了小微企业融资难问题。

    项目背景:

    互联网金融的高速发展拉动金融创新步伐,国家监管部门陆续出台多项促进人工智能、“银税互动”推动小微企业、民营企业发展的政策,并要求银行业金融机构严控金融风险,我国金融机构都在积极探索通过业务合作模式创新、实现智能业务风险管控的新路径,为小微企业提供高质量的金融服务,解决小微企业融资难问题。

    创新技术/模式应用:

    •  小微企业税贷融资新模式

    通过将税务数据、多维征信数据与机器学习平台、技术相结合,构建多层级云税贷模型,有效落实“银税互动”政策。

    •  多源异构数据汇聚、关联技术

    多源征信数据抽取、转换和加载,建立数据处理规则和元数据管理规则,实现多源数据汇聚的一体化配置。对多源数据建立粒矩阵,通过基于粒矩阵的逻辑简约运算获得动态征信大数据的约简属性集,实现数据的多维关联分析。

    •  AutoML智能建模

    基于数据元变量提取->特征工程->选择算法组合->调整参数拟合模型->模型检验和迭代优化->模型部署的工作流程,形成建模流程的闭环自动迭代,解决复杂关系数据的建模分析难的问题,通过专利算法 PU_learning 提升了最终对于正样本的搜索正确率,改进了内部阈值及基分类器,并按照符合业务实际的策略进行模型融合与风险校准,实现更准确的风险评估。

    解决行业哪些痛点:

    (城商行联盟)一是积累了来自下辖41家成员行、政府部门(如税务局)及第三方征信公司的大量数据,迫切需要将数据加以有效利用,发挥数据价值;

    二是亟需解决如何在做好小微信贷风控的前提下,更好地利用多维数据、专家经验、先进技术来实现小微信贷业务的线上化、自动化和智能化,创新产品形态切实解决小微企业融资难问题;

    三是如何与外部公司合作,发挥各自优势,实现降本增效。

    执行过程及风险控制:

    “N+1+N”解决方案主要包含三部分:

    (一)N维风控数据接入与处理

    表1- 数据接入维度与输出模型图

    以小微企业税务数据为核心,引入与金融强相关的联盟成员行数据、人行税务等政府部门数据、第三方征信公司的企业和个人数据等共50余个数据字段。既拓展数据维度,又紧密结合申请人的企业运营情况,充分挖掘数据并解读业务价值,在企业主、企业、行业间建立关联,通过区分存量客户和新申请客户,更加全面、精准的量化风险。

    (二)1个AutoML建模平台部署

    图2- 万象智慧AutoML建模平台功能图

    中诚信征信通过自主研发的万象智慧AutoML自动机器学习建模平台,支持CcxSocreCard、CcxRF、CcxXgboost、CcxGBM、CcxGBDT、CcxAdaboost、DNN、PU_learning(中诚信征信专利算法)等8种算法集成模型,充分挖掘案例中多源异构数据的关联,基于“数据元变量提取->特征工程->选择算法组合->调整参数拟合模型->模型检验和迭代优化->模型部署”的工作流程, 形成建模流程的闭环自动迭代。采用的专利算法解决了金融领域只存在正样本的业务问题,使得输出的模型更加适用于联盟业务需求的实际现状。

    (三)N层税贷风控模型及流程构建

    图3-  小微企业云税贷风控流程图

    中诚信征信结合山东省城商行联盟成员行的业务发展方向、现有客群与数据的匹配情况,针对不同客群采用AutoML自动机器学习建模平台构建多层级模型。模型分为若干个层级进行彼此关联,并按照符合业务实际的策略进行模型融合与风险校准,最终输出申请人信用综合评分,作为授信额度测算的依据。大幅提升其税贷产品的数据处理及数据分析能力,实现更加精准的评估风险。

    中诚信征信与山东省城商行联盟联合的AutoML小微企业云税贷解决方案的创新既包括模式创新又包括技术创新,主要如下:

    (一)城商行服务小微企业融资新模式

    通过将税务数据、多维征信数据与机器学习平台、技术相结合,构建多层级云税贷模型,为山东省内41家城商行小微企业网贷业务提供风控支撑,有效落实“银税互动”政策,有效促进当地小微企业、民营企业发展,助推社会信用体系建设。

    (二)多源异构数据汇聚、关联、存储技术

    1. 多源异构数据汇聚技术:通过ETL、数据稽核、数据存储及数据治理,进行分布式实时数据同步框架及处理,以及多源征信数据抽取,转换和加载,建立数据处理规则和元数据管理规则,实现多源数据汇聚的一体化配置。

    2. 多源异构数据关联技术:通过网格搜索、随机搜索和贝叶斯优化3种参数寻优方法,以及连续型变量分箱和离散型变量分箱2种变量分箱方法,对多源数据建立粒矩阵,通过基于粒矩阵的逻辑简约运算获得动态征信大数据的约简属性集,实现数据的多维关联分析。

    3. 多源异构数据存储技术:通过面向离线数仓和实时数仓的数据安全存储框架,列式NoSQL存储模式以及反向索引/时间序列索引技术,实现支撑复杂征信计算的高性能,低延迟数据存储。

    (三)AutoML自动机器学习建模技术

    基于数据元变量提取->特征工程->选择算法组合->调整参数拟合模型->模型检验和迭代优化->模型部署的工作流程,形成建模流程的闭环自动迭代,解决复杂关系数据的建模分析难的问题,进而有效识别网贷过程中的风险行为,同时有效缩短建模周期,降低成本。

    (四)符号回归自动特征工程技术

    采用平台的特征组合和算法衍生两种特征提取方法,通过基于遗传算法原理的符号回归方法实现自动特征提取,并基于GBDT算法利用新得到的叶子结点作为新的特征。

    (五)PU_learning机器学习算法技术

    通过专利算法PU_learning提升了最终对于正样本的搜索正确率,改进了内部阈值及基分类器,解决了金融领域只存在正样本的业务问题。PU_learning更具有泛化能力,输出的模型更加适用于金融领域的实际生产。

    (六)机器学习多层级模型构建方法

    采用若干个子层级进行彼此关联,并按照符合业务实际的策略进行模型融合与风险校准,最终输出申请人信用综合评分,作为授信额度测算的依据,实现更准确的风险评估。

    应用效果:

    本案例结合山东省城商行联盟的运营现状,响应联盟面向所有成员行金融机构打造“网络互通、信息共享、安全稳定、便捷高效”税贷系统的需求,充分利用多维度数据对小微金融网贷业务实现精准的风险识别及贷前风险控制。达到很好的应用效果和价值:

    一是通过万象智慧AutoML自动机器学习建模平台服务联盟及成员行近万人,有效地提高了建模的准确率和效率,相比传统人工建模周期缩短一半以上,极大地节省人了力成本。

    二是应用机器学习风控模型的云税贷产品上线后,服务41家成员银行,服务覆盖山东、陕西、浙江、江苏、山西、河北、河南、天津等八省市的近万家小微企业,发放贷款金额过亿元,且违约率不超过2%,小微金融风控能力显著提高。

    三是利用机器学习技术盘活价值,实现新旧动能转换,通过金融科技赋能城商行智能风控,案例的“N+1+N”模式可在全国130多家城商行推广、复用或借鉴。

    责任编辑:王超

    免责声明:

    中国电子银行网发布的专栏、投稿以及征文相关文章,其文字、图片、视频均来源于作者投稿或转载自相关作品方;如涉及未经许可使用作品的问题,请您优先联系我们(联系邮箱:cebnet@cfca.com.cn,电话:400-880-9888),我们会第一时间核实,谢谢配合。

    为你推荐

    收藏成功

    确定