由中国金融认证中心(CFCA)、中国电子银行联合宣传年主办,和讯网联合主办的“论道银行数字化创新转型”2019金融科技高峰论坛于2019年9月5日至6日在成都举行。峰会为期两天,包含闭门研讨、高峰论坛、优秀创新案例展演、知名金融机构走访等丰富内容,近百家银行及金融科技企业一线从业者、学术专家齐聚一堂,共谋银行数字化创新发展之策。
神策数据联合创始人 & CTO曹犟参加了当天的活动并以《银行数据分析平台的驱动闭环》为题做了发言。
神策数据联合创始人 & CTO曹犟
从业务流到数据流
曹犟表示,在早些年,数据并不被关注,因为数据本身只是信息化的副产品。最近一段时间,特别是这两年趋势比较明显,随着移动互联网红利的结束,以及竞争加剧,所有企业都开始专注业务流到数据流转变,或者叫数字化转型。
所谓的企业数据流,是把传统的IT层面里面的各个系统产生的数据用一条完整的数据流来贯通,在这之上提供一系列的基于数据的应用。
那到底什么是数据?曹犟回答说,数据本质上就是一类能够用来消除误区,可以帮助人来做业务方面的决策。这些数据可能是通过快捷方式产生的用户行为,可能是通过各种方式获取到的一些标签、画像等等。
数据驱动的两类应用
有了数据以后,这些数据是如何驱动业务发展的?曹犟将这个驱动过程归结成一个由四个步骤形成的闭环:采集、清洗、存储、数据分析。
即,数据最开始是需要通过多个渠道来源进行去采集,采集好数据需要去对它做清洗,然后是选择合适的存储介质,再选择完整的数据模型,对数据建模。有了模型之后就可以分析最简单的PI报表,到快速地查询分析,再到数据安全等基于抽样数据的运用。
有了数据分析结果之后,数据分析结论就可以运用到反馈上,反馈是好是坏还需要再采集更多的数据回顾整个决策是否正确,这样就构成了一个数据驱动闭环。
数据驱动闭环理论
数据流构建的技术挑战
数据流在构建过程中也会遇到挑战。
第一个技术挑战是需要贯穿打通同一个用户在不同端的一些数据,即,统一数据接入 API。因为用户行为是通过网页发生交互,也可能通过ATM机,因此用户产生交互的方式其实多种多样,通过想要精准地理解一个用户。
第二个挑战是要实现同一用户多端的数据采集,需要解决IP的问题,最常见的就是不同端的ID如何映射到同一个ID。
第三个挑战则是针对用户侧的数据如何选择好的数据模型。基本的标准模型至少要描述客户、用户是什么样的人,描述用户使用什么样的产品,这是对于采集到的各种各样的不同端数据的基础抽象。
电子银行的四大核心场景
结合电子银行的具体业务,曹犟介绍了大数据业务在电子银行种的四大核心应用场景:市场营销、客户体验、精细化运营、产品智能。
曹犟认为,数据能够发挥价值的第一个大场景是市场营销。而判断渠道质量一个最重要的标准就是在某渠道投了多少钱,带来多少价值。合理建立线上市场投放渠道评估模型,判断不同渠道的质量特征,降低获客成本,提高经纪业务线收入。
第二个场景是数据驱动产品迭代。现在发展阶段,产品迭代主要是指线上产品迭代,更侧重于用户交互。对于数据来说,产品迭代是要围绕这样一个方法论,即,分析数据、找到问题做试验,察看试验结果等。即,通过全方位的数据支持,更完整地了解用户的真实诉求,完成产品的优化。
第三个是精细化运营。根据用户的自然属性和行为特征,区分不同层级的用户群,对不同用户群进行特定的策略话运营,挖掘客户最大潜在价值。
第四个是产品智能。通过数据运营完善并成熟的私有化部署方案,完善的PaaS平台支持二次开发,提供高效的数据接口等。
在谈到AI在银行业的应用时,曹犟指出,风控本身是数据源的问题。只要获取足够好的数据源,风控就好做很多。数据对于风控是很好的补充,设备环境、手机是否有横屏,有没有越狱,电量剩余等等看起来非常简单又可能想不到的风控数据,加入到整个风控模型里面,都会带来意想不到的收获。曹犟表示,从实际经验来讲,这些代价很小的信息,往往也能在风控方面提供至少10%的收益。
以下是曹犟的发言实录:
曹犟:大家下午好!很荣幸能够有这个机会跟大家分享一下在数据驱动的理解。先简单介绍一下神策数据,神策数据是2015年成立的创业型公司。它一开始是服务于互联网客户,这两年在银行业里面做了一些工作,这里面的理解都代表我们从互联网到银行业思想的转变和再认识。
在过去相当长时间里面,我们的工作可能主要是围绕着传统信息化,就是把我们的业务做了一个信息化建设。数据本身是信息化的副产品,我们并没有专注于去用数据来解决什么问题,并没有专注于数据本身,而最近一段时间,特别是这两年趋势比较明显,随着移动互联网红利的结束,以及竞争加剧,所有企业都开始专注业务流到数据流转变,通常叫数字化转型或者类似的说法。
所谓的企业数据流,是把传统的IT层面里面的各个系统产生的数据用一条完整的数据流来贯通,在这之上提供一系列的基于数据的应用。既然已经讲到了数据流,就要回答最开始的问题,到底什么是数据。这些数据可能是我们通过快捷方式产生的用户行为,可能是我们通过各种方式获取到的一些标签、画像等等,但是我觉得从我们角度来看,数据本质上就是一类能够用来消除误区,可以帮助人来做业务方面的决策。
比如运营、产品、商业决策等等各个方面,我们依托于数据来做一些或大或小的判断,它也可能是时间会影响我们整个产品,这其实都是数据驱动的第二个层面。怎么样实现数据驱动,结合我们相当长一段时间,不管是以前创业企业还是创业后服务,这一千多家客户的经验,其实我们觉得数据驱动是可以方法论,我们把数据驱动形成一个四个步骤的闭环,就是说数据最开始是需要去采集的,这个采集可能有非常多的来源,采集好数据我们需要去对它做清洗,选择合适的存储介质,选择完整的数据模型,对数据建模,有了模型之后就可以分析最简单的PI报表,到快速的查询分析,到数据安全,本身是基于抽样数据的运用。
有了数据分析结果之后,数据分析结论就可以运用到反馈上,反馈是好是坏还需要再采集更多的数据回顾我们整个决策是否正确,所以这样就构成了一个数据驱动闭环。
按照数据驱动闭环来讲,其实我们可以简单的以一个数据流建设反馈为以下四个步骤,因为毕竟今天是科技论坛,跟大家分享一下我们在数据流构建里面遇到的技术挑战。
第一个技术挑战,我们需要贯穿打通同一个用户在不同端的一些数据,这个用户行为是通过网页发生交互,也可能通过ATM机,所以我们用户产生交互的方式其实多种多样,通过想要精准的理解一个用户,这是第一个存在的难点。
第二个难点,要实现同一用户多端的数据采集,需要解决IP的问题,最常见的就是不同端的ID如何映射到同一个ID。
下面一个挑战则是对用户侧的数据如何去选择好的数据模型,在这里面用的最多的也是从2008年开始到现在业内广泛在使用的一个标准基本模型,描述客户、用户是什么样的人,描述我们的用户使用什么样的产品,这是对于我们采集到的各种各样的不同端数据的基础抽象。
有了最下面这一层数据模型,我想中间还可以有另外一层抽象,特别是潜在技术进步使得无以聚合的实时分析成为可能,这更代表我们可以提供具有高度抽象、高度灵活的分析模型。所以第二种主要是针对应用场景,我们可以抽象出不同行业都是以什么样的方式来分析数据、查询数据,把常见的分析方式运用到具体的模型。再往上就是我们实际数据使用者,他们根据分析模型来分析查询数据,从而解决自己具体的业务需求,相当于是三层大的框架。当然我们自己也结合这些抽象,包括把数据基础处理能力抽象,在这之上构建各个基础的应用产品,再往上则是我们提供的咨询服务。刚才讲了对行业的理解,我们面临的技术问题。
下面简单分享电子银行数据驱动在哪些场景发挥价值,我们总结出四个场景,分别是市场营销、客户体验、精细化运营、产品智能。
数据能够发挥价值的第一个大场景是市场营销,如何去评估每一个渠道投放,现在能够做渠道投放的非常多,有线上、线下的,不管是什么样渠道,我们判断渠道质量一个最重要的标准就是在这个渠道投了多少钱,给我们带来多少价值。
这个价值不仅仅是EV/PV这样的技术指标,而是渠道带来的用户最终是否完成了转化,转化之后给我们带来的价值是多少。所以在这个基础之上,数据是可以帮助我们详细的刻画每个渠道带来的技术指标以及留存转化,用户生命周期的价值等等,所以这是数据驱动在市场营销场景里面发挥的最典型的。
举一个比较有意思的产品,某一个客户渠道投放的时候,他是选择他的目标用户是这样的人群,所以他选择这样的投放渠道,从我们实际分析来看,整个投放渠道转化其实是非常低的,我们对他已有的用户做了画像,发现他真实用户情况是这个样子,所以去改变了他们的投放渠道,得到了很好的效果。这是数据驱动、市场营销。
第二个场景就是数据驱动产品迭代。现在发展阶段,产品迭代主要是指线上产品迭代,更侧重于用户交互。我们取了城商行的例子,他们提供一个住房贷款申请,首先去用数据详细衡量贷款申请流程里面每一步的具体转化率,其实就是围绕着分析转化率,找到转化率较低的问题,对数据的理解、业务的理解,去改变对这一问题的转化,然后数据实际的来探索它的效果,这里面简单修改了一下,让整个搜索工作得到了很大的提升,所以说对于数据来说,产品迭代是要围绕这样一个方法论,分析数据、找到问题做试验,察看试验结果,很容易理解这些。后面两个例子时间有限跳过去。
除了产品迭代之外,数据在标签体系方面也能发挥很大的价值,特别是到了现在这样一个竞争态势情况下,获取新客户的成本和代价非常高昂的,反过来为什么不好好想运营我们已有的客户,如何使我们已有的客户,他们是什么样的人,喜欢什么样的东西,这个时候数据或者说行为数据也好、交易数据也好,其实都能发挥非常大的价值。
这是我们在某一个实际客户案例提供的完整的标签画像体系的搭建,这里面所有数据都是来源于隐私方的数据,有用户标签画像数据。
我们就可以全生命周期的对客户划分不同的等级,每一个等级都设定特定的,通过具体的运营活动促使用户提高到另一个等级,从而最终对整个产品整个业务价值。在这个阶段里面,我们提供了一个相应的产品,能够自动的去创建我们运营的活动,完成测试相关工作,让我们能够在同一个地方打破数据壁垒,完成最终的完整的全生命周期的运营。如果是在其他行业讲到数据驱动产品,我们肯定会讲如何运用数据去做流,但是到电子银行行业,坦率的说,我们也做了AI方面的探索,但是到目前为止,其实都处于一个比较早期的阶段。所以我们这边的例子是在银行业里面比较关心的。
风控本身是数据源的问题,我们只要获取足够好的数据源,风控就能够七七八八。数据对于风控是很好的补充,我们去采集一些例如设备环境、手机是否有横屏,有没有越狱,电量还剩多少,等等看起来非常简单又可能想不到的风控数据,加入到整个风控模型里面,从实际经验来讲,这样的代价很小的信息,能够提供至少10%风控方面的收益。
责任编辑:王超
免责声明:
中国电子银行网发布的专栏、投稿以及征文相关文章,其文字、图片、视频均来源于作者投稿或转载自相关作品方;如涉及未经许可使用作品的问题,请您优先联系我们(联系邮箱:cebnet@cfca.com.cn,电话:400-880-9888),我们会第一时间核实,谢谢配合。