中国电子银行网讯 7月9日,由中国金融认证中心(CFCA)、中国电子银行联合宣传年主办的“聚合新生态 · 共享新安全——2021数字化转型生态大会”隆重召开。包括主管部门领导、银行与相关企业高管在内的近500位行业专家齐聚厦门,共商数字化转型中的安全、合作、开放、创新等重要议题。备受瞩目的“CFCA开放生态战略”同期重磅发布。
蓝象智联首席架构师 王超
蓝象智联首席架构师王超出席本次论坛,并在金融科技创新“人气挑战赛”环节,分享“基于隐私计算的实时数据共享平台”。
近年来,数据安全话题备受关注,如何解决数据在不被泄露的情况下能够完成安全共享也是银行业一直是思考的话题,基于隐私计算的实时数据共享平台的的秘密分享和不经意传输两大亮点在有效保护数据安全的同时,实现数据的共享和利用,为银行数字化转型带来质的提升。
以下为王超的案例分享文字实录:
王超:大家下午好!我是来自蓝象智联首席架构师王超。今天非常高兴能够有这个机会和大家做一个简短的交流,我今天分享的题目是基于隐私计算的实时数据共享平台。
我先简单介绍一下隐私计算的背景,可能这个概念大家还比较陌生。隐私计算是在解决数据在不被泄露的情况下,能够实现数据安全共享的一套解决方案,所以它在数据流通和分享的领域以及成为了非常基础、非常硬核的技术。
从国家政策上来看,一是国家政策在积极推动数据要素的市场化,希望将数据作为生产要素加入到市场分配之中,激活数据市场的流通。二是人行近期也发文,希望通过使用隐私计算发挥金融行业的数据潜能。
从另外一个方面来讲,在数据流通过程中,一定会面临一个问题,就是个人隐私保护问题,国家也出台了相应的法律,这中间包括个《人信息安全保护法》和《数据安全法》,这两部法律都是在强调安全和发展中如何去平衡。技术上我们就要提出一项技术,隐私计算技术是让“数据可用不见”的技术,正好是能够去化解这个矛盾。现在看来,隐私计算技术已经成为当下非常重要的发展趋势。
我简单介绍一下隐私计算技术是如何实现数据安全流通的,要做到数据的安全,首先我们保证数据不出库,在各个数据方内部,部署隐私计算的节点,在数据方之间,通过密码学的技术,建立起一个数据安全流通的桥梁。隐私计算技术包括了多方安全计算,它的特点是保证敏感数据不出库而且可计算,在这个基础上我们建立了联邦学习,它的特点是数据不动,计算动,通过这样的方式,能够在多方之间构建联合的模型。最后可以结合区块链技术,区块链技术可以记录整个隐私计算过程,使其是一个可证明的安全过程。
隐私计算包含很多密码学的技术,那它是如何实现多方在互补信任的情况下,安全的协同完成计算的呢?我这边简单会介绍两个多方安全计算协议,第一个是秘密分享,第二个是不经意传输。
秘密分享实际上是一种将我们要传输的信息进行碎片化,将碎片信息分享出去,碎片信息是没有办法还原出原始信息的,但是可以用于计算。我举一个例子,假如说我们今天要统计在场各位所有人的平均工资,这个话题一说就比较敏感,因为涉及到每个人的个人隐私,如果在不触犯这个隐私的情况下,改如何去做呢? 我们可以这样做,我们每个人将自己的工资写成两个数字,这两个数字可以是正数也可以是负数,但这两个数字的和正好是我们工资就好了,将这两个数字写在不同的纸条上分别给不同的人进行统计,负责统计的人,将所有收集到的数字汇总起来,就可以得到我们工资的总和,除以在场人数就可以计算出平均工资,这个是非常简单而且巧妙的解决办法,很轻松的就解决了我们隐私保护的问题。
另外一个就是不经意传输,是通过密钥选取的方式,能够保护在数据查询过程中,被查询方不知道被查询的具体内容,而且数据也没出库,最终完成协同的计算。
比如今天要去某家银行申请一笔贷款,银行想明确我是否存在短时多投的风险,那如何做呢,首先银行拿到我的信息可以经过秘密分享的方式,到其他的成员行查询。所有成员行并不知道查了谁的信息,最终查询方会只会得出一个查询结果,就是我是否存在短时多头的风险,整个过程不泄露个人隐私任何成员行没有数据出库,他们也不知道查了谁的信息,这就是双盲策略。
因为时间有限,其他的多方安全计算协议我就不展开介绍。
不经意传输可以用于短时多头的风险防控,在去年7月份银联和新网银行牵头共同组建了实时风控的联盟平台,蓝象智联提供了这个平台的隐私计算技术。这个联盟平台实现了实时多头信息的共享,还可以实现额度的共享和实时贷款余额的共享,这些事情放在以前都是没有办法完成的,有了隐私计算的技术,得以实现。现在已经有很多家机构在上面运行了,包括现在每天都有很多客户在上面运行。
各个成员行为了保护自身的商业和业务上的信息,实际上在之前是不太敢开放数据的,但是如果有了隐私计算之后,这些顾虑就被打消了,因为没有泄露任何商业上的信息,所以这个联盟会形成一个自激励的联盟,每个成员行也在联盟上获取价值的时候,也在为联盟贡献自己的价值,会形成一个联防,自激励的联盟网络。
我们构建这个平台的时候,提炼了一套架构理念,叫做“数据流和管控流分离”,数据流是指各个成员行之间可以自行完成计算,隐私计算技术因为会面临大量的计算和大量的网络IO,用分布式的数据流,首先可以让整个网络变得更加的稳定,少一个节点不工作了,也可以接续运行,不影响整个网络的稳定性。二是可以变得更加的安全,因为数据没有汇集,也不会有汇集数据的问题。三是可以有效的缓解中心节点的数据计算和网络IO的压力。另外管控流的中心化也有很多好处,我们将一些风控和运营的策略、成员行管理纳入管控流,可以通过区块链做一些存证,中心化的管控肯定比分布式的网络管控要更加方便。
目前,这个平台已经是国内最大的基于隐私计算实现的商业化落地场景。蓝象之前就有丰富的金融行业背景,所以我们在解决这个场景的时候也意识到这个平台在金融行业中的重要性,因此提出几个关键平台能力:高安全、高性能、高可用、高精度和易用性。
高安全,因为蓝象本身就是做安全的,有安全的基因,我们从密码学开始构建整个安全体系,到算法的安全,数据的安全,应用的安全,网络的安全。
高性能,我们能够将隐私计算控制在200毫秒之内,这完全能够满足一个实际商业场景的应用。
高可用,至少做到“三个9”。
高精度,做到模型不失真,控制在1%以内。
基于隐私计算技术蓝象有两个重要的产品,第一个是一站式的联邦学习建模平台 Cube。另外一个是多方安全计算平台Edge,像我们刚才介绍的短时多头联盟都就是基于多方安全计算技术构建的。
我们构建的这个平台,实际上它只是一个开始,仅仅是在金融行业内部的一个应用。接下来我们会引入大量金融行业之外的数据和合作伙伴,我们现在正在和运营商、政府和一些头部的互联网公司接洽,引入他们更多的数据。
有了基于隐私计算的技术,数据的持有方也会非常愿意把数据的价值释放出来,之前主要是出于安全的考虑,无法释放数据价值。通过引入更多的数据提供方,我们可以更好的服务金融场景,比如服务于反欺诈,精准营销,信用风险评估等场景。今天前面有很多的专家和老师都分享了如何营销的案例,我相信这些营销案例,很多都面临外部数据如何引入的问题,其实这些场景真正要引入的,并不是数据本身,而是要引入数据价值,通过隐私计算,将外部的数据价值引入到金融的运用场景中去,去解决现在金融行业的一些痛点,不管是在风控还是在营销,还是在信用风险评估,我相信,有了外部数据的加持,肯定会对金融行业的创新起到质变的效果。
我今天先讲到这里。谢谢大家!
责任编辑:方杰
免责声明:
中国电子银行网发布的专栏、投稿以及征文相关文章,其文字、图片、视频均来源于作者投稿或转载自相关作品方;如涉及未经许可使用作品的问题,请您优先联系我们(联系邮箱:cebnet@cfca.com.cn,电话:400-880-9888),我们会第一时间核实,谢谢配合。