隐私保护计算:探索联合计算的新方向

发布时间:2021-02-23 作者:金融电子化

文 / 中国建设银行金融科技部  陈德锋 王秋卉

建信金融科技有限责任公司基础技术中心  王雪 赵亮

近年来,为强化个人隐私信息保护,防止敏感数据被滥用,国家出台了一系列法律、法规,规范数据的管理和使用。2020年10月21日,全国人大常委会法工委发布了《中华人民共和国个人信息保护法(草案)》征求意见稿,就个人信息保护有关的立法问题向社会公开征求意见,得到了业内人士广泛响应。对于金融行业,中国人民银行发布的《个人金融信息保护技术规范》等一系列文件,对金融业机构个人金融信息保护工作进行了规范。

党的十九届四中全会将数据增列为重要的生产要素,与传统的土地、劳动力、资本、技术等要素并列,作为完善国家现代化治理体系的重要基础。数据的流通能够放大劳动力、资本等生产要素的价值。然而,数据要素具备虚拟化和易泄露的特点,数据流通面临着极为严格的安全保护形势,各个行业对用户隐私和数据安全的关注度显著提高。此外,数据作为金融机构的核心资产受到严格保护,由此产生了金融行业的“数据孤岛”问题。

融合了密码学、数据科学、分布式计算等技术的隐私保护计算(Privacy-Protected Computation)技术,可以在保护各参与方数据隐私的前提下,完成多方参与的联合计算任务,促进多方数据可信协同,打破数据孤岛,提升数据价值。



隐私保护计算技术概述

隐私保护计算是当前热门的技术方向,其能够在保护各方数据安全和隐私的前提下,不泄露原始数据,即可完成多方联合计算任务,解决了互不信任的参与方之间协同计算的问题,其技术特性及应用前景受到了大型金融机构、科技公司、互联网巨头、政府部门等各行业广泛关注。隐私保护计算的常用技术路线包括秘密分享、混淆电路、不经意传输和同态加密等。基于隐私保护计算技术,能够支持多方数据共享、联合查询、联合运算、联合建模、联合预测等隐私计算模式。

为满足金融领域监管要求,并实现技术在业务中的生产可用,隐私保护计算技术的设计综合考虑三方面要求:参与方的数据安全得到保护、计算精度达到要求、效率满足实际生产需要。其中,金融机构对于数据安全性的要求的重要性远高于其他两者。

应用模式分类

利用隐私保护计算技术,可支持多种范式的多方联合计算(见图1所示),主要包含:联合查询、联合运算和联合建模。

图1 支持多种计算范式

1.联合查询

使用非对称密码、秘密分享、差分隐私等技术手段,实现能够支持隐私数据联合查询的应用功能,查询过程中能够保护数据方的源数据(除查询结果外)隐私,同时保护查询条件不对外泄漏,支持多检索语句和多结果返回,并且能够保证查询结果真实有效。联合隐私查询可用于黑名单匹配、多方数据融合等场景。

2.联合运算

使用多方安全计算技术,包含秘密分享、混淆电路、不经意传输、同态加密等技术路线,实现多方共同完成特定的计算任务,包含四则运算、统计运算、比较运算、矩阵运算和复杂运算等,保护各方的数据输入隐私,同时确保各方的计算结果一致性。在支持亿级大数据量的基础上,有效平衡精度和误差指标,满足金融级的应用要求。多方联合运算可用于跨机构用户信用评分、跨机构统计计算等业务场景。

3.联合建模

隐私保护计算技术采用联邦学习作为多方联合建模的底层技术路线,包括三种模式:各参与方在共有样本的特征维度进行信息扩充的纵向联邦学习;各参与方在相同特征空间中通过样本维度扩充提升模型性能的横向联邦学习;应用于各参与方特征维度、样本维度重叠均很小的联邦迁移学习。金融机构的基于联邦学习的应用以纵向联邦建模为主,实现跨机构的特征维度数据融合。


建设银行的实践探索

1.技术中台落地及存证审计功能

为积极推进隐私保护计算技术在集团的落地,建设银行金融科技部牵头进行基于隐私保护计算技术的中台立项及开发,该项目将作为2021年系统建设的重点项目推进。平台将支持建行环境、外部合作方私有化等部署模式,可支持建行环境内部跨区域、跨云环境联合外部参与方等多种形式的联合建模任务,为金融业务提供全新模式。

如前所述,隐私保护计算技术目前仍存在理论原理及工程开发不完善的问题。其中,无法从根源上杜绝参与方作恶(如数据投毒等)问题,是金融机构无法实际应用落地的首要阻碍。针对该问题,建信金融科技设计并开发出了应用于隐私保护计算技术的存证审计功能,通过结合区块链技术,对关键信息进行存证,实现对多方参与的建模全流程可追溯审计功能。目前,建信金科在该方向的探索为行业领先。

2.实际业务落地探索

2020年下半年,由建设银行上海大数据智慧中心牵头,建信金科公司提供技术支持,联合子公司建信基金进行了集团一体化建模探索,成功部署了建设银行首套联邦学习环境,在生产中验证了隐私保护计算技术的可用性。

在本项目中,双方在生产环境中利用真实业务数据进行了纵向联邦建模,通过“速盈客群价值提升场景”,实现跨双方模型训练,定位目标客群,助力客户价值提升,在实际的营销中针对目标客群的响应率相对提升34%。本项目中,建信金科在网络通信、数据传输等方面针对开源框架进行了定制化开发,使其满足建行IT架构环境及安全规范。该项目获得中国信息通信研究院和中国信息标准化协会大数据技术标准推进委员会评定的“星河优秀案例”奖项。

3.参与央行金标委多方安全计算标准制定

近日,中国人民银行正式发布《多方安全计算金融应用技术规范》(JR/T0196—2020)金融行业标准,确定了多方安全计算技术在金融领域应用落地的基础要求、安全要求、性能要求等规范,适用于金融机构开展相关产品设计、软件开发、技术应用等,该规范将推动多方安全计算在金融领域的深入应用。

在该标准历经一年半的制定过程中,建设银行金融科技部、建信金科基础技术中心作为主要起草方,深度参与了该标准的撰写及制定,并针对系统架构、性能指标等具体条例多次提出修改建议,确保符合金融行业的业务场景和技术规范。建设银行目前基于隐私保护计算技术所搭建的技术中台,符合该金融行标准规范。

4.加入FATE社区TSC、牵头成立金融分支

2020年10月,建信金科代表建设银行集团,作为第一家国有大行金融科技公司加入全球最成熟工业级联邦学习框架FATE的技术委员会,参与技术发展决策及版本更新维护。此外,建信金科正在联合中国银联、微众银行、光大科技,牵头创建FATE金融行业分支,打造满足金融行业监管规范的联邦学习系统,期望通过应用落地示范促进国家金融行业发展、联合联盟成员推进联邦学习相关标注的制定。

5.牵头北京市金融科技产业联盟一类课题

为深入开展金融科技应用研究,2020年8月,北京市金融科技产业联盟研究专委会设立37项课题,其中由建信金科司牵头、光大科技公司参与的“基于隐私保护计算技术的金融领域数据融合应用研究”成为四项一类重点课题之一,由专委会进行专项跟踪管理,促进隐私保护计算技术研究成果的落地转化。


行业未来展望


数据的孤岛分布,以及对数据隐私监管力度的加强,正在逐渐成为人工智能的下一个挑战,隐私保护计算技术为金融机构,乃至其他行业打破数据屏障,提供了新的思路,实现了以保护数据安全为前提的多方互利共赢。

期待在不远的将来,隐私保护计算技术能够帮助打破各机构、各领域、各行业的数据壁垒,在安全合规的前提下形成一个数据与知识共享的共同体,将人工智能带来的红利落实到社会的各个角落。


返回上一级

400-622-8990