2023-01-04 00:18:54
爆火又神秘的“隐私计算”到底是什么?
隐私计算是指在保证数据提供方不泄露原始数据的前提下,保障数据在流通与融合过程中的“可用不可见”。这一技术近年来备受瞩目,不仅因为其融合了密码学、人工智能、计算芯片、统计学、区块链等多个领域的先进技术,更在于其广阔的应用前景和巨大的商业价值。
一、隐私计算的历史渊源
关于保密的需求,最早可以回溯到大概公元前1500年的美索不达米亚。那时候人们主要依靠笔和纸,或简单的机械辅助工具进行加密。我国古代也有密码学的应用,例如中国古代兵书《六韬》中的阴符和阴书,被应用于军事领域,帮助君主在保密的情况下与在外作战的将领进行通信。这时期的保密方式非常传统,也被称之为古典密码学阶段。
此后,密码学经历了近代密码学和现代密码学的发展。现代密码学阶段被认为是从19世纪40年代现代信息学之父香农的《密码学数学理论》开启。1976年,Diffie和Hellman提出的公钥密码思想是现代密码学的里程碑,加速了现代密码学的发展。1982年,姚期智院士提出的百万富翁问题,开创了多方安全计算这一密码学新分支。
近年来,随着人工智能技术的崛起,核心软硬件、人工智能芯片、智能基础算法的发展,密码学、人工智能、计算芯片、统计学、区块链交叉融合,产生了“隐私计算”。
二、隐私计算的定义与作用
隐私计算的主要目的是在保密下传递信息,是多种技术的统称。它可以让多个数据拥有者,在不暴露数据本身的前提下,实现数据的共享、互通、计算、建模,最终产生超出自身数据的价值,同时保证数据不泄露给其他参与方。
例如,在首饰加工中,传统的原材料(数据)挖掘采用直接共享原始数据模式,类似于从各矿源购进原材料加工首饰。材料在运输和加工过程中没有充分保护,就可能存在数据滥用和转卖等风险。而在隐私保护模式中,数据的使用方(工厂)和各原料方(矿石厂)只交换加工好的部件及参数,并在原料方完成生产后上锁运输,在加工过程中也提供安全保护,且只有授权用户才可以使用。这样就破除了隐私保护、数据共享和数据流动的“不可能三角”,实现了数据“可用不可见”。
三、隐私计算的底层技术
隐私计算不是单一的技术,而是一个技术体系,包含联邦学习、可信执行环境、多方安全计算、差分隐私、同态加密、区块链等技术。其中,联邦学习、可信执行环境和多方安全计算被认为是主要三大技术路径。
可信执行环境(TEE):是通过软硬件结合的高度安全的技术解决方案,在CPU内构建一个基于指令级别的安全区域。它好比隐藏宝藏的山洞,山洞就像一个CPU,在山洞内还会设置隐藏的密码箱存储宝物。通过隔离的执行环境,提供一个相比所有移动设备通用的环境(REE)侧操作系统有更强安全性的执行空间,比安全芯片功能更丰富,提供代码和数据的机密性和完整性保护。隔离、算力共享、开放性是可信执行环境的三个关键特征。
多方安全计算(MPC):指多个互不信任的参与者在保护个人隐私的同时,共同执行一个计算逻辑并获得计算结果。它源于著名的“百万富翁”设想,即两个百万富翁想比较谁更富有,但又不想暴露自己的具体资产。于是,他们各自将财产数加密后输出给计算方,计算方将比较结果反馈给二人。在实际运算中,取代中间人的是一套更可信的协议和算法,参与方只能得到结果,无法得知对方原始数据。不经意传输是多方安全计算的最基础协议,利用不经意传输可以构造混淆电路、零知识证明协议和Beaver三元组等,也是隐私求交(PSI)和隐私信息查询(PIR)最有效的实现方式。
联邦学习:是保证原始数据不出数据源方安全控制范围下,多方共同协作联合构建AI模型。它类似于章鱼这种无脊椎动物,其大脑只进行部分动作处理,而其他动作则由分布在各条触角上的“迷你大脑”独立处理。这些“触角”的高度独立性,让终端数据在计算的全过程始终存储在本地,避免了数据泄露的风险。在联邦学习中,各个数据源也拥有独立计算单元,从而确保了原始数据始终存储在本地。
四、隐私计算的应用价值
隐私计算之所以火爆,很大原因也在于其广阔的应用前景。随着数据成为生产要素,个人隐私保护意识的增强,以及数字化网络化进程的加快,隐私计算成为一项基础技术设施。只要有数据协作的场合,都可以并应该应用隐私计算。
目前,隐私计算已与越来越多的场景结合。例如,在金融领域,它助力银行、保险机构进行联合分析建模、数字营销、智慧风控、智能反欺诈等;在政务领域,它助力政务数据融合并对外共享,安防隐私匹配,服务智慧三农;在医疗领域,它助力卫生监管部门、医疗机构、药企等加强数据协作,应用于医疗科研、药物研发、卫生防疫等。
医疗领域被认为是隐私计算应用最复杂的领域。与非医疗领域相比,医疗领域数据类型更丰富,参与方更多,对安全性、精准度的要求也会更高。加之医疗数据安全一直是监管重点,对医疗行业数据交换和共享技术要求也更高。因此,隐私计算在医疗领域的应用尤为关键。
例如,某三甲医院需要进行有关强直性脊柱炎的全基因组关联分析以开展更好的疾病防治工作。但基因数据具有高通量、高敏感度的特点,加之医院间数据孤岛的存在,让数据分析传输难度大。此时,隐私保护计算平台可以发挥作用。它满足个人信息本地化存储要求,保证用户的知情、决定、限制、拒绝、删除等权限,从而辅助全基因组关联分析研究顺利完成。
五、隐私计算的未来展望
经过医疗级检验,目前隐私计算技术产品已经被不断认可并逐渐成熟。未来,隐私计算将为更多领域“赋能”,成为数字经济真正不可或缺的基础设施。它将进一步推动数据的流通与融合,促进数字经济的发展,同时保障个人隐私和数据安全。



综上所述,隐私计算作为一种新兴的技术体系,在保障数据安全的前提下实现了数据的流通与融合。随着技术的不断发展和应用场景的不断拓展,隐私计算将成为数字经济时代不可或缺的基础设施。