当前位置: 首页 > 科技观察

隐私计算:如何保护我们的数据安全?

时间:2023-03-20 00:18:36 科技观察

数据隐私有多重要?以人脸识别为例,人脸识别技术正广泛应用于支付转账、开锁解密、交通案件、实名登记、开户注销、门禁考勤等场景。所有这些都会影响我们的财产、健康、隐私和其他安全。在央视新闻晚间栏目报道中,记者发现,在某网络交易平台,仅需2元即可购买数千张人脸照片,不到10元可购买5000多张人脸照片,单张人脸照片不到1美分。而这些照片来自真实生活中的照片和真人在社交网络上分享的自拍。如果叠加用户的身份信息,很可能被用于精准诈骗、洗钱、涉黑等犯罪活动。我们在网络上留下了多少隐私信息,又留下了多少平台,恐怕多得我们都记不清了。我们对这些数据的最终去向、使用方式以及安全性几乎一无所知。近年来,我国开始着手保护公民个人数据和隐私的相关立法,例如《网络安全法》《民法典》,其中就有对个人信息保护的法律规定。而《数据安全法》《个人信息保护法》也正在向全社会公开征求意见。相关法律的出台更多是事后维权,而个人数据和隐私信息的保护仍需从源头抓起,即各网络平台从技术层面实现对数据的全面保护和监管。同时,数据交易和数据流通成为制约我国大数据产业发展的重要问题。如何通过合法、合规、安全、高效的手段获取可信、优质的数据,成为众多科技公司和平台亟待解决的问题。一方面,用户数据隐私泄露泛滥,另一方面,相关企业平台也难以获得有效合规的数字资源。这种矛盾使得越来越多的企业呼唤新的数据治理和应用解决方案。至此,一种能够在保护数据不泄露的前提下实现数据分析计算的隐私计算(PrivacyComputing)正式提上日程。“百万富翁”困境:私人计算的起源假设两个百万富翁相遇,他们都想知道谁更富有,但又不愿意让对方知道自己真正拥有多少财富。在这种情况下,让对方知道谁更有钱吗?”这就是1982年2000年图灵奖获得者姚期智院士提出的“百万富翁”假说,这个烧脑的问题就涉及这样一个矛盾。如果两个人要比较谁更富有,两人必须公开自己的真实财富数据,但两人又不想让对方知道自己的财富有多少。那么,在我们看来,这几乎是一个无解的悖论。这个看似困难的问题涉及到数据的所有权和使用权。富人拥有的财富就是数据的所有权,富人发布财富数据就是数据的使用权。目前,主要的互联网平台在为您提供服务时,基本都获得了数据的使用权,几乎获得了数据的实际所有权。虽然用户保留了数据名义上的所有权,但大多数人会将数据保留在这些平台上,很少有人会主张平台销毁数据。面对两位“百万富翁”的慎重思考,有没有一种技术可以将数据的所有权和使用权分离,让富人可以向这个技术平台公开财富数据,但经过一系列的数据加密计算,finally只给出相应的结果(谁更富有)。对于需要用户数据的互联网平台或企业来说,他们得到的不再是原始数据的所有权,而是经过先行加密的一组数据,为数据需求方提供服务?理解了这个假设,就可以理解隐私计算的一个大概思路。在隐私计算中,这是一个专业的密码学问题,可以准确地表述为“一群互不信任的各方,在保护隐私信息的前提下,没有可信第三方的协同计算问题”。。在提出这个想法的同时,姚期智院士也提出了自己的解决方案“多方安全计算”(MPC)。MPC在20世纪80年代初期被提出时,只能被视为一种技术理论,迫切需要验证其可行性。随着计算机计算能力的不断提高,隐私数据的应用和重要性不断提高,MPC技术也在逐步完善和应用。现在,除了MPC技术的进步,隐私计算也展现出更多新的技术特性和解决方案。那么,目前隐私计算的技术准备和产业应用有哪些具体进展呢?隐私计算的孕育期:大规模应用的前夜。为什么隐私计算现在变得越来越重要?不仅是我们开头提到的公民个人隐私数据泄露,已经到了亟待治理的阶段。数据已经成为企业平台最重要的核心资产,企业有动力充分保护和合规使用平台数据。我们看到,今年我国首次将数据定性为除土地、劳动力、资本和技术之外的第五大生产要素。不久前,全国人大审议了《个人信息保护法草案》条例:侵犯个人信息权益,情节严重的,没收违法所得,并处5000万元以下5%以下罚款。上年营业额征收。5%的配额甚至超过了号称“最严数据保护”的欧盟GDPR。无论是出于数据合规和法律方面的考虑,还是出于数据应用方面的考虑,企业都在加大数据隐私的保护力度。根据国际研究机构Gartner最新的战略技术趋势预测,隐私计算将成为2021年将被深入探索的九大技术之一。Gartner还预测,到2025年,半数大型企业组织将使用隐私计算来处理不受信任环境中的数据和多方数据分析用例。这些新趋势的出现,对隐私计算提出了新的要求,也将提供广阔的行业应用需求。从技术角度来看,隐私计算目前有两种主流方案,一种是采用密码学和分布式系统的方案,另一种是采用可信硬件接收多方隐私数据输入输出的方案。密码方案目前以MPC为代表,通过秘密分离、无意传输、混淆电路、同态加密等专业技术实现。近年来,它们的通用性和性能有了显着提高,具有实际应用价值。可信硬件技术目前主要是基于可信执行环境(TEE),构建一个硬件安全区域,数据只在这个安全区域进行计算。核心还是将数据信任机制交给Intel、AMD等硬件方。由于其通用性高,开发难度低,在数据保护不严格的场景下可以发挥重要作用。此外,在人工智能大数据应用背景下,“联邦学习”也是隐私计算领域的主要推广应用方式。在以人工智能和大数据应用为代表的新技术周期中,隐私计算对互联网平台和企业提出了更高的数据治理要求,即真正以用户为中心,不依赖企业自身或第三方公司。受控的数据服务器保障安全,让用户真正掌控自己的数据所有权,保障数据安全和隐私需求。产业端,隐私计算应用场景不断拓展。比如在金融行业。国内隐私计算产品目前主要应用于金融行业的风控获客,即多家金融相关机构在不公开客户个人信息的情况下,为客户进行联合画像和产品推荐,可以有效降低此类场景的风险作为多方利益相关者贷款。违约风险。在医疗行业,通过隐私计算技术,医疗机构和保险公司可以在不共享原始数据的情况下分析投保人的健康信息。在政务行业,隐私计算可以为电信公司、互联网公司等政务数据与社会数据的融合提供解决方案。在一些地方政府的相关规划中,隐私计算有望成为下一步应用推广的重点。未来,隐私计算将广泛应用于金融、保险、医疗、物流、汽车等隐私数据敏感的领域。在解决数据隐私保护问题的同时,也有助于缓解行业数据孤岛问题,提供大量AI模型。提供具有高级培训和技术实施的合规解决方案。任重而道远,数据隐私计算的困境与出路现在,随着社会发展进入数据元时代,移动互联网进入下半场,国际风云变幻莫测,数据元问题已经成为更复杂。在隐私计算领域,公民数据安全使用的法律定位、企业内部和企业之间的数据分析与应用、数据的全球跨境交易流动都面临着前所未有的挑战,还存在问题在每个链接中。首先,从隐私计算对公民数据安全使用的法律规定来看,我国法律尚未对隐私计算是否合法作出明确规定。在现行规定中,“未经被收集者同意,网络运营者不得向他人提供个人信息。””,而隐私计算的目标是基于多方数据进行计算,原则上违反了这一要求,但同时适用于“处理后无法识别特定个体且无法恢复”的例外条款。这些都成为制约隐私计算发展的首要法律瓶颈,其次,隐私计算在企业中的应用还存在一定的困难,比如大部分企业的数据标准化和数据质量都难以支撑隐私计算的要求。针对参与者数据一致性的隐私计算。隐私计算本身的复杂性和计算效率对企业大规模商用提出了很高的要求,试错成本高。此外,隐私计算具有一定的“黑为真正受益的用户带来“盒子”效应,人们很难理解和信任隐私计算技术技术,普及和接受成本高。此外,全球数据跨境交易和流动也面临诸多困难。例如,不久前,美国政府对TikTok发起攻击,其中之一指控其收集美国公民的数据,并严格禁止其将数据存储在中国的服务器中。欧洲的爱尔兰也要求Facebook暂停将其欧盟用户的数据传输到美国。2016年,欧盟率先颁布了全球最严格的数据保护计划GDPR,规定不遵守数据隐私法规的后果将受到严厉制裁和巨额罚款。此前,谷歌收到了法国数据保护监管机构开出的5000万欧元的高额罚款。近日,瑞典H&M因非法监控员工隐私被罚款3500万欧元。在更加严格的数据新规和复杂的国际形势下,从事数据跨境活动的企业需要重新考虑其底层架构设计。为避免数据的跨区域切割和处置,避免陷入硬件巨头的垄断,采用新的隐私计算解决方案成为一些涉足跨境业务的企业的重要任务。这些隐私计算应用中的困境亟待各方共同解决。不仅有全球各个地区和国家政府的积极推动,尤其是法律法规对隐私计算的权责界定,还有大数据相关企业的企业数据治理。持续的力量输入。那么对于推动隐私计算发展的相关科技公司来说,现在出现了一系列新的发展趋势。首先是区块链技术的出现,为隐私计算提供了新的解决方案。将隐私计算应用到区块链上,不仅在一定程度上增加了隐私计算结果的不可篡改和可验证性,还增加了数据在区块链上的保密性。成为众多厂商的技术整合方向。例如,一个无需许可的隐私计算服务,使用遍布全球的TEE可信计算节点,保证隐私计算的稳定性和安全性。二是软硬件协同、平台融合,正在极大地提升隐私计算的性能和便利性。通过平台基础设施对隐私计算进行硬件加速和能力布局,实现从存储计算到建模挖掘的全方位能力提升。此外,隐私计算也在向大规模分布式计算方向发展,其实现方式更加多样化。一些项目通过低代码甚至零代码开发,可以大大节省开发效率,降低隐私计算产品开发的门槛。最后我们看到,在数据越来越有价值、数据安全越来越重要的“数字维权时代”,隐私计算将成为用户数据安全保护与企业数据价值之间最重要的守门人。隐私计算公司必须扮演数据管理者和服务提供者的角色,但这个角色不再是简单的为“二富”检查数据的角色,而是可以为他们提供全面的数据保护,并可以进行综合运营的数据“资产”。可以预见,未来隐私计算将在企业与组织间的数据治理、数据协同,以及人工智能、新基建等新兴数字产业的业务应用中发挥举足轻重的作用。