当前位置: 首页 > 科技观察

2021年Top 10隐私增强技术(PET)

时间:2023-03-12 22:08:45 科技观察

2021年10大隐私增强技术(PET)黑客、企业和政府的违规行为。随着企业与第三方公司共享消费者数据以获取洞察力、改进服务或通过数据资产获利,这种情况正在加剧。隐私增强技术(PET)使企业能够利用不断增长的数据量,同时确保个人或敏感信息的私密性。例如,人工智能公司和人工智能顾问经常会遇到这个问题,因为他们需要使用客户数据来构建机器学习模型。这时,他们需要一种安全的方式来访问客户数据,而隐私增强技术可以使这成为可能。WhatisPrivacyEnhancementTechnology(PET)隐私增强技术是一个总称,包括在收集、存储、执行搜索或分析隐私信息过程中保护和增强隐私安全的数据安全技术,旨在提取数据价值,以便充分发挥其商业、科学和社会价值,但同时不会危及该信息的隐私和安全。为什么隐私增强技术(PET)现在很重要?与任何其他数据隐私解决方案一样,隐私增强技术对企业很重要,原因有以下三个:GDPR和CCPA等数据保护法迫使组织保护消费者数据。因为一旦发生数据泄露,企业可能需要支付高额罚款。根据欧华派珀《2020年GDPR数据泄露调查》报告,处罚措施已经落实。从2018年5月到2020年1月,GDPR罚款金额已超过1.26亿美元。由于您的企业在分析和应用程序测试方面缺乏自给自足,因此数据可能需要由第三方组织进行测试。隐私增强技术可以在数据共享的同时实现隐私保护。隐私泄露可能会损害您的商业声誉,并且企业或客户(取决于您的商业模式)可能会终止与您的合作。一个例子是Facebook股价在剑桥分析公司丑闻后下跌。常见隐私增强技术示例密码算法1.同态加密同态加密是一种加密方法,被广泛认为是加密的“圣杯”,它允许对加密的密文执行计算。它产生一个加密的结果,当解密时,该结果与操作的结果相匹配,就好像它们是在未加密的数据(即明文)上执行的一样。这使得加密数据能够被传输、分析并返回给数据所有者,数据所有者可以解密信息并查看原始数据的结果。因此,公司可以出于分析目的与第三方共享敏感数据。同态加密并不是什么新技术,学术界已经研究了30多年。尽管同态加密在历史上一直是一种计算密集型技术,但最近的突破现在使其能够广泛用于各种商业应用。一些常见的同态加密类型包括:全同态加密:同时支持乘法和加法,并且对执行的运算次数没有限制。采用全同态加密可以实现解密方只能知道最终的结果,而无法获得每一个密文的信息和同态计算方法,从而提高隐私信息的安全性;部分同态加密:可以对加密数据执行一类运算,比如只提供乘法或加法,不能同时提供;有点同态加密:可以进行多种类型的运算(如加法、乘法),但只能进行有限的运算;2.安全多方计算(SMPC)这是同态加密的一个子领域,但有一个区别:它允许多方共同操作数据,同时保持各自输入信息的私密性和安全性。因此,机器学习模型可以应用于加密数据,因为SMPC可以处理更大规模的数据。3.差分隐私差分隐私防止有关个人的任何数据被共享。在差异隐私中,随机生成的“噪声”被添加到基础数据中以进行混淆,并且对更改后的数据执行的任何计算仅在统计/方向上是正确的(即不准确)。因此,差分隐私比其他隐私增强技术具有更窄的应用领域,因为不能保证准确的结果并且可能的计算是有限的。4.零知识证明(ZKP)ZKP使用一组密码算法,允许在不泄露证明数据的情况下验证信息。可用于身份验证等场景,例如在不提交准确生日信息的情况下验证用户是否满足指定年龄。数据屏蔽技术一些增强隐私的技术也是数据屏蔽技术,企业使用这些技术来保护其数据集中的敏感信息。5.混淆这是数据屏蔽的通用术语,包括通过向日志或配置文件中添加分散注意力或误导性的数据来??替换敏感信息的多种方法。6.假名化“假名化”一词在GDPR中被提及15次,是指将数据记录中的标识字段替换为一个或多个人工标识符或假名的过程。GDPR建议应用假名化技术建立个人数据,以降低数据主体的风险,协助控制者和处理者履行数据保护义务。7、小数据对应大数据。小数据是指人工智能或机器学习系统采用数据增强、迁移学习、合成数据集等技术,很少或根本不使用真实数据。随着小数据技术的兴起,或许未来的人工智能模型将不再需要海量的训练数据,同时也会大大降低隐私风险。8、通信匿名技术作为一种主要的隐私增强技术,通信匿名技术被广泛应用于互联网的各个方面。现有的通信匿名技术主要是通过多次存储和转发(使用Mix网络和洋葱路由技术)来改变消息的外观(消息延迟、乱序、消息填充等),并利用Mix的刷新机制网络消除消息之间的对应关系,从而为在线用户提供隐私保护。典型的低延迟通信匿名系统包括Tor、I2P等。这些匿名通信系统不仅保护了互联网用户的身份信息,也保护了服务提供商的身份信息。它们允许用户在保证服务器IP不泄露的前提下提供网络服务。借助人工智能和机器学习算法技术9.合成数据生成合成数据本身就是人工智能对数据进行提取和汇总的产物。这些算法将学习真实数据的结构和相关性,并生成无限量的相同质量的人工数据。这样生成的数据可以符合原始数据的特性,仍然具有一定的价值,但不存在隐私问题。而且,在此过程中,可以对人工智能进行编程以提供社会期望的公平结果,从而从源头上纠正偏见以减少任何潜在的违反公平的行为。合成结果将是完全匿名和去偏见的公平合成数据。10、“联邦学习”(FederatedLearning)“联邦学习”是指在满足隐私保护和数据安全的前提下,设计一种机器学习框架,使各个机构可以在不交换数据的情况下进行合作,从而改进机器学习。影响。其核心是解决“数据孤岛”和数据隐私保护问题。通过建立数据“联邦”,各方都将从中受益,并推动整个技术的不断进步。具体实施策略是:建立虚拟共享模型。这种虚拟模型类似于通过聚合数据构建的最优模型,但是在构建虚拟模型时,数据本身并没有移动,因此不会泄露隐私,满足数据合规性要求,并且构建的模型只在各自的area服务于本地目标。在这样的联邦机制下,所有参与者都具有相同的身份和地位,实现“共同富裕”。隐私增强技术的主要用例测试数据管理:应用程序测试和数据分析有时需要由第三方提供商处理。即使是在内部处理,公司也应该尽量减少对客户数据的内部访问。对于组织而言,使用不会显着影响测试结果的适当隐私增强技术至关重要。金融交易:由于公民可以自由地与其他方进行私人交易,金融机构有责任保护其客户的隐私。医疗保健服务:医疗保健行业收集并共享(在需要时)患者的电子健康记录(EHR)。例如,临床数据可用于搜索各种药物组合的副作用。在这种情况下,医疗保健公司可以通过使用隐私增强技术来确保患者数据的隐私。促进包括中介在内的多方之间的数据传输:隐私增强技术的使用对于充当双方中介的企业至关重要,因为这些企业有责任保护双方信息的隐私。综上所述,用户对隐私的渴望将是科技行业,尤其??是网络安全行业的下一个“金矿”。无论是受政府法规还是消费者需求的指导,企业都必须准备好在一个优先考虑数据和隐私安全的世界中运营。此外,随着隐私增强技术在商业领域的日益普及和广泛应??用,越来越多的企业将其视为数字化转型的必备技术。然而,企业首先需要确定哪些业务是以隐私为中心的,然后选择投资最合适的隐私增强技术。本文翻译自:https://research.aimultiple.com/privacy-enhancing-technologies/