人们需要采取多种策略来平衡个人隐私与功能,并保护他们在云端的应用程序和数据免受攻击。个人隐私是每个人都关心的问题。然而,信息传递是一项充满权衡取舍的工作。例如,每个人都会反感在淋浴间安装摄像头以自动重新订购肥皂的计划和想法。早期,每个人都认为发送电子邮件、在线订购和使用智能手机应用程序很神奇,他们不太关心自己信息的隐私。隐私增强技术使人们能够控制要支持的私人信息量,但会限制他们的控制以保留功能。他们将加密与巧妙的算法相结合,以构建能够正确回答某些问题的数据库,但仅限于合适的人。多年来,该领域发展迅速,现在有许多方法和策略可以很好地保护个人隐私。因为它们只存储足够的信息供企业交付产品,同时避免黑客或内部人员获得访问权限时可能存在的一些危险。这些方法有其局限性。它们只能防御普通攻击,如果网络攻击者装备更好或攻击更有针对性,它们可能会面临崩溃。一般来说,保护量与加密计算所需的计算能力成正比。基本保护可能不会给系统增加明显的额外负载,但即使对于云计算提供商而言,也可能无法提供全面的安全保护。但这些限制不应该阻止人们增加基本保护。没有绝对安全的完美方法,但添加一些简单的解决方案可以保护人们免受云计算服务可能带来的一些网络攻击。以下是平衡个人隐私与功能的9种方法和策略:1.使用功能云计算提供商了解客户关注安全性,因此他们逐渐添加更容易锁定数据的功能。例如,亚马逊提供了两打以上有助于提高安全性的产品。AWSFirewallManager有助于确保只允许正确的数据包通过防火墙。AWSMacie扫描人们的数据,寻找过于开放的敏感数据。GoogleCloud和MicrosoftAzure都有自己的安全工具集。理解所有这些产品需要一个团队,但这是开始保护您的云计算工作的最佳起点。2.专注于加密当人们只对他们的计算机设备进行加密时,保护密码、加密密钥和身份验证参数已经很困难了。对于云计算应用程序来说要复杂得多,尤其是当它们由团队管理时。云计算供应商设计了各种不同的工具来提供帮助。人们仍然需要小心源代码控制,但这些工具将帮助他们对其进行加密,以便将它们安全地添加到云计算应用程序中。Hashicorp的Vault、Doppler的Enclave、AWS的密钥管理系统和Okta的API管理工具等工具可以简化流程。使用这些工具仍然需要谨慎,但总比将密码写在笔记本上然后锁在办公室里要好。3.考虑专用硬件用户,最好不要与他人共用服务器硬件。也很难相信网络攻击者会使用一种欺骗性的方法来共享正确的机器,然后使用一种不同的极端方法,如Rowhammer,但一些数据可能值得努力工作。云计算提供商仅为此类场合提供专门的硬件。如果用户的计算负载相当稳定,使用本地设施的服务器甚至可能更具成本效益。一些使用云提供商的混合工具,而另一些则希望使用他们自己的本地服务器。无论如何,完全控制服务器比共享服务器的成本更高,但它也可以防止许多网络攻击。4.哈希算法最简单的解决方案之一是使用单向函数来隐藏个人信息。这些数学函数旨在易于计算,但实际上不可能逆转。如果用f(name)替换某人的名字,浏览数据库的人将只能看到单向函数中随机加密的信息。普通浏览器可能无法理解这些数据,但它仍然很有用。例如,如果您想搜索Bob的记录,您可以计算f(Bob)并在您的查询中使用这个加密值。这种方法对于可能会在数据库中找到感兴趣的行并试图破译f(name)的值的随意浏览器来说是安全的。它不会阻止网络攻击者进行有针对性的浏览,因为他们知道他们正在寻找Bob。更复杂的方法可以增加更多的保护层。最常见的单向函数可能是安全哈希算法(SHA),它是美国国家标准技术研究院批准的一组函数。这个有几个不同的版本,在早期版本中发现了一些弱点,所以一定要使用较新的版本。5.纯加密良好的加密内置于操作系统和文件系统的许多层中。激活它们是针对网络攻击者和可能获得对人们设备的物理访问权限的人添加一些基本安全性的好方法。如果人们将数据存储在他们的笔记本电脑上,对其进行加密可以避免一些丢失数据的担忧。但是,常规的加密函数并不是单向的,还有一种方法可以解密数据。选择常规加密通常是不可避免的,因为人们计划使用这些数据,但它为网络攻击者提供了另一条途径。如果可以应用正确的密钥来解密数据,则可以找到并部署该密钥的副本。6.虚假数据尽管有人抱怨“假新闻”正在破坏世界秩序,但虚假数据也有可能提供保护。一些开发人员没有将真实数据集暴露给需要将它们用于AI培训或程序之类的合作伙伴或内部人员,而是创建了具有许多相同统计属性的虚假数据版本。例如,RTI公司创建了一个虚假的美国人口普查数据库,其中包含1.1亿美国家庭中的3亿多人。但没有真实的个人信息,而这3亿美国人或多或少都在美国的同一地区,他们的个人信息与真实信息非常接近。预测传染病传播途径的研究人员无需访问真实的个人数据即可做到这一点。一家名为Hazy的人工智能公司正在提供一种基于Python的工具,该工具在安全的数据中心运行,并生成人们可以更自由地共享的数据合成版本。7.差分隐私术语差分隐私描述了一种通用方法,该方法仅向数据添加足够的噪声以保留数据集中的私有信息,同时仍保留足够有用的信息。例如,随机增加或减少每个人的年龄会隐藏这些人的确切出生年份,但平均年龄不会受到影响。这种方法对于研究人群的大型统计工作更有用。个别条目可能会被噪音破坏,但整体结果仍然准确。微软已经开始共享WhiteNoise,这是一种用Rust和Python构建的开源工具,用于为用户的SQL查询添加经过微调的噪声。8.同态加密大多数加密算法对数据进行如此彻底的加密,以至于没有正确密钥的任何人都无法理解结果。同态方法使用更复杂的框架,因此可以在没有密钥的情况下对加密数据执行许多基本算术运算。人们可以在不知道底层信息本身的情况下进行加法或乘法。最简单的方案是可能的,但有局限性。《半透明数据库》本书的第14章介绍了简单的会计工具,例如,支持加法但不支持乘法。更完整的解决方案可以计算更多的任意函数,但前提是要采取昂贵的加密措施。IBM现在正在共享一个开源工具包,用于在iOS和macOS应用程序中嵌入同态加密,并承诺很快推出适用于Linux和Android的版本。这些工具是基本的,但它们提供了探索与训练机器学习模型一样复杂的计算的能力,而无需访问未加密的数据。9.什么都不保留程序员可以像包装工一样,他们保留数据以备日后调试时有用。最简单的解决方案之一是将算法设计为尽可能无状态和无日志。调试完成后,您需要停止用大量信息填充您的硬盘。只需返回结果并停止。保留尽可能少的信息也存在危险,因为很难检测到滥用或修复错误。但另一方面,也无需担心网络攻击者会利用这些数字垃圾,因为他们无法攻击任何不存在的个人数据。
