【.com快译】数据库管理员通常对确保安全和隐私负有重大责任,因此有一些技术可以降低风险并帮助确保合规性。数据库包含大量个人信息,包括一些非常敏感的数据,这给管理和操作数据库的管理者带来了一些问题和挑战,但数据库开发人员可以采用一些先进的工具和技术来保持信息的私密性。人们采用的安全解决方案取决于对数学的巧妙应用。一些最简单的机制是现代版本的密码,本质上是经典解码器的数字版本。其他人采用更复杂的技术扩展,推动数学提供更多的灵活性和责任。其中一些是已经使用多年并最终获得信任的实用算法。这些算法正在成为巩固业务关系和确保准确无欺诈工作流程的基础。这些技术使企业更容易为客户提供个性化服务,同时保护他们的秘密。在不妨碍服务交付的情况下更好地遵守管理数据的法规。以下是可以提高数据库安全性的11种技术和工具:1.加密提高数据库安全性的最简单解决方案是加密。现代加密算法使用密钥来锁定数据,以便只有拥有密钥的人才能读取数据。许多数据库可以使用AES等标准对数据进行加密。这些解决方案可防止因硬件丢失而导致的数据泄露。如果没有正确的加密密钥,数据将保持安全。但如果网络攻击者可以潜入,对称加密保护运行计算机的方式有限。网络攻击者可以找到允许数据库处理合法操作的相同密钥。许多数据库提供了加密“静态”信息的选项。例如,甲骨文公司将其选项称为“透明数据加密”。2.差分隐私这种技术以不同的方式部署数学。它不是将信息锁定在数字保险箱中,而是添加了经过仔细调整的噪音量,以使其难以确定哪条记录对应于特定的人。如果噪声添加正确,它不会扭曲一些统计数据,例如均值。如果你随机增加或减少数据集中的年龄,平均年龄将保持不变,但网络攻击者可能很难按年龄找到某人。他们的解决方案的效用各不相同。最好将数据集发布给想要研究数据的不受信任的合作伙伴,通常是通过计算平均值和集群大小。许多算法在添加噪声方面做得很好,而不会扭曲收集到的统计数据。了解哪些机器学习算法可以很好地处理失真位是一个相对活跃的研究领域。微软和谷歌提供了将这些算法与数据存储和机器学习算法集成的工具。例如,Google的PrivacyOnBeam将噪声添加机制与ApacheBeam管道处理相结合。3.散列函数散列函数,有时称为“消息验证码”或“单向函数”,简单地将大文件转换成较小的数字,使它们几乎不可逆。给定一个特定的结果或代码,找到将生成该特定代码的文件将花费太长时间。这些功能是区块链的重要组成部分,它以跟踪和识别篡改的方式将它们应用于数据的所有更改。它们可以防止加密货币交易中的欺诈,许多企业正在将这些技术应用于其他需要数据一致性的数据库。添加这些功能有助于应对合规性挑战。美国国家标准与技术研究院(NIST)安全哈希算法(SHA)是广泛使用的标准集合。一些较早的版本(例如SHA-0和SHA-1)具有已知的弱点,但较新的版本(例如SHA-2和SHA-3)被认为非常安全。4.数字签名RSA或DSA等数字签名算法是更复杂的计算方法,将散列函数的篡改检测特性与特定个人或机构的身份验证信息相结合。他们依赖于只有责任方知道的秘密密钥。例如,加密货币将财富的所有权与知道正确密钥的人联系起来。跟踪个人责任的数据库可能包括验证特定交易的数字签名。5.SNARKSuccinctNon-InteractiveProofofKnowledge(SNARK)是数字签名的更复杂版本,可以在不泄露信息的情况下证明复杂的个人信息。这个技巧依赖于更复杂的数学,有时被称为“零知识证明”(ZKP)。包含SNARK和其他类似证明的数据库可以保护用户的隐私,同时确保他们遵守隐私法规。例如,一个非常简单的例子可能是数字驾照,它可以证明某人是成年人而不透露出生日期。其他人正在探索将该技术应用于疫苗护照。SNARK和其他非交互式证明是一个活跃的研究领域。各种编程语言的数十种算法实现为新项目提供了良好的基础。6.同态加密处理使用传统加密算法锁定的数据的唯一方法是对其进行解密,这个过程可能会将其暴露给任何有权访问计算机以开展工作的人。同态加密算法旨在对加密信息执行计算而不解密它。最简单的算法允许算术运算,例如将两个加密数字相加。更复杂的算法可以执行任意计算,但通常要慢得多。为特定问题寻找最有效的方法是一个活跃的研究领域。IBM作为该领域研究的先驱之一,发布了一个工具包,用于将其同态加密与iOS和MacOS应用程序集成。7.联合处理一些开发人员将他们的数据集分成更小的部分,并将它们分发到许多独立运行的计算机上。有时这些数据会被打乱,因此无法预测哪台计算机将保存哪条记录。这些解决方案通常建立在旨在通过并行运行搜索或分析算法来加速所谓大数据处理的软件包之上。最初的目的是提高速度,同时提高对网络攻击的弹性可能是一个附加效果。8.全分布式数据库如果将数据集拆分成多个块可以保护隐私,为什么不将其拆分成更多块呢?一种更常见的解决方案是将数据直接存储在创建和使用数据的位置。用户的智能手机通常具有大量额外的计算能力和存储空间。如果不需要集中分析和处理,避免将数据发送到云端服务器会更快、更划算。例如,许多浏览器支持复杂数据结构的本地存储。W3C标准包括用于具有键和值的文档样式模型的本地存储以及用于更多关系模型的索引版本。9.合成数据一些研究人员正在创建完全合成的数据集,这些数据集是通过随机生成新值来构建的,但其方式遵循相同的模式并且在统计上基本相同。例如,一个名为RTI的研究智囊团创建了2010年美国人口普查数据的一个版本,其中包括居住在随机地址的人。而这些人完全是虚构的,只是选择了他们的家庭住址和个人信息,使其具有与真实值相同的基本统计特征。在许多情况下,研究人员可以测试算法并生成与处理真实数据时一样准确的解决方案。10.中间人和经纪人一些研究人员正在构建限制数据收集和在存储数据之前预处理数据的工具。例如,Mozilla的Rally跟踪希望研究互联网信息流的研究人员的浏览习惯。它会在调查期间安装一个特殊的附加组件,然后在调查结束时将其删除。该工具将关系形式化并强制执行有关收集和聚合的规则。11.无数据无状态计算是大部分网络的基础,许多效率驱动因素已经成功地以尽可能少保留记录的方式重新构想工作。在某些极端情况下,当合规成为可能并且用户愿意接受不太个性化的服务时,删除数据库可以最大限度地保护隐私。原标题:提高数据库安全性的11项技术,作者:PeterWayner
