无论你是城市规划师还是小企业CEO或软件开发者,善用数据可以让你更好地服务客户,但如果没有强有力的隐私保护,你也可能会失去用户的信任。差分隐私是一种数据分析手段,旨在提供一种手段,最大限度地提高数据查询的准确性,同时最大限度地减少从统计数据库查询时识别其记录的机会。例如,如果您是一名健康研究人员,您可能想要比较不同医院患者的平均住院时间以确定护理是否存在差异。差分隐私是一种高可靠的分析方法,可以在保证个人隐私的前提下进行数据分析。近日,谷歌开源了其差分隐私平台,该平台已在谷歌内部部分核心应用中使用。谷歌表示,开源技术旨在满足开发者的需求。除了可以自由访问之外,它还希望它易于部署和使用。以下是该库的一些功能特性:统计功能:该版本支持最常见的数据科学操作。开发人员可以使用该库进行计数、求和、均值、中位数和百分位数等运算。严格的测试:正确区分隐私是一个挑战。除了广泛的测试套件外,它还包括一个可扩展的“随机差分隐私模型检查器库”以避免错误。快速入门:开源发行版的真正目的是回答“我可以使用这个吗?”这就是为什么Google提供了PostgreSQL扩展和一些通用的操作指南。此外,谷歌在一篇技术论文中专门描述了该库如何使用的细节的模块化:谷歌设计这个开源库以扩展到其他功能,例如附加机制、聚合功能或隐私预算管理。自从我们在2014年发布RAPPOR以帮助改进Chrome以来,Google一直在研发实用且差异化的专有技术,例如当天的旅游软件ProjectFi中的业务有多忙,特定餐厅的菜品如何出现在谷歌地图。今年,多项开源隐私技术——TensorflowPrivacy、TensorflowFederated、PrivateJoin和Compute——相继发布,涵盖从医学到政府再到企业等各个领域。目前差分隐私在Github上获得了648个Stars和62个Fork(Github地址:https://github.com/google/differential-privacy/)
