大数据时代不可能匿名

时间：2023-03-17 22:43:13 科技观察

大数据时代匿名不是100%普林斯顿计算机科学家EvindNariAnan曾在2006年发表的一篇文章中表示，应该匿名的网络电影数据中，各种出租Netflix用户的历史数据可能会在交叉引用过程中泄露。Anandan在7月9日的一份报告中说，匿名支持者（那些认为匿名有效的人）可能没有意识到今天大数据的危险漏洞。无论是在理论上还是在实践中，匿名的作用都不是很大。那些认为匿名就是安全的人，实际上是在制造一种“虚假的安全感”，严重低估了那些数据黑客的威胁，他们很可能会从大数据中窃取个人信息。个人地理定位数据没有隐藏一份2013年的报告称，95%的手机用户可以从人们手机上收集的庞大数据集中被追踪到，因为他们总是在互联网上留下登录痕迹、实时照片共享信息。匿名专家会坦率地告诉你，没有办法隐藏用户的地理位置。专家无法预测数据库的防御有多脆弱。在对113,000名患者的医疗记录进行的案例研究中，匿名专家厄尔曼估计，只有不到1%的患者数据可以被重新识别。但亚南估计，超过12%的患者数据可以被锁定。攻击者在数据库中定位目标数据相对容易。匿名化很难，数据重新识别可以是永久的。匿名化数据的过程具有挑战性且容易出错。由于驾驶执照上使用的数据散列方法（一种将字符串转换为固定长度数字或索引的方法值方法）也是伪劣的。如果某人的匿名数据被公开，它将永远存在于网上，不会被删除。这比入侵公司或应用软件数据严重得多。当一家公司的数据库遭到破坏时，这只是一个安全问题：修复数据漏洞、提醒用户并照常进行。但是，这并不意味着我们要放弃数据的使用，只是放弃泄露数据的账户。那么，我们是不是该砸手机，放弃医疗（医疗数据泄露），隐居深山？但伊曼教授不同意。他极力支持匿名化技术，并表示：“延安说可以锁定12%以上的患者数据，但他并没有对个别患者的数据进行重新识别。如果延安是重新识别技术领域的领先者，那么匿名化是非常可行的。”这对于大数据时代的我们来说是一个天大的好消息。但是，大数据匿名化没有崩溃，并不代表匿名化技术是坚不可摧的。

上一篇：新基建风口给了物联网多少机会？

下一篇：Java中一个String字符串可以有多长？65535？

大数据时代不可能匿名相关文章