大数据时代匿名不是100%普林斯顿计算机科学家EvindNariAnan曾在2006年发表的一篇文章中表示,应该匿名的网络电影数据中,各种出租Netflix用户的历史数据可能会在交叉引用过程中泄露。Anandan在7月9日的一份报告中说,匿名支持者(那些认为匿名有效的人)可能没有意识到今天大数据的危险漏洞。无论是在理论上还是在实践中,匿名的作用都不是很大。那些认为匿名就是安全的人,实际上是在制造一种“虚假的安全感”,严重低估了那些数据黑客的威胁,他们很可能会从大数据中窃取个人信息。个人地理定位数据没有隐藏一份2013年的报告称,95%的手机用户可以从人们手机上收集的庞大数据集中被追踪到,因为他们总是在互联网上留下登录痕迹、实时照片共享信息。匿名专家会坦率地告诉你,没有办法隐藏用户的地理位置。专家无法预测数据库的防御有多脆弱。在对113,000名患者的医疗记录进行的案例研究中,匿名专家厄尔曼估计,只有不到1%的患者数据可以被重新识别。但亚南估计,超过12%的患者数据可以被锁定。攻击者在数据库中定位目标数据相对容易。匿名化很难,数据重新识别可以是永久的。匿名化数据的过程具有挑战性且容易出错。由于驾驶执照上使用的数据散列方法(一种将字符串转换为固定长度数字或索引的方法值方法)也是伪劣的。如果某人的匿名数据被公开,它将永远存在于网上,不会被删除。这比入侵公司或应用软件数据严重得多。当一家公司的数据库遭到破坏时,这只是一个安全问题:修复数据漏洞、提醒用户并照常进行。但是,这并不意味着我们要放弃数据的使用,只是放弃泄露数据的账户。那么,我们是不是该砸手机,放弃医疗(医疗数据泄露),隐居深山?但伊曼教授不同意。他极力支持匿名化技术,并表示:“延安说可以锁定12%以上的患者数据,但他并没有对个别患者的数据进行重新识别。如果延安是重新识别技术领域的领先者,那么匿名化是非常可行的。”这对于大数据时代的我们来说是一个天大的好消息。但是,大数据匿名化没有崩溃,并不代表匿名化技术是坚不可摧的。
