在互联网时代,通过网站收集信息和资源是非常普遍的。通常,网络浏览器会记录用户访问过的网站列表,即网络浏览历史记录。然而,即使是这样简单的上网行为也隐藏着风险。在8月的USENIX会议上,Mozilla研究人员展示了他们对52,000名(事先同意)Firefox用户两周内浏览历史数据集的分析结果。结果表明,48,919个浏览配置文件是可区分的,即99%的浏览历史是独一无二的。80%以上的用户可以通过浏览历史来识别。此外,只需要考虑50个最常用的网站。其实在2012年就有一项通过用户浏览记录来分析用户身份的研究。其中,研究人员首先建立了一个测试网站,并使用CSS代码从6000个域名列表中识别出参与者访问过的网站。当时的研究结果表明,基于这6000个域名,97%的参与者都形成了非常独特的浏览历史,仅凭这一数据就可以对这些参与者进行追踪和确认。如今,Mozilla在这项研究中使用的数据更加准确。Mozilla的研究收集了52,000名参与者的所有浏览记录,数据包括660,000个唯一域名的3500万次网站访问。也是领域规模的对比。一项大研究。参与者首先与Mozilla团队分享他们的浏览历史,然后他们开始试验是否可以从大量数据中重新识别这些用户。结果表明,99%的浏览记录被发现是唯一的,可以与用户“识别”。另外,对比2012年和2020年的两项研究,也可以看出互联网时代的变化:8年前,用户访问量比较大的前50网站,识别用户的准确率为38%,而对于500个网站数据集,准确率70%;今天,基于50个网站的重识别准确率为50%,基于150个网站的重识别准确率为90%。随着5G技术的发展,人们创造的信息总量也呈几何级数累积。研究表明,过去几年,人类创造的数据占人类全部历史数据量的95%。也就是说,大数据时代真的来了。互联网时代下半场,我们的生理信息将进入沟通渠道,成为5G技术下的重要信息资源。通过用户浏览记录分析用户身份,无疑将成为进入传播渠道的又一重要数据。如何规避这种数据信息下的隐私暴露风险,创造一条更好保护隐私的路径,仍需在实践中探索。但任何技术幻想总是来自于人和人性。人的智慧是技术的智慧,也是解决技术难题的智慧。
