原创:味姐小姐姐(微信公众号ID:xjjdog),欢迎分享,转载请保留出处。你是个好色之徒。别问我怎么知道,我认识你,虽然我不知道你是谁。科技公司会利用大数据对你做一个大概的画像,然后根据你的喜好推送信息。比如一些精准的广告,刺激你荷尔蒙的小视频等等。就拿你正在玩的抖音来说,其实可以匿名使用。你对爆乳妹子的偏爱不会因为重装抖音而消失,它已经知道你的爱好了。对于我这种故事多的人来说,脑子以外的地方都存在着一些可耻的隐私,真的是一种腰酸背痛的感觉。幸运的是,我有一点编程基础。如果你有一定的电脑技能,你肯定会关闭cookies,这样浏览器就不会记录任何东西;有危机感的同学会启动常见的“隐身模式”,隐藏屏幕上反射的傻笑;作为特工,我想安心做一个无名骑士。这些对鸟类都没有用。我们正处于浏览器指纹识别的第三代,事情远比想象的复杂。当您访问某些特定网站时,您将被“被动识别”。这些身份识别信息,就像你的指纹一样,几乎绝对可以以难以想象的准确度定位到一个人。作为爬虫,很容易进入游戏。至于隐私的收集,现在谁也管不了。为什么要做这种事?绝对都是为了利益。我早就说过:样本构成整体,个案框定样本。这些数据收集后,将进行全局分析和个体应用。在利润的驱使下,业务可能会变得复杂,即使一开始是不道德的。你打开一个网站,制作一个应用程序,用户就像一辆公共汽车一样来来去去。不仅注册用户有价值,分析普通访客的行为也会产生更多的“价值”。说白了就是两点:推送信息+跟踪攻击。让我们想象一个跟踪用户的旅游网站。一位匿名用户访问了某旅游网站,查询了拉萨的旅游信息,并阅读了大量攻略。根据系统分析,该用户可能更喜欢琼游和徒步。时隔许久,本地的访问记录早已消失不见。用户的爱人用同一台机器在旅游网站上注册了一个账号,她想去西双版纳。落地后,她接连收到了好几个西藏旅游团的推送。换句话说,您使用同一个浏览器匿名浏览性玩具。一旦您在N天后登录,该网站就知道是您。我们再想象一下小白的黑客之旅。他对前公司充满怨恨,打算利用一些网站漏洞进行暴力攻击。通过无数的代理,肉鸡,甚至是国外的几轮,他把流量送了出去。不过,由于他之前是用自己的浏览器访问过公司页面,所以后台一眼就认出了他。到底是谁神通广大,能如捉鬼似的捉住李逵?不要停留在饼干蛋糕的水平。之后这个方法已经很弱了,很多优化软件和浏览器都上来把这个东西给禁止了。这种存储在本地的信息并不是为用户着想,XSS也可以窃取和欺骗cookies。该怎么办?(图片来自论文:(Cross-)BrowserFingerprintingviaOSandHardwareLevelFeatures)目光落在了万能的js上。这个浏览器解释的脚本可以获取很多信息,包括:操作系统、分辨率、像素比、安装的浏览器插件等,一旦收集到这些信息,就可以大致识别出一个用户。这种方法不是很准确,特别是对于像我这样电脑上安装了七八种不同版本浏览器的用户。但并不是每个互联网用户都像我一样无聊,所以精度水平是可以接受的。更进一步,将使用画布指纹。画布(canvas)是HTML5中的动态绘图标签。它可以做一些你看到的MG动画效果。不过这个东西生成的内容在不同的浏览器上是不完全一样的。你可能觉得Canvas画的是矢量图,是那种无论放大多少倍都不会变形的那种,那你还真是佩服啊。在像素级别,由于操作系统的设置和算法不同,渲染操作和抗锯齿也不同。他们可能都在背后,默默地背叛着你。您可以访问此URL查看您的签名。https://browserleaks.com/canvas如果你认为识别方式只是视觉,那你就小看他们了。万能js也可以操作原始音频,这就是AudioContext。但是它的原理和图像处理是一样的,不同的浏览器会根据不同的硬件和操作系统产生不同的结果。相同的浏览器产生相同的信息。这些操作在后台悄无声息地发生,用户根本不会注意到。每次点击,你都会被无情地出卖。这些信息将被综合分析。相关网站和部门可以对你进行唯一识别,进而锁定跟踪你。虽然你还没有注册账号,但平台已经为你分配了一个身份。这是识别方式,用于识别您的个人身份。而收集到的内容可能更令人瞠目结舌。不要认为有太多的垃圾数据要存储。行为数据比那些便宜的磁盘更有价值。包括你的每一次点击,你停留的时长,你阅读和观看的位置,都全方位展现你的个性。设备、IP、位置、操作习惯,都从不同的角度为你画下指纹,让你在匿名的互联网上无处遁形。作者简介:品味小姐姐(xjjdog),一个不允许程序员走弯路的公众号。专注于基础架构和Linux。十年架构,每天百亿流量,与你探讨高并发世界,给你不一样的滋味。我的个人微信xjjdog0,欢迎加好友进一步交流。
