现代计算机视觉技术,完全有能力向我们展示那种只能在电影里才能看到的技术超能力。我们可以将一段视频加载到人工智能系统中,并告诉它放大低分辨率的帧,通过一些训练和一些巧妙的算法,我们可以让它“增强”图像以进行识别。这听起来可能没什么大不了的。但是想一想特斯拉在驾驶员辅助功能中使用的相同技术如何可以用于无数目的,从癌症检测到计算照片中的大量物体,我们将计算机视觉用于一切。这有点吓人。没有什么能阻止聪明的开发人员训练AI系统从击键或手指移动中推断文本。这很可怕,我们稍后会解释原因。首先,值得一提的是,自2017年以来,计算机视觉已经取得了长足的进步,当时人工智能仍在犯一些简单的错误,比如乌龟被识别为步枪。今天的计算机视觉系统可以用非常少量的数据做出令人难以置信的推理。例如,研究人员已经证明,计算机只需要基于AI的打字生物识别技术和由心理学家开发的用于点击分析的自动压力检测系统。研究人员甚至训练人工智能模仿人类打字。因此,我们可以开发更好的工具来帮助我们学习拼写、语法和其他沟通技巧。简而言之,我们正在教人工智能系统从我们的手指动作中推断出大多数人类无法做到的。想象一下,开发能够分析手指运动并将其解释为文本的系统并不会太困难,就像唇语阅读者将嘴巴运动翻译成文字一样。我们还没有看到这样的AI产品,但这并不意味着它不存在。那么可能发生的最坏情况是什么?在互联网无处不在的今天,“肩窥”是对计算机安全的最大威胁之一。也就是说,窃取某人密码的最简单方法是看着他们输入密码。这就是为什么大多数密码输入屏幕会在您输入密码时隐藏您的密码,但您永远不知道谁可以看到您的屏幕。大多数人无法准确确定您按下的是哪个键,或者您在屏幕上输入的是什么数字。当我们知道自己在做什么时,我们的手指移动得非常快,而且我们的手眼协调能力也非常好。但是AI可以接受这些微小动作的训练,在数据丰富的AI世界中几乎任何事情都是可能的。从理论上讲,对于拥有足够资源的开发人员来说,开发一种既可以在AI芯片(如许多旗舰智能手机中的芯片)上运行又可以连接到基于云的技术的模型应该很简单。它将使世界上几乎任何人都能“看到”其他人在他们的手机和键盘上输入的内容。如果技术被坏人利用,后果不堪设想。因此,科技公司和政府必须参与进来,并且必须严格控制这些技术,以便它们在应该使用的地方使用。
