计算机在某些领域的表现并不尽如人意——比如人脸识别(别听媒体的)和求大数的质因数(目前海量大多数加密方法的多数基础)。面对可能性的海洋和大量的细微差别:计算机必须穷尽所有可能性才能得到正确的答案。但不管是让电脑认鼻子还是找号码,本质上都是处理运算。对于人类行为的分析,计算机似乎无法为所欲为。在这方面,人脑还是比较擅长处理的。人脸识别和行为识别是安全领域和社交网络领域的重点研究课题。当前跨越许多城市的闭路摄像机网络离不开人眼。不难想象,世界各地的安全机构是多么渴望随时监控每一台摄像机。伦敦多么希望每个角落都有一个监控设备(甚至两个,甚至三个)。在今年6月即将召开的计算机视觉和图像识别会议上,麻省理工学院和加州大学的研究人员将展示一种新的运动识别算法,将扼杀以往的人眼监控。算法基于自然语言处理算法,可以在一些关键领域击败现有技术。例如,该算法以智能方式使用内存(占用大量虚拟内存),保持内存使用不变,并使查看/处理大文件和流式视频成为可能。处理流媒体本身就是一项巨大的技术进步,新算法甚至能够处理未完全完成的动作。例如,如果一个人在街上突然把手伸进别人的外套口袋里,算法就可以预测他接下来会做什么。从某种意义上说,新算法可以预测未来。但是,相对于犯罪预防来说,它的主要功能是动作识别。研究人员提出了一个奇怪的想法,叫做“行为语法”。他们认为,既然词可以按照一定的规则造句,相应地,动作也应该有相应的规则和子动作。麻省理工学院的博士后HamedPirsiavash认为最难的部分是对动作进行分类,弄清楚哪些是主语,哪些是动词,哪些是副词。Pirsiavash说,一个动作,比如倒茶或者煮咖啡,都是由几个子动作连接起来的,他的工作就是把这些子动作拆解分类。算法具有机器学习机制,计算机程序从输入数据设备中学习,经过一定时间的“训练”,程序变得更聪明。该程序在观看包含不同动作的视频时扫描每个子动作。通过查看特定动作的开始,程序可以得出该动作结束的所有可能性,并按最有可能的顺序排列。当视频继续播放时,新添加的信息会排除某些动作的可能性(即使人的动作没有变化,本身就是新的信息,因为时间也属于信息。)程序会重新排列可能的概率动作。一旦程序扫描到一个重要的动作,它就可以非常准确地预测下一个动作。[王大发蔡viaVice]
