本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。一个手势识别AI,如何算得上(优秀)优秀?不断变换姿势,他们可以实时输出Emoji,这大概是相当酷的吧:是守卫(错),是来自《星际旅行》Vulcan的敬礼。不是很常见,甚至很难做到。是运气好,通常是双手比。然而,这不是人类的通用手势。即便如此,AI还是机智地识别了它。而且,它运行在浏览器上,几乎没有延迟。AI之父NickBourdakos(简称“尼克”)是IBM的一名程序员。△666尼克使用TensorFlow.js,实时识别无压力。他把算法开源了,说大家可以试试。就半个小时。Nick说这个模型很简单,就是SSD-MobileNet。MobileNet是做分类的,SSD是做目标检测的,一起吃也是常用的方法。他用IBM云上的GPU,免费的k80训练,半小时训练完成。在训练开始之前,必须准备好数据:AI吃标记的手势图。准备好后,让我们安装模型:1$npminstall-gcloud-annotations然后,您可以开始训练:1$cacli2┌────────────────────────────────────────────┐3┐(C)loud(A)notations(CLI)│4│version1.0.12│5└────────────────────────────────┘67Usage:cacli89whereisoneof:10initInteractivelycreateaconfig.yamlfile11trainStartatrainingrun12logsMonitorthelogsofatrainingrun13progressMonitortheprogressofatrainingrun14listListalltrainingruns15downloadDownloadatrainedmodel1617cacli-hquickhelpon当然,也不是非要用IBM云,也不是非要用GPU。AI也可以用CPU调优,大概需要几个小时。训练完成,是时候在浏览器上运行了。在GitHub项目中,自带了转换TensorFlow.js模型的脚本。将模型添加到ReactApp。写一句nmpstart,用浏览器打开http://localhost:3000。耶,这样你就可以在屏幕上随意地舞动手指,你的人工智能就会明白:当然,这个机智的人工智能不只是识别手指。喝什么取决于你用什么样的数据来喂养人工智能。有一次,尼克帮助AI练习辨别苏打水的视力。问题1:一瓶雪碧和一瓶CanadaDry都是绿色的。不管换位置还是把瓶子侧身,AI都不会糊涂。看一下定格:第二题:增加难度,两瓶都是激浪,一瓶普通瓶,一瓶低糖。AI依然毫不犹豫的分辨清楚。识别手势,区分苏打水,不失标准。那么问题来了,你想让AI识别什么?想了想,还是开始训练吧。代码在这里:https://github.com/cloud-annotations/training/P.S.已经有朋友测试成功了,说很简单。△将识别结果显示为Emoji会更好