8月30日至31日,中国(上海)国际人工智能展览会暨OFweek(第二届)人工智能产业大会在上海成功举办。
本次大会以全新视角剖析行业趋势,解读今年国内外人工智能领域最值得关注的学术和研发进展,与数千名国际知名企业高管、资深行业专家进行交流,专家分析人工智能领域的机构。
精英们进行多方分析讨论。
在30日的AI技术主论坛上,Facebook大中华区平台合作负责人濮冠南发表主题演讲,介绍了Facebook如何利用AI技术在海量数据下审核内容并监控质量。
同时分享了开源深度学习工具Torch和人工智能系统WIT。
AI、深度学习框架PYTORCH、模块化深度学习框架caffe2。
濮冠南,Facebook大中华区平台合作负责人。
以下为濮冠南现场演讲内容,由OFweek人工智能网整理编辑,不改变原意: 大家好,首先感谢大家今天有这个机会和我交流。
我们简单介绍一下Facebook目前在人工智能领域的一些进展和尝试。
我叫濮冠南。
我常驻新加坡,主要负责 Facebook 与大中华区开发者的合作。
今天我就简单介绍一下。
在大家正常的理解中,Facebook其实是一家开发移动APP的软件公司。
当然,目前我们确实有一些大规模的应用。
例如,Facebook本身目前在全球拥有超过22亿月活跃用户。
我们有比较完整的产品矩阵。
整体产品矩阵的用户数量其实是非常大的。
的。
在这个内容中,我们如何做内容审核、质量监控、各种技术支持等事情?事实上,在很多草根架构的底层,我们使用了大量的AI技术支持。
我们通过一些简单的例子来简单介绍一下一些具体的快速AI是如何运用在我们的产品中的。
你可以看到最左边的例子实际上是Facebook的Messenger。
在这个例子中,我们看到它实际上是一个聊天机器人,即 facebook Messenger。
相对于我们作为用户来说,聊天机器人可以搜索并定制我们自己的旅行,相当于一种智能的聊天方式来选择和制定我们自己的旅行计划。
同时,我们可以给出一些建议。
这里可以看到,在预订过程中,它的AI部分其实就相当于我们的nlp语义学习分析。
这部分是Facebook的一个架构。
同时大家可能也知道,我们在Facebook上有很多这样的视频内容,包括我们最近在Facebook上推出的展示视频的页面。
人工智能在这方面的应用实际上意味着用户将视频上传到Facebook后,可以快速生成视频的预览,大约需要三秒钟。
这实际上是通过人工智能来实现的。
另外大家可以看到,这也是我们的又一次尝试。
大约一年半前,Facebook 正式开放了自己的相机平台。
这就相当于拥有了一个开放的相机平台,开发者也可以利用这个平台开发一些自己想要做的实践。
这里我们可以看到,这个平面识别技术其实是通过AI底层技术构建起来的。
最后我们补充一下,除了AR和摄像头之外,很多虚拟现实技术也会在底层得到应用。
同时,Facebook面临的一个比较大的挑战就是我刚才所说的。
因为Facebook本身在全球范围内拥有比较多的用户,所以这个时候我们实际上会产生很多虚假的用户内容。
我们很大。
一定程度上是依靠人工智能来快速识别并删除这些内容。
接下来我简单介绍一下Facebook在人工智能领域的一些尝试。
我们在研究领域的尝试大致可以分为几点。
我们在人工智能领域的最新尝试是推出pitch。
上线至今已近18个月,上线期间有自然增长。
它今年1月份上线之后,大约18个月前,你可以看到它其实有一个非常大的自然增长,特别是在引文库和研究方面,它的增长速度其实是非常快的。
那么什么是音调呢?事实上,我们推出的基于AI的forMark比人工智能水平更低,更偏向于快速部署。
Pitch可能更适合一些研究应用,因为Facebook本身毕竟也是一个基于用户的APP开发者,所以我们还有另一个比较大的内部forMark叫做Coffee Rabbit。
咖啡兔更像是一个偏向应用层面的forMark。
如果您了解 Coffee Rabbit,我们公司内几乎所有应用程序都使用它。
就连我们自己的手机APP也会使用咖啡兔的forMark。
也就是说,在这种情况下,我们大概可以知道咖啡兔了。
Rabbit的使用程度非常大。
Coffee Rabbit 每天大约被使用一万亿次。
同时,由于还预装了Facebook APP的手机,相当于全球约10亿至200亿人。
已有 1 亿部手机使用咖啡兔的技术。
过去,许多forMark模型可能不会相互混合。
未来,我们希望创建开放的架构规范,尤其是当研究人员和开发人员交换意见时,会更容易,模型迁移的成本可能会更低。
最后,我们在今年年初将这三个 forMark 整合在一起。
我们把这个平台称为pitch1.0,相当于把这三种架构放在一起。
目前,我们希望这个架构能够更好地满足开发和研究的需求。
同时这方面其实也得益于我们很多合作伙伴的大力支持,比如微软、亚马逊。
接下来我简单说一下我们具体的应用层面。
对于Facebook来说,我们如何通过参数来训练大数据神经网络?简单来说,我们有三个具体的应用级别。
如果从应用层面来划分,第一个大的就是视觉,这就是Facebook在视觉方面做AI的方式,也是语义语言分析。
最后,还有道理。
我简单介绍一下这三个部分以及我们做了哪些具体尝试。
在具体的图像视觉识别方面,我们其实一直在进行尝试。
从年初开始,我们只能认出最左边图片中的人。
大约五年后,也就是2010年,我们的识别可以说是比较准确了,我们可以识别出每一个具体的物体,相当于我们对识别这个物体有多大的信心。
不仅仅包括这个识别的准确率,还因为我们应用的很多场景,包括图像识别,其实都是在移动设备中,也就是在手机中,识别的效率其实是比较重要的一部分。
这是我们效率的提高。
在年前,我们如果做肢体的具体识别,识别度比较低。
一年下来,我们的准确率非常高,同时即使在手机上跑起来也比较快。
准确地模拟整个人体并几乎实时地同时进行识别。
我们究竟如何做到这一点?事实上,纵容是通过海量数据进行的。
因为当用户将照片上传到Facebook时,他们通常会制作一些标签。
如何将标签与照片关联起来是我们训练模型的一种方式。
目前Facebook上有超过35亿张带有高层帖子的照片。
例如,我们可能在纵容之前先看真实的事情。
如果我们看照片来辨别,就只能辨别真品了。
确定了这些模型后,我们大概可以分析物体的具体类型,包括地标,以及具体的地标名称。
这些其实都可以通过我们图形图像的纵容来实现。
一是语言,为什么语言对于 Facebook 这样规模的公司更重要。
因为Facebook的人数其实非常多。
就连Facebook自己的APP也超过22亿,其上用户使用的语言数量也很多,可能超过全球很多不同的语言。
这些事情对我们来说都是一个很大的挑战。
如何为用户提供正确的翻译。
简单来说,我们可能需要自动提供机器翻译。
这是其中之一。
同时,我们也希望尽最大努力支持全球多种不同语言。
我刚才可能说了,Facebook本身支持的语言和我们UI界面上支持的语言是不同的。
然而事实上,全世界人们使用的语言数量,也就是比较活跃的语言,实际上可能会超过这个数量。
我们在做语言语音识别的时候,会做一些简单的尝试,就是针对不同的语言做embedding,也就是封装不同的声音来进行学习。
我简单介绍一下最后一部分,这是我们在推理上做了一些尝试。
因为计算机,尤其是人工智能,能做的就是帮助我们解决日常生活中的很多问题。
事实上,每个企业在这方面都会有很多不同的尝试。
让我们尝试一些简单的例子。
如果我们看到一张图片,不只是做一个识别,我们还可以进一步推理,它能做什么?例如,在不同的场景下,我们可以设置一个指令来询问浴缸是什么颜色的?我们可以通过机器学习算出来,它可能是浅灰色的。
是否可以通过视觉准确地识别出房间的大致功能是什么?你可能需要更深层次的东西,这就是推理的功能。
当然,你可能也知道Google在Go方面做了很多尝试。
Facebook其实在Go方面也有一些尝试。
我们在这里做了很多事情,包括我们在AI围棋方面的尝试。
同时,我们也会利用一些游戏来做一些纵容。
这里的图片是一款名为《每周争霸》的老游戏。
这里你可以看到,相当于是一个比较生动的模型,相当于你可以在游戏中看到两个种族之间的战斗。
如果我们在机器启动之前看到右侧的单元,那么它的操作并没有非常清晰的逻辑。
经过机器训练,我们可以发现他们其实有自己的布局,包括阵型,其实都是统一的。
指导的不多,大部分是自己训练和理解的。
Facebook在AI方面的投入还是相当大的,尤其是现在。
我们会在底层做很多不同的尝试。
前面提到,我们会对不同的应用级别、视觉、语言、推理工具有不同的免费标记。
这些都是开源的,您可以直接从我们的网站下载这些不同的东西并自己使用。
最后一点是,对于这种级别的公司来说,如果想做一些AI研究或者相关的事情,大型数据中心是必不可少的。
Facebook还在世界各地建立了自己的数据中心。
我们数据中心的设计图纸也是开源的。
如果您有兴趣,还可以研究一下我们的数据中心是如何设计的。