当前位置：首页 > 科技赋能

科大讯飞胡雨！交互界面和垂直深度应用锁定AI行业两大机遇

时间：2024-05-22 12:12:10 科技赋能

正文 |编辑：莉娜 | 4月，人工智能第三次浪潮风起云涌，行业大动荡。

在“GTIC全球（智能）科技峰会”上感受时代脉搏，看到未来。

3月10日，由智喜喜、AWE、集果等联合主办的“GTIC全球（智能）科技峰会”在上海证大喜玛拉雅中心正式开幕。

学术界、投资界、创业界、产业链在此展开激烈角逐，包括英伟达、Neato Robotics、科大讯飞、商汤科技、科沃斯机器人、纳恩博机器人、威马汽车、奇点汽车、宇视科技、歌尔股份、地平线机器人等近40家大咖云集轮流上台。

作为上半年人工智能领域的最高级别峰会，GTIC聚焦“机器人产业”、“汽车新势力”、“家庭物联网生活”等领域，探索掘金机会、消费技术变革下的升级和生态建设，带来前沿的实践经验和判断。

上午演讲环节，科大讯飞执行总裁、消费者BG总裁胡宇发表了题为《人工智能+，开创新时代》的主题演讲，详细解构了人工智能最大的挑战：感知智能和认知智能，以及未来人工智能在人机交互界面和垂直行业深度应用的想象空间。

以下为胡宇演讲要点： 1、虽然近两年人工智能概念非常火爆，但重要的是要充分认识人工智能本身、制定战略、推动战略基于技术和业务发展趋势。

很重要。

人工智能的三波浪潮：自2008年达特茅斯会议人工智能诞生以来，已经过去了60年。

历经两次风风雨雨，人工智能在这10年里得到了快速发展。

深度学习理论自2008年提出以来，不断发展，直至2017年，深度学习应用（Memory、DNC、GAN）全面开花，充分发挥了大数据的能力。

现在人工智能已经进入第三次浪潮，成为真正爆发的前夜。

2、感知智能和认知智能是人工智能最大的挑战。

如果比较计算能力和存储能力，人类不再是机器的对手；而在感知智能和运动智能方面，机器也在快速进步，离人类越来越近。

但人工智能在逻辑推理、知识学习、语义理解等方面仍需突破。

2020年8月，科大讯飞正式启动科大讯飞超脑计划，开发基于类人神经网络的认知智能系统。

学习脑科学最新技术，了解大脑的计算过程，从逻辑推理到语言表达；从感知智能和认知智能两个层面进行突破，不仅可以通过传感器和算法感知世界，还能够认知自然世界和人类世界。

报告显示，今年10月以来，科大讯飞语音云平台累计终端数量从6亿增长到9.3亿，日均使用量从10亿增长到30亿，第三方创业团队也不断壮大。

从7万增加到9.3亿。

260,000。

4、人工智能从两个方面改变人类生活：1）升级人机交互界面； 2）垂直行业的深度应用。

1）早期PC时代，键盘字符交互；中期互联网时代，第二代鼠标与图形显示交互；如今万物互联，我们已经进入了以语音交互为主、触摸交互为辅的智能生活方式。

过去，我们以机器为中心进行交互。

未来，我们将以人为中心进行交互。

人类不再需要学习如何与机器交互。

万物互联的浪潮下，人们通过语音控制，通过视觉控制，再配合手部操作完成整个交互。

语音交互包括强/弱视觉呈现：远场、无屏幕、弱视觉呈现移动环境下的语音交互（远程翻译）。

以及涉及内容和服务（例如在线购物）的强大视觉呈现语音交互。

2）除了科大讯飞的优势领域——语音合成和机器翻译之外，人工智能还可以进一步应用于家庭（智能家居、智能电视）、汽车（车载语音交互系统）、教育（个性化教育）、医生（医疗领域的突破）个性化医疗）。

随着感知智能和认知智能的进化，人工智能将能够在生活的各个方面发挥决定性作用，成为各个垂直领域的专家。

以下为胡宇在“GTIC全球（智能）科技峰会”上的演讲全文：很高兴今天来到这里。

人工智能这两年引起了很多人的关注，但是如果你对人工智能本身有一个正确的认识，无论在科技界，在工业界，甚至在大众心目中，建立一个很好的理解是非常有必要的。

因为人工智能到底是什么，它的产业环境是什么，它会朝什么方向发展？事实上，我们制定自己的战略，如何更好地遵循技术发展趋势和业务发展趋势的规律，非常重要。

重要的。

所以，过去几年，包括科大讯飞以及国内很多人工智能研究人员和企业家，我们在这方面其实也有不断的认识，也想借此机会跟大家分享一下。

大家都知道，最近出了几本人类简史、世界简史的书。

当我们了解人工智能时，我们也就了解了机器智能是如何发展的。

如果我们要谈论人类智慧的发展，如果我们了解宇宙的历史是从亿万年前的宇宙开始的。

大爆炸开始，在数亿年的发展过程中，40亿年地球上出现了生命。

以生命计算，又过去了40亿年，大约在三四百万年前，人类社会就出现了。

所以我们经常会看到一些描述，三四百万年前就产生了猿人，直到七万年前人类才变得有智慧并统治了地球。

从世界的角度来看，我们在哪里看到人类智慧创造的世界？它就在我们的自然世界，即我们的宇宙中。

这个宇宙已有数亿年的历史。

因为人类被造之后，就产生了一个新的世界，这个世界就叫做精神世界。

我们人脑思考的这些内容，在原始宇宙中是不存在的。

有时我们常说，如果宇宙中没有人类，噪音其实会少很多。

但这两个世界，一个叫自然世界，一个叫精神世界。

2000年，人类创造了一个新事物。

2000年，数字计算机的发明使人类创造了一个全新的世界。

大家最近看了一本书《图灵的大教堂》这本书里，其实包括图灵、哥德尔在内的计算机先驱们在创造新的计算机的时候，就创造了一个新的宇宙，这个宇宙就叫数字宇宙。

当时人们意识到了这一点，创造了一个新的、不同的世界，有自然宇宙、精神宇宙、数字宇宙。

我们所说的人工智能在数字宇宙中产生了一个新的东西，那就是人类孕育出来的生命。

从这一点来说，我们非常感谢当时提出人工智能的这些伟大的科学家。

数字宇宙将产生新生命，产生新智慧。

众所周知，这些人就是2016年参加美国达特茅斯会议的人，这些人从过去的60年到今年正好是60年，正好是一个循环。

当年最后一位参与者的创始人去世了，从而形成了人工智能第一个整个过程的结束。

事实上，我们可以看到这些人已经成为了那个时代的领导者。

他们有4位诺贝尔奖获得者。

其中可以找到一种模式。

这些人不仅仅是某一学科的专家，他们是多学科的专家。

跨专家，这充分说明人工智能并不是一件简单的事情。

而大家都知道，这个过程其实是有坎坷的。

做过语音技术的人都会知道，语音行业有一句非常有名的话，语音技术的爆发总是在未来五年到来。

。

我们总说五年就好了，但事实并非如此。

2010年人工智能概念提出后，大家都乐观地认为，10到15年内，人工智能将在数字宇宙中取得全面突破，帮助我们人类解决很多问题。

但现实是，在那一年以及此后的十年里，进展甚微。

但是随着20世纪80年代个人电脑的发展，迎来了新一波热潮。

在这新一波热潮中，我们实际上可以看到中国为我们的科学研究奠定了基础，这就是计划。

提出智能计算机。

当时，智能计算机被日本提出为第五代计算机。

第五代计算机是第二代人工智能浪潮的一个非常具有象征意义的时代。

另一方面，涌现了一批真正积累了人工智能基础技术经验的研究机构、科研人员和上市公司。

然而，在这个过程中，大家并没有看到人工智能的爆发。

2000年左右的90年代后半叶，人工智能专业毕业的学生陷入了找不到工作的尴尬境地。

因为在同一时代，另一种技术悄然出现，我们称之为IA。

你看，很多历史书上描述为智能增强的技术，极大地丰富了人类原有的能力，让人工智能变得不再那么必要。

当时人工智能还没有突破。

包括互联网和移动互联网。

正是因为这些技术的发展，人工智能的发展变得不那么紧迫了。

一个非常典型的例子就是语音识别，它在 20 世纪 80 年代非常重要。

那时我们所有的信息入口都是电话，后来被互联网所取代。

因此，语音识别需求的重要性突然下降。

但在这个过程中，其实也为这次人工智能爆发奠定了基础。

因为在这个过程中，有互联网、大数据、移动互联网，这些为我们现在的人工智能发展奠定了基础。

大家也都知道，深度神经网络的发挥离不开大数据和云计算的支持。

深度神经网络在2008年就被提出，但一直没有发展起来。

当数据量不够的时候，它没有办法打败其他深度学习。

只有当深度神经网络在大数据背景下突破原有深度机器学习的极限时，才能发挥其威力。

这是我们过去10年所看到的道路。

但人工智能与人类不同，因为大家都知道智能是有很多层次的。

动物也有智慧，人也有智慧。

人工智能达到什么程度？有人说人工智能只是算法的集合？针对这个问题，科大讯飞在2016年召开了新闻发布会，首次解释了人工智能要向不同层面进行转化。

相对简单地说，当计算机被发明时，第一台计算机是用来帮助人类计算和模拟核武器的过程的。

我们称之为计算智能。

计算已经是一个很高级的术语了，有很多计算。

AlphaGo之所以打败人类，是因为它生成了3000万盘棋局并使用了它们。

对于人类和动物来说，感知智能和运动智能非常有用。

这些东西里面有非常有表现力的东西。

我们看到的东西和听到的东西，结合我们的肌肉记忆和打网球时手的动作。

知觉智能和运动智能构成了人类和动物的基本智能表现。

然而，如果我们真的想谈论人类的独特之处，那就是认知。

今天我们在这里开会。

如果让一只猫进来，它肯定不知道我们在做什么。

从认知上来说，它无法达到这样的高度。

我们和动物都可以看到天上的月亮。

动物只知道它是一个东西，而我们人类却知道它是一个星球。

当谈到计算时，这是机器已经知道的事情。

只要机器计算量不断增加，无论多么复杂的计算问题，比如围棋的计算问题，都是可以解决的。

但说到感知和认知智能，人类之所以变得聪明，是因为他们在7万年前就掌握了语言。

掌握语言可以组织更大的团队，拥有虚拟的概念，创造我们的精神世界。

这项技术直到现在我们的机器仍然很难掌握。

可以看到这里最关键的功能都是语言理解、知识学习、逻辑推理等非常复杂的功能。

人类的很大一部分工作，比如跑步或打篮球，并不需要像科学家那样的大脑，也不需要像作家那样的作家。

当你进入白领工作的时候，你就必须进入认知时代。

这三年来，有两个非常重要的概念。

一是将智力分为预算智力、感知智力、运动智力和认知智力。

其次，我们注意到言语和语言在认知智能过程中起着决定性的作用。

因为只有语音和语言技术的突破，才有可能让我们人类的知识表达、逻辑推理和自主学习达到一定的高度，包括艾瑞咨询，在人工智能的分类中也会接受这种表达方式。

我也认为这应该是一个现代的方向，至少在我们看来是这样。

2016年，科大讯飞宣布推出科大讯飞超脑计划，旨在实现感知智能和认知智能两个方面的突破。

至于突破的方式，我们其实借鉴了脑科学的最新技术，因为如果你想实现我们所说的真正的强人工智能，像大脑一样具有超强的学习能力，你必须对大脑有很强的理解。

整个大脑过程。

。

在这个过程中，我们构建的科大讯飞超级大脑实际上包括两个层次的基础。

一方面是我们讲感性层面的时候，我们看、听、读。

在认知层面上，他们主要是进行逻辑推理，然后表达出来。

在这个过程中它做了什么？我们可以看到，过去11年，我们连续11年在全球顶级中文语音合成大赛中排名第一。

去年，美国举办了一场英语认可比赛。

我们在所有三项比赛中均排名第一。

我们的比赛成绩比上一年提高了%。

另外，这几年，中英文翻译又回到了中国人的手中。

关于人工智能最重要的测试是，目前人工智能领域有7代超越图形测试，称为Winograd测试。

它考验的是人类的常识。

这个常识对于机器来说是很难学习的。

例如，他会说：“父亲不能举起他的儿子。

” ，是因为他太重，还是谁太重？父亲无法举起他的儿子，因为他太虚弱了。

我们支持美国多家研究机构，我们的两个研究单位，一个来自加拿大，另一个来自科大讯飞研究院，在比赛中获得了前两名。

其实这为我们未来的感知认知打下了很好的研究基础，但是在此基础上我们会推出AIUI交互界面。

这个交互界面将适用于所有手机、汽车、电视、智能家电、智能家居和可穿戴设备。

该设备提供最先进的语音交互功能。

我们已经积累了9亿用户，日使用次数超过30亿次，拥有超过26万第三方创业团队。

在此背景下，人工智能应用在哪些领域？我们发现，从大众的角度来看，人工智能可以分为两大方面。

一方面，人工智能改变了人与机器的交互方式。

它利用触摸、语音、图像等多种方式，消除我们与机器交互的更大障碍。

但这只是人工智能能做的事情的一半。

另一半功能与交互无关。

人类需要更好的医生、最好的老师、最好的法官、最好的律师和最好的警察。

他们需要能够理解我们当前工作的内容并且能够处理它。

内的知识，并做出判断。

在各个行业，我们都缺乏这样有经验的人才，人工智能可以替代他们。

从交互的角度来看，交互在这几十年里随着IT行业的变化而不断变化，从最初的纸带打孔，到后来的键盘，再到现在的触摸交互。

触摸交互具有视觉呈现。

触觉互动。

但我们会发现，随着机器变得越来越聪明，人类学习机器交互能力的需求变得越来越低。

当我们使用语音和触摸时，这意味着人类需要学习新的交互方法。

例如，通过敲击键盘或操作鼠标，您可以使用与生俱来的功能与机器进行交互。

我们现在看到了我们能够做到这一点的许多理由。

原因是当我们打电话时，我们只能听到声音。

事实上，我们已经可以做一些简单的任务，比如打电话、发短信。

比如你可以查看一些简单的信息，比如购买一包大千门或者云岩，但是当你进行语音操作时，你必须看到丰富的图像。

例如，如果您想去购物或购买一件衣服，如果没有看到图像就无法进行。

当您点餐时，您还需要图像来为您服务。

所有这一切现在都可以通过视频技术和语音技术来支持。

它会在很多方面影响我们，比如人机交流、翻译等。

现在有很多设备，包括科大讯飞，已经推出了很多设备支持它。

听说，今天没有会议。

下次可以和AWE合作。

我们所说的每一句话都可以实时呈现在大屏幕上。

在交互方面，像Siri、搜狗输入法这样的产品将大大改善我们在未来设备上的输入效果。

智能电视取得了巨大突破。

人们不再需要在电视屏幕上使用原来复杂的遥控器。

只需用语音按下按钮即可。

未来甚至不需要使用遥控器。

您可以直接对着大电视屏幕讲话。

。

AI汽车方面也有非常先进的技术，包括奔驰专门从奇瑞那里买了一辆车来学习语音交互。

所以这些方面都可以很好的改变，包括李院士刚才说的，未来你要和自动驾驶汽车进行交流。

另一方面，除了互动之外，教师在这个行业还具备哪些技能呢？老师可以帮你批改作业，老师可以给你布置一些只有你需要做的针对性问题。

但有一个前提。

这个世界上，好老师足够多。

是否可以为每个学生配备一位老师？当然。

但你的人工智能必须有所突破。

每个人都想要自己的医生吗？当我告诉我我的症状和感受时，它会给我一个个性化的城市。

人们为什么要去大城市、三级医院？因为只有这样的医生才能保证他的生命安全。

这可以通过人工智能来完成。

中国是世界上唯一能够大规模开展英语口语测试的国家。

世界上没有哪个国家可以大规模测试英语口语，但中国可以。

中国已经实现了为每个学生配备一名老师的目标。

每次提出问题，无论是选择题、填空题还是作文，机器都能自行批改，并根据你的信息给你布置不同的作业。

现在我们在广州分校有一个实验班，可以进行英语和数学的这种智能学习。

他们的班级英语进步了三四个位次。

如果我们的人工智能可以取代60%到70%最好的老师，目前的人工智能就可以做到这一点。

在医疗方面，希望每个医生根据我们的病情详细看我们的片子。

我们开发的最新技术在癌症数据库筛查方面已经远远超越了人类。

在分级诊疗的过程中，我们的系统能够通过现在的医学资格考试，因为我也是国家重大项目的首席专家，带领很多国家专家研究参加高考的机器人就像IBM的Watson，它是由IBM首先提出。

Watson 在医疗保健领域有许多应用。

机器人评分的卷子语文可以打90分，地理卷子可以打40分，因为地理卷子太南方了，因为它既包含文科推理，又包含即时推理。

未来它可以达到人类顶级天才的水平，接近人类专家的水平但远胜于普通人的水平，可以在我们生活的各个方面发挥决定性的作用。

刚才大家看到，李院士无论是在前瞻性技术方面，还是在产业方面，都给了我们很多指导。

我相信人工智能未来会改善人与机器之间的沟通，影响我们所有的消费领域和所有核心产品。

另外，在行业的深度应用方面，也会取代很多。

所以未来社会，每个企业都会有自己的人工智能、云计算、大数据。

在未来的商业生态中，每个公司都会有这样的技术前提，如何共享人工智能，如何共享云计算，如何共享大数据。

只有那些找到这些合作方式的人才能领导我们的未来社会。

上一篇：三星Gear S3手表拆解！采用64位CPU和高性能GPU

下一篇：科达隆重推出智慧社区解决方案

科大讯飞胡雨！交互界面和垂直深度应用锁定AI行业两大机遇相关文章