当前位置: 首页 > 科技赋能

微软人工智能大会!小冰早已可以给用户打电话,让孩子成为故事的“主角”

时间:2024-05-22 16:02:06 科技赋能

Zhidixcom(公众号:zhidxcom) 文字 |渔阳智迪讯5月21日消息,今日,微软在中国人工智能大会举办首场发布会。

它与微软Build开发者大会类似,可以看作是中国版的Build大会。

会上,微软还在Build大会上展示了AI进展,例如Azure IoT Edge(边缘计算)、AI会议系统、微软Cortana与亚马逊Alexa的“联姻”等。

今天的微软AI大会还重点介绍了微软小冰的最新进展,包括底层技术框架的变化、AI通话、语音节奏的改进、与人类协同创作等。

此外,微软还展示了机器翻译技术在小米生态链产品魔芋翻译机中的实现。

有趣的是,在Google I/O大会上演示AI电话后,微软(亚洲)互联网工程院发布了一份技术声明。

人类历史上第一次人工智能全双工语音通话在中国发生。

9月,微软小冰主动拨打了人类的第一通电话。

在演示AI会议系统时,微软黄学东博士还对同行谷歌的全双工技术进行了diss,开玩笑说如果谷歌是全双工,那么微软就是“全双工”,微软的AI系统可以支持5个人都在说话。

今天,微软还宣布收购对话系统初创公司 Semantic Machines,该公司由著名对话 AI 研究人员加州大学伯克利分校教授 Dan Klein 和斯坦福大学 Percy Liang 以及前苹果首席语音科学家 Larry Gillick 和其他的。

此外,微软还推出了在线人工智能学院,目标是一年内培养超过10万名AI人才,提供免费的AI课程,还可以申请微软专业学位课程作为专业技能认证。

会后,微软全球高级副总裁兼云计算与人工智能事业部负责人郭宇廷接受了智东西等媒体采访,介绍了微软在物联网终端的布局。

制造、工业、智能家居等都将是微软的领域。

重要场景??,通过边缘计算和云计算共同实现智能化。

1、推出AI读图机器翻译 今天的微软AI大会与两周前微软在美国举办的Build开发者大会类似。

可以理解为中国版的Build大会,在展示上更加注重与中国企业的融合,重点介绍了微软小冰的一些新进展。

毕竟,小冰诞生于中国的微软亚洲研究院。

现场,微软高级副总裁、大中华区总裁兼首席执行官柯睿杰致开幕词。

他介绍,微软中国已有25年历史,目前拥有1名员工、0名合作伙伴,是美国以外最大的研究院。

微软拥有超过40万名开发者和超过11万名企业客户。

它在美国以外的认知服务使用量方面排名第一。

微软全球执行副总裁、微软研究部人工智能负责人沉向阳博士也介绍了Build大会的亮点,如微软在边缘计算、Azure IoT Edge的布局,以及与高通、大疆、Roobo的合作等等公司推出了视觉AI、智能家居等领域的解决方案。

每年新增 90 亿个基于微控制器的设备,但只有不到 1% 连接到互联网。

微软最新的Azure Sphere通过互联网为设备提供安全的云服务、微控制器和安全操作系统。

它还希望与中国企业合作建立这个物联网生态系统。

微软在四个关键领域进行研发,包括认知服务、对话式人工智能、开放平台和工具以及实时人工智能基础设施。

下面的发言将主要围绕这四个方面展开。

在认知服务方面,全球有数以万计的开发者正在使用这项服务。

微软目前提供24项完全可定制的服务,其中17项已正式商业化。

微软还重点介绍了AI图像描述功能和OCR光学识别引擎。

当你给机器一张照片时,它可以像人一样描述图像,目前支持中文。

例如,在这张图片中,AI描述这位女士正在餐桌上吃蛋糕,看起来很高兴。

微软还重点介绍了小米生态链公司香蕉旅行推出的魔芋翻译机。

它采用了微软翻译系统,可以看作是微软机器翻译能力在翻译机硬件产品上的实现。

该产品可以在14种语言之间切换,现场中英翻译也比较流畅。

不过,语音切换演示中出现了一些错误。

微软黄学东开玩笑说这是“网络问题”。

此外,微软还展示了“AI会议神器”,今天用中文进行了更直观的展示。

可用于会议场景,目前可支持5人实时通话记录。

在现场演示展示中,AI会议系统将实时记录会议中所有人的发言并标记发言者。

不知道有没有配备声纹识别功能?会议纪要显示在左侧,而会议中的待办事项也显示在右侧。

2、小冰早已可以打电话,让孩子成为故事的主角。

微软小冰可以说是今天的主角。

一方面,它代表了微软对话式AI的进步,也是主场参与者。

毕竟,小冰诞生在中国。

现场聚焦小冰的最新进展。

目前,微软小冰拥有1亿用户,累计对话次数超过1亿。

它可以观察人们的声音、语调和情绪,还可以实时预测人们想说的话。

近年来,小冰频频以主持人、歌手、诗人等身份亮相。

顺向阳说:“小冰的粉丝数量比其他聊天机器人的用户总和还多。

”微软亚洲互联网工程院副院长李迪贤介绍了微软最近更新的全双工技术。

之前的对话更多是基于单任务对话,而小冰则采用了面向对话流程的底层技术架构,他称之为“面向Session”,可以理解为像河流一样的对话。

小冰关注的重点不是某项任务的完成情况,而是整个谈话的效果。

对于谷歌最近演示的AI通话,他表示,微软小冰在去年9月向用户首次进行了全双工通话。

现场,微软展示了一位用户向小兵倾诉自己工作和生活中的烦恼。

聊天结束后,小兵还主动给该用户打电话安慰。

近期,微软小冰也推出了小米生态链公司Yeelight的智能音箱。

李迪介绍了一位用户,他与小冰进行了长达6个小时的对话,涵盖8个领域、53个话题。

小冰完成了16项任务。

,展示小冰的会话能力。

他表示,尽管小冰至今仍有不相容的前言和后续文字,但它可以像河流一样与用户对话。

只有有机会保持对话、引导对话,才能探索更多的实际应用。

例如,小冰在日本提供优惠券,4天内平均店铺完成率达到57%。

今年秋天微软将在中国和日本开放全双工语音交互。

今天微软还介绍了小冰的两项新进展:节奏训练和协同创作。

节奏训练主要是让小冰像人类一样学习语言的声调和节奏。

比如小冰学习凯叔的声音(即凯叔讲故事),所显示的声音在语气、节奏等方面都与凯叔非常接近。

另一项协同创作,则是小冰“创意”能力的展现。

微软分享了小冰的两项新进展。

一是小冰近期将推出新诗集。

与上一本不同的是,这本诗集是小冰和人类共同创作的。

另一项是与父母合作,给孩子讲个性化的故事。

家长可以设定主角的名字(比如你??的孩子),并设定故事的方向(比如更有教育意义)。

随后,小冰将利用专门的深度学习模型对故事文本进行个性化处理,自动分配配音角色和背景音乐等,并在约20秒内生成一个时长约10分钟的童话故事。

该技能将于今年儿童节前夕正式发布。

这个技能对于很多家长来说可以说是一个福音。

它不仅让孩子成为故事的主角,也让家长设定故事的方向,达到寓教于乐的目的。

结论:微软是有深度的。

无论是今年微软的Build大会,还是今天微软在中国的首场AI大会,我们都能感受到微软对于边缘计算的高度重视,对于物联网终端的布局,以及提供终端解决方案和操作系统的高度重视。

、云服务等打造物联网生态系统。

微软在中国举办AI大会,意味着微软更加关注AI能力在中国企业的落地。

微软小冰是一款专注于情商的对话式人工智能。

一方面,它具有更强的交互能力。

另一方面,微软也开始探索小冰的行业应用和商业落地,比如小米生态链企业Yeelight智能音箱的推出。

探索日本的商业场景。