当前位置: 首页 > 科技观察

Unisound开放日北京站:全栈AI硬核技术曝光

时间:2023-03-12 06:06:17 科技观察

3月27日,2019UnisoundAI技术开放日(OpenDay)第一站在北京顺利举行。在UniSound董事长/CTO梁嘉恩博士的带领下,十多位AI行业一线专家陆续登台,进行了涵盖技术、学术、产业的精彩分享。此次盛会吸引了500多位人工智能行业精英参加。开放日是云知声一年一度的对外技术分享交流活动。是云知声面向人工智能的硬核技术,与合作伙伴、相关学术和产业研究机构等共同探讨人工智能前沿技术和产业应用及探索合作的平台。2019首届云声开放日将在北京、深圳、上海、厦门四站开展。继北京站之后,深圳站将于4月中旬正式开通。聚焦AI技术人员,北京站活动围绕“AI技术与应用”展开。除了“云知声全栈AI技术发展”主论坛外,还设置了“知识图谱”和“AI芯片”两个平行分论坛。聚焦人工智能技术发展和产业实践,为行业专业人士带来前沿技术、优秀产品和产业应用的全方位解读。秉承“只讲干货”的原则,除了云知声董事长/CTO梁家恩、副总裁李晓寒、AILabs资深专家刘升平、AILabs资深专家管海欣等四位技术专家外,大会还邀请了中科院自动化研究所、中科院软件所、寒武纪、蔚来科技(兆观电子)、比特大陆等国内多家人工智能领域领先的科研机构和企业进行主题演讲、文印互动、大观数据等,就各自领域的研究成果和技术进行了探讨。开发和共享。密集输出的AI干货让参会者大呼过瘾。AI回归理性,全栈能力建设成制胜关键。模式识别国家重点实验室主任刘成林在上午活动的开幕致辞中指出,在当前人工智能技术驱动的产业变革浪潮中,服务于消费和产业升级的需求,技术与挑战应用程序令人生畏。对于人工智能企业而言,需要构建更加完善的技术体系,才能不断适应和满足场景的实际问题,保持自身的行业优势。作为本次活动的首位分享嘉宾,云声董事长/CTO梁嘉恩博士在题为“理性时代的AI技术与行业展望”的主题演讲中,分享了自己对行业的理解与思考,解构了未来的行业格局。云智晟涵盖感知、认知、表达的全栈AI技术图谱,贯穿技术、产品、产业闭环的全栈AI产业能力,从底层算法到AI的硬核实力芯片。梁家恩博士指出,Unisound很早就搭建了Atlas机器学习计算平台,号称Unisound的“TensorFlow+GKE(GoogleKubernetesEngine)”版本。基于该平台,支持信号(AEC/SSP/ISP)、语音(ASR/TTS/VPR/CALL)、语言与认知(NLU/NMT/SDS/ICI)、图像(FID/OD/OCR)等.多技术领域的横向扩展和纵向迭代。通过将能力封装在自研AI芯片上,优利声达打磨出“云芯”一体化产品体系,实现“AI+生活(家居、车机、机器人等)”和“AI+服务(医疗、教育、政务等)酒店等)”两大核心场景,进而贯穿云知声从AI技术到行业应用的生态闭环。“以全栈能力和硬核技术为驱动,云知声定位需求和问题,致力于打通从技术创新到产业应用的闭环,解决产业规模化应用的关键问题。”梁嘉恩博士指出。随后,Unisound副总裁/芯片研发负责人李晓涵博士,UnisoundAILabs资深专家刘胜平、关海欣先后带来了UnisoundAI芯片、知识图谱、语音降噪等相应领域的技术分享.过去,2018年被业界称为AI芯片元年。传统与新人争先恐后,各种战争纷至沓来。在本次活动中,李晓寒博士从AI芯片设计挑战、设计维度、核心技术等方面分享了云知声对AI芯片产业和技术的看法。他认为,人工智能芯片设计面临四大挑战:碎片化场景、冯诺依曼内存墙、边缘端应用的低功耗需求、安全需求。在芯片设计方面,需要面向特定场景,基于端云交互的思想,提供多模态处理能力,在性能、功耗、面积上取得极佳的平衡,兼顾连接和安全的需求。他介绍,解决业界通病冯·诺依曼内存墙的关键是缩短计算单元和存储单元之间的距离,让它们尽可能靠近。为此,云知声提出了异构计算系统架构设计、加速器近计算存储结构,以及从通用API函数到专用指令集的多种解决方案。同时,通过技术突破,优尼声达推出的低功耗语音唤醒技术和专用于机器视觉的低功耗microISP可以很好地满足边缘应用的低功耗需求。定制化安全IP规划,满足安全需求。UnisoundAILabs高级专家刘升平围绕人机交互对话系统,介绍了Unisound在该领域的典型技术和进展,包括流式交互、语用计算和智能对话。他指出,Unisound于2013年开始研发语音交互系统,为实现真正的智能化,Unisound于2016年正式提出流式对话解决方案,并在业界率先实现多人对话无需唤醒;同时,云知声提出的语用计算技术可以从语用的角度而不是直接从上下文中理解说话者的意图。结合更丰富的语义,更能理解语音输入的真正含义;此外,云知声还将知识引入到对话过程中,让知识图谱参与到整个对话过程中,包括聊天、问答,都由知识图谱支持,赋予机器智能思维。从远场语音识别的前端信号处理技术出发,云知声AILabs资深专家关海欣分享了云知声针对该领域的创新解决方案。他表示,解决远场语音识别的关键在于远场拾音。需要从前端信号处理阶段入手,妥善处理好回声、混响、噪声三大核心问题。在回声消除、混响抑制、噪声处理等领域,云知声拥有先进成熟的技术方案,相关技术指标达到行业高水平。AI芯片百花齐放,云端与边缘端如出一辙。AI芯片分论坛上,云知声副总裁李小寒、寒武纪副总裁刘道富、蔚来科技(兆观电子)联合创始人陈涛、比特大陆AI产品线总裁阮申勇分别介绍了基于嘉宾围绕各自公司的业务方向,分享了AI芯片的关键技术、设计难点和场景应用。李晓涵认为,IoT与AI浪潮的结合需要全新的AIoT芯片,而多模态AI芯片是关键一步。AI与IoT的叠加,需要传统解决方案在5大方向进行转型:从通用架构-AI架构,从依赖硬件到软硬件一体化,从PPA模式到垂直场景模式,从单模态交互到多模态交互-模态交互,从独立到协同。为此,Unisound提出了SkillsOnChip的概念,打造了兼容各种神经网络的DeepNet2.0多模态神经网络处理器IP。寒武纪副总裁刘道富结合自己的行业经验,分析了智能芯片应该如何简单易用、用途广泛。他认为,设计灵活的指令集,设计可扩展/高效的架构,提供灵活的计算方案,支持主流的编程架构,在大规模商用中得到反馈和修正,都是做智能芯片的重要手段。.蔚来科技联合创始人陈涛重点介绍了其AI视觉处理器芯片N171。他介绍,N171是一款高度集成的SoC芯片,可以作为主芯片独立运行操作系统,也可以为计算机视觉定制专用的视觉成像引擎,可广泛应用于机器人、无人机、无人车等领域。去年初,比特大陆发布云端AI芯片品牌“速风”,并以9个月的速度进行产品发布和迭代。在下午的分论坛中,比特大陆锁风AI产品线总裁阮晨勇介绍了比特大陆量产的深度学习加速卡SC3。他透露,比特大陆将于今年上半年推出第三代芯片BM1684。BM1684芯片将大大提高处理通道和接口的数量。知识图谱,打造行业专家下午分论坛,云知声AI实验室高级专家刘胜平,中科院自动化所副研究员刘康,软件所研究员韩先培,中文科学院文印互联网创始人/CEO鲍杰、大观数据创始人/CEO陈运文共同探讨了该领域的技术挑战和应用前景。刘升平指出,知识图谱是人工智能时代酒店服务、家居生活、儿童教育等不同场景下打造行业专家的基石。结合医学领域的行业实践,刘升平分享了知识图谱的构建方法和构建过程。他认为,在构建知识图谱时,一定要多看行业历史上的知识表示方法,通过借鉴这些方法来降低成本;另外,一定要以应用为驱动,一定要选择知识图谱的评价方式。中科院自动化所刘康副研究员和中科院软件所韩先培研究员结合各自的研究方向,分享了自然语言理解、知识获取、和对话生成。随后,文印互联创始人/CEO鲍杰分享了知识图谱的一些核心概念知识、基本原理和演进方向。他认为,知识图谱更好的应用在于“不可预测”的应用,其突破点可能在于人机交互(HCI),而不是知识抽取或知识表示。紧接着,大观数据创始人/CEO陈运文分享了在文本智能处理领域的技术发展和应用成果。他指出,随着各行业向智能化转型的发展需求,文档内容自动化处理在大型集团企业、政府、教育、金融等行业具有广阔的应用前景。借助自然语言理解、机器翻译、知识图谱等技术,在深度学习的加持下,机器可以高效、自动化地实现文档的阅读、审阅和写作,实现数据化、智能化运营,有效提高企业的经营效率。

猜你喜欢