当前位置: 首页 > 科技赋能

云知声开放日北京站:全栈AI硬核技术首次曝光

时间:2024-05-20 00:59:09 科技赋能

3月27日,云知声AI技术开放日(Open Day)首次在北京成功举办。

在云知声董事长/首席技术官梁家恩博士的带领下,十余位一线人工智能行业领袖陆续上台,进行了涵盖技术、学术和产业的精彩分享。

本次活动吸引了超过500名AI行业精英参加。

开放日是云知声一年一度与外界进行技术分享和交流的活动。

这是云知声畅谈人工智能前沿技术和产业应用,并与合作伙伴、相关学术和产业研究机构等探讨人工智能硬核技术合作的机会。

平台。

首届云知声开放日共设北京、深圳、上海、厦门四站。

继北京站之后,深圳站将于4月中旬正式开通。

以人工智能技术人员为中心,北京站活动以“人工智能技术与应用”为主题。

除“云知声全栈AI技术发展”主论坛外,还有“知识图谱”和“AI芯片”两个平行分论坛。

聚焦人工智能技术发展和产业实践,为行业专业人士提供前沿技术、优秀产品和行业应用的全面解读。

秉承“只讲干货”的原则,本次大会除了云知声、CTO梁家恩、副总裁李霄寒、AI Labs高级刘胜平、AI Labs高级关海新四位技术专家外,还邀请了研究院专家中国科学院自动化研究所、中国科学院软件研究所、寒武纪、NextVPU(兆冠电子)、比特大陆、文印互动、大观数据等众多国内该领域领先科研机构和公司的主讲嘉宾人工智能领域的专家讨论了他们的研究成果并分享了技术发展。

AI实用资讯的密集输出,让与会者大呼过瘾。

AI理性回归,全栈能力建设是成功关键。

中国科学院自动化研究所副所长/模式识别国家重点实验室主任刘成林在上午活动的开幕致辞中指出,在当前人工智能技术驱动的产业变革浪潮中,要服务消费和产业升级的需求,技术和应用的挑战十分艰巨。

对于人工智能企业来说,需要构建更加完善的技术体系,才能不断适应和满足场景化的实际问题,保持行业优势。

作为本次活动的第一位演讲嘉宾,云知声董事长/CTO梁家恩博士在题为《理性时代的人工智能技术与产业展望》的主题演讲中分享了他对行业的理解和思考,并图解解构了云知声的报道认知, -认知与表达的栈AI技术图谱,贯穿技术、产品、产业闭环的全栈AI产业能力,以及从底层算法到AI芯片的硬核能力。

博士指出,云知声很早就打造了Atlas机器学习计算平台,被称为云知声版的“TensorFlow + GKE(Google Kubernetes Engine)”。

基于该平台,支持信号(AEC/SSP/ISP)、语音(ASR/TTS/VPR/CALL)、语言与认知(NLU/NMT/SDS/ICI)、图像(FID/OD/OCR)等多个技术领域的横向扩展和纵向迭代。

通过将能力封装在自研AI芯片上,云知声打磨了“云芯”集成产品体系,实现“AI+生活(家庭、车辆、机器人等)”和“AI+服务(医疗、教育、政务、酒店等))”两个核心场景,进而连接云知声从AI技术到行业应用的生态闭环。

“在全栈能力和硬核技术的双轮驱动下,云知声找准了需求和问题,致力于打通技术创新到产业应用的闭环,解决规模化关键问题。

工业应用。

”梁家恩博士指出。

随后,云知声副总裁/芯片研发负责人李霄寒·博士以及云知声AI实验室元老刘胜平、关海欣先后带来了云知声AI芯片、知识图谱、语音降噪等相应领域的技术分享。

过去的一年被业界称为AI芯片元年。

传统技术与新技术竞相竞争,战争爆发。

在本次活动上,李霄寒·博士从AI芯片设计挑战、设计维度和核心技术等方面分享了云知声对AI芯片产业和技术的看法。

他认为,面向人工智能的芯片设计面临四大挑战:碎片化场景、冯诺依曼内存墙、边缘侧应用的低功耗要求以及安全要求。

在芯片设计方面,需要面向特定场景,基于端云交互的思想提供多模态处理能力,在性能、功耗、面积上实现极佳的平衡,并兼顾连接性和安全性的需求。

他介绍,解决冯·诺依曼内存墙这一通病的关键是缩短计算单元和存储单元之间的距离,让它们尽可能靠近。

为此,云知声提出了从异构计算系统架构设计、加速器近计算存储结构、通用API函数到专用指令集等多种解决方案。

同时,通过技术攻关,云知声的低功耗语音唤醒技术和机器视觉专用的低功耗microISP能够很好地适应边缘侧应用的低功耗需求。

定制化安全IP规划,满足安全需求。

围绕人机交互对话系统,云知声AI实验室高级专家刘升平介绍了云知声在该领域的典型技术和进展,包括流交互、语用计算和智能对话等。

他指出,云知声从2008年开始致力于语音交互系统,为了实现真正的智能,云知声于2016年正式提出流式对话解决方案,并在业界率先实现免唤醒多方通话。

对话;与此同时,云知声提出了实用计算。

技术可以从语用的角度而不是直接从语境的角度来理解说话者的意图。

结合更丰富的语义,可以更好地理解语音输入的真实含义;此外,云知声还将知识引入到对话过程中,让知识图谱参与到整个对话过程中,包括聊天和问答,都是由知识图谱支持的。

赋予机器智能。

从远场语音识别的前端信号处理技术出发,云知声人工智能实验室高级主管关海欣分享了云知声在该领域的创新解决方案。

他表示,解决远场语音识别的关键在于远场拾音。

需要从前端信号处理阶段入手,妥善处理回声、混响、噪声三个核心问题。

在回声消除、混响抑制、噪声处理等领域,云知声拥有领先的成熟技术方案,相关技术指标达到业界一流水平。

AI芯片百花齐放,云端和边缘侧各有不同路径。

在AI芯片分论坛上,云知声副总裁李霄寒、寒武纪副总裁刘道富、NextVPU(兆冠电子)联合创始人陈涛、比特大陆算峰AI产品线总裁阮晨勇四位嘉宾分享了关键技术、设计根据各自公司的业务方向,提出AI芯片的难点和场景应用。

李霄寒认为,物联网与AI结合的浪潮需要新的AIoT芯片,而多模态AI芯片是关键一步。

AI与IoT的叠加,要求传统解决方案向五个大方向转型:从通用架构-AI架构、从硬件依赖到软硬件融合、从PPA模式到垂直场景模式、交互从单一模式到多模态、设备从独立到协作。

为此,云知声提出了Skills On Chip的概念,并打造了DeepNet2.0多模态神经网络处理器IP,兼容多种神经网络。

寒武纪公司副总裁刘道富结合自身行业经验,从多个角度分析了智能芯片如何做到易用、通用。

他认为,设计灵活的指令集、设计高度可扩展/高效的架构、提供灵活的算术解决方案、支持主流编程架构、在大规模商用中获得反馈和修正,都是制造智能芯片的重要手段。

NextVPU联合创始人陈涛重点介绍了其AI视觉处理器芯片N。

他介绍,N是一款高度集成的SoC芯片,可以作为主芯片独立运行操作系统。

还可定制计算机视觉专用视觉成像引擎,可广泛应用于机器人、无人机、无人车等。

去年初,比特大陆发布云端AI芯片品牌“算峰”,并启动产品发布和迭代以9个月的速度。

在下午的分论坛上,比特大陆算峰AI产品线总裁阮晨勇介绍了比特大陆量产的深度学习加速卡SC3。

他透露,比特大陆还将在今年上半年推出第三代芯片BM。

BM的芯片在处理通道和接口数量上将会有显着的提升。

知识图谱,打造行业人才下午分论坛中,云知声人工智能实验室高级主管刘升平、中科院自动化研究所副研究员刘康、软件所研究员韩先培、中科院院士、文印互联网创始人/CEO鲍杰、大观数据创始人/CEO陈云文探讨了该领域面临的技术挑战和应用前景。

刘升平指出,知识图谱是人工智能时代构建酒店服务、家居生活、儿童教育等不同场景产业的基石。

刘升平结合医疗领域的行业实践,分享了知识图谱的构建方法和构建过程。

他认为,在构建知识图谱时,一定要看看行业历史上的知识表示方法,通过学习这些方法来降低成本;此外,还必须应用驱动程序并选择知识图谱的评估方法。

中科院自动化研究所副研究员刘康、中科院软件所研究员韩先培两位嘉宾分享了自然语言理解、知识获取等技术领域的最新进展,以及基于自己研究方向的对话生成。

随后,文印互联网创始人/CEO鲍杰分享了知识图谱的一些核心概念知识、基本原理和演进方向。

他认为知识图谱的最佳用途在于“不可预测”的应用,其突破点可能在于人机交互(HCI)而不是知识抽取或知识表示。

知识图谱论坛的最后一位嘉宾,大观数据创始人/CEO陈云文分享了文本智能处理领域的技术发展和应用成果。

他指出,随着各行业向智能化转型的发展需求,文档内容自动处理在大型集团企业、政府、教育、金融等行业具有广阔的应用前景。

借助自然语言理解、机器翻译、知识图谱等技术,在深度学习的支持下,机器可以高效、自动地阅读、审阅和编写文档,实现数据化、智能化操作,将有效提高企业的运营效率。