当前位置: 首页 > 科技观察

颠覆创新的炭精科技在AI芯片领域迈出了一大步

时间:2023-03-23 10:37:57 科技观察

在AI芯片领域,国内有这样一家公司,研发出了颠覆创新的SFA(StorageFirstArchitecture)内存优先芯片架构,设计了专门用于语音识别的高计算密集型神经网络(HONN),发布了音炫风611等多款AI芯片,与30家企业建立合作伙伴关系,语音识别解决方案已实现数百万产品出货量,增长速度超出了所有人的想象。  这家低调务实的AI芯片公司就是探井科技,成立于2017年。  颠覆创新的SFA存储优先架构  SFA存储优先架构是探索科技为AI芯片设计的创新架构AI芯片中的存储墙问题。之所以设计出这种独特创新的AI芯片架构,在探索科技创始人/CEO陆勇看来,是因为所有运行深度学习算法的AI芯片都面临着大存储带宽、高功耗、数据复用等问题.问题。  卢勇告诉记者,数据在内存中的位置、相对关系和读取性能都会影响算法的运行性能。炭精科技用比较独特的方法颠覆了冯诺依曼架构,取得了很好的效果,这就是SFA存储优先架构。SFA存储优先架构可带来超高能效比,数据访问可减少10-100倍,存储子系统功耗降低10倍以上。采用SFA存储优化架构设计的AI芯片采用28nm工艺,系统能效超过2TOps/W。实验数据表明,SFA架构采用的各种微、宏调度算法,与“类CPU架构”采用的基于总线和指令集的映射方法相比,具有近似的存储容量、近似的计算能力、近似外部存储带宽和近似功率。在消费约束的前提下,可以获得8~12倍的利用效益。  除了高能耗比,SFA存储优先架构还具有出色的易用性和通用性。在通用性方面,SFA内存优先架构支持所有已知的神经网络,没有任何参数限制,支持定点数和位数,不限制数据类型。此外,它还可以在无需人工干预的情况下自适应地支持常见的稀疏数据。  在易用性方面,由于SFA存储优先架构采用了成熟的设计方案,无需修改底层设备的设计,算法伙伴只需要进行一些小的优化,可以得到快速应用,大大加快了商业化路径。此外,探井科技还为零基础用户提供了工具链,并向所有算法伙伴开放,为他们节省了大量的时间和精力。  因为SFA存储优先架构不仅适用于终端,也适用于云端、推理、训练,可以组合成多种产品形态。  陆勇表示,SFA存储优先架构的高能耗比、易用性和通用性使其成为真正满足商业应用的AI芯片架构,得到了合作伙伴的一致认可和好评。  独特设计的HONN高计算密集型神经网络  众所周知,在一个完整的语音识别环节中,降噪算法和语音识别算法是重中之重。为此,探井科技通过自主研发的深度学习降噪算法和高计算密集型神经网络HONN解决了抽油烟机等高分贝噪声的干扰问题,大幅提升了语音识别率。  据探井科技副总裁李同志介绍,探井研发的AI降噪算法基于深度学习,不仅能处理稳态噪声,还能滤除不稳定的突发噪声。为了验证探井AI降噪算法的有效性,他曾将一批信噪比在3dB左右的语音数据发送到知名云端公共语音识别引擎进行测试。%识别准确率。  在拥有非常强的噪声处理能力后,探井科技重新设计了一个计算量非常大的神经网络HONN(HighOperationNeuralNetwork)来解决语音识别的问题。  HONN将计算机视觉的一些经验迁移到语音识别中,并在语音识别算法中加入了更多的卷积运算。与大多数公司采用的全连接操作(DNN/DTNN)相比,HONN对计算能力的要求更高。从炭精科技提供的数据可以看出,HONN需要数百兆以上的OPS,而一般的DNN模型需要个位数的算力,两者相差30多倍。借助FSA芯片更强的计算能力,HONN加入了更多的卷积运算,并重新设计了声学建模单元的网络结构。  当然是因为HONN高算力神经网络把每个处理单元都变成了三维维度,比平面上的处理要好很多,高算力的信息量和计算密度-密集型神经网络远超传统DNN/DTNN方法识别多一维,性能提升明显。而且,高计算密集型模型只需要350k的存储空间,而DNN需要1.6M的存储空间,因此语音识别芯片的成本可以大大降低。  依靠AI降噪技术+HONN神经网络,探静推出的Voitist音旋风611可以覆盖大部分生活场景,无惧各种噪音干扰。  基于FCSP的端到端AI双麦算法  在日常生活中,我们面临着各种各样的应用环境,例如低信噪比、远场环境、高噪声等、非平稳噪声的影响、多声源等,如何提高复杂场景下的语音识别准确率也成为探井科技需要攻克的难题。为此,探井研发设计了基于FCSP的端到端AI双麦算法。  所谓FCSP,即FrequencyComplexSubspaceProjection,是谭晶开发的频域复子空间投影算法的简称。它直接输入阵列信号并输出??最终的识别结果。中间部分都是基于深度学习来交的。AI算法来处理,不再使用传统的数字信号处理方式。整体信号增强和识别模块以降低识别错误率为目标进行了优化,避免了语音增强和语音识别模块之间的不匹配。  另外,在模型训练时,采用了“注意力增强”的学习方式,可以灵敏地检测唤醒词和命令词,即使干扰信号靠近目标信号的方向,也可以被敏感地唤醒和认可。  据媒体报道,谷歌采用了FactoredModelinFrequency算法,相对错误率降低到16%,双花的识别率达到了传统算法7-mai的识别率。而探井科技采用频域复子空间投影,抗噪性能强。在信噪比为0dB时,与传统处理算法相比,相对识别错误率降低20%以上。  李同志表示,通过AI语音算法+HONN神经网络模型提升识别率,再通过FCSP“端到端”双麦处理算法简化识别流程,减少最终识别错误率。跨越式升级。  基于双mic算法,探井对611进行了升级,推出了音旋风612语音识别方案。与竞争对手的传统芯片相比,一是减少multi-mics的信号处理,节省硬件成本;二。高噪声环境下识别率大幅提升;第三提供了更高的有效计算能力。  炭精科技是一家全栈技术公司,在IT设计、软件开发、算法研究、系统集成等方面具有很强的研发能力。因此我们可以提供交钥匙的整体解决方案。  探索者未来计划:影像芯片在路上  在今天的媒体发布会上,探索者首次曝光了由低功耗系列、主打系列、旗舰系列组成的三大系列,以及6款AI芯片组成的产品矩阵.除了支持AI双麦克风的Voitist612,还包括离线集成的Voitist621,以及语音芯片的旗舰产品——可以支持本地NLP的Voitist7系列。据陆勇介绍,未来,谈京将对语音产品进行二次升级,推出更多线上线下融合的解决方案。  除了语音芯片,路勇还公布了首款图像芯片的计划,其IPS/W高达800,为已知AI芯片中最高。据介绍,探晶影像芯片已于2019年Q4顺利流片,部分影像领域甚至已开始产生营收。  据了解,炭精科技在全球共有6个研发中心,分别位于北京、上海、深圳、合肥、杭州和美国硅谷。现有员工近200人,其中研发人员150人,博士50人。以及硕士和研究生学位。  此外,关键研发人员平均工作经验在15年以上,处于研发的黄金周期。  》探索者不仅拥有高性价比的全栈语音解决方案,未来还将推出图像领域的解决方案;不仅拥有全链条的研发实力,更愿意携手与上下游合作伙伴共享AI时代带来的科技红利。”陆勇说道。