当前位置: 首页 > 科技观察

只需要3kbps就可以进行清晰的通话,本谷歌音频工具开源

时间:2023-03-14 14:54:57 科技观察

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。3kbps清晰通话神器Lyra开源!Lyra是谷歌推出的一款不惧低带宽,随时随地实现高质量通话的音频编解码器。3kbps是什么概念?换算成生活中常用的单位,等于0.375KB/s。相比之下,它更直观。Skype官网给出的最低通话速度为30kbps,带宽要求高出10倍。Lyra使用机器学习模型将原始音频压缩到3kbps,即使没有高速网络,您也可以获得自然清晰的声音。其架构类似于传统的编解码器,分为编码器和解码器两部分:编码器以40毫秒为单位从语音中提取特征,压缩后通过网络传输。解码器使用机器学习模型使用最少量的数据重建语音,将特征转换为完整的音频波形以供播放。更低的带宽要求,更好的效果在Lyra之前,音频编解码器的比特率越低,语音就越难以理解和机械化。传统的音频编解码器使用数字信号处理技术,而Lyra则依赖于其强大的信号重建能力。由于Lyra不需要一个一个地处理信号,因此不需要高带宽,它可以在保持低比特率的情况下提供高质量的音频输出。谷歌还使用Lyra与Opus和Speex在6kbps和3kbps下比较相同音频的压缩质量。结果表明:在3kbps的情况下,Lyra的性能优于现有的其他编解码器;在8kbps的情况下,其性能优于Opus,同时降低带宽60%以上;语音清晰度也优于6kbps的Opus。谷歌认为Lyra可能有广泛的应用,例如:减小音频文件的大小以存储大量语音;节省手机电量;并缓解网络拥塞。GitHub上的开源Lyra现在在GitHub上开源。Lyra使用Bazel搭建框架,使用C++编写代码,保证速度、效率和可操作性。该版本支持用户在Linux上进行开发调试,同时针对64位ARMAndroid平台进行了性能优化,使其不仅可以运行在云端服务器上,还可以在手机上实时运行训练。此外,Lyra还为开发人员提供了编码和解码所需的工具。谷歌工程师AndrewStorus和MichaelChinen表示:“很高兴看到开源社区的创造力在Lyra上得到体现,从而开发出更独特、更有影响力的应用程序。”