人们说:VR的冬天即将来临。
最近看到一个很好的描述:“曾经承载着创业者和投资人太多期待和热情的VR行业,经历了过山车的一年。
”在核心技术瓶颈突破之前,VR在泡沫缩小后也将持续增长。
理性思考。
3D音频作为VR行业的关键技术节点,如今值得关注。
您将看到以下内容: 为什么3D音频技术是VR复兴的关键? 3D环绕声技术已经发展了这么多年,为什么最近才开始流行呢? DeeperBlue盘点了7家为您制作3D音频的公司。
哪一个可靠?在百度上搜索“VR冬天”,得到1,,结果。
《资本变脸:6 个月,VR 从狂欢到惨淡》(极客公园,2019年9月7日)、《吸引了无数资本和创业者的 VR 行业,似乎已进入寒冬》(中国企业家,2018年8月26日)、《 VR 创业公司的寒冬来了?听听资本大咖怎么说!》(网易新闻,2019年5月27日)、《小心被套! VR 将迎来寒冬》(搜狐新闻,2020年5月11日) )……人们还记得今年下半年到今年年初的VR热潮:从创业者到投资人,每个人都对VR抱有无限的热情和希望。
计算机出身转行VR的人还真不少:他们看准了这个“热点”,走出大公司,跳入VR行业。
行业缺乏优质标的,关键技术节点远未突破。
VR就像一个会说话的婴儿,仍处于婴儿期,远未成熟。
与其说VR冬天已经到来,不如说之前的泡沫正在被合理地破灭。
这里的“关键技术节点”之一是空间音频技术。
如今,人们更喜欢将其称为 3D 音频。
Apple Music 和 VR 工作室 Vrse 联手为 U2 《Song for Someone》 制作了 VR 音乐视频。
图为 U2 在空荡荡的多伦多体育馆唱歌的视频片段。
正如著名VR制作公司Jaunt的首席音频工程师Adam Somers所说:“(在VR中),听觉占50%,视觉占剩下的50%。
”听觉决定人类的感知。
空间定位、物体距离感知等。
视觉提供线索,听觉确认线索是否真实。
没有视觉沉浸感,所有图像的真实性都会丧失。
如果不解决听觉问题,虚拟现实就不可能是虚拟现实。
可以说,3D音频决定了我们所说的VR时代是否真正到来。
首先,我们来了解一下3D音频。
什么是 3D 音频?简单来说,3D音频是对声音最真实的模拟技术,可以让听者完全还原出与现场相似的声场。
类似的名称包括全景声解决方案和沉浸式音频。
您可以获得完全真实、“真实”的声音,而不是“真实”。
全球最成熟的空间音频制作公司之一 VisiSonics 的创始人之一 Ramani Duraiswami 有句话说:“当你听到的声音极其真实时,耳机就消失了。
“人耳有自己的声音信号分析系统,用于分析和定位声音。
从空间任意点传输到人耳(鼓膜前)的信号都可以通过滤波系统来描述。
声源 +滤波器(传递函数)在声音到达双耳鼓膜之前获取信号 HRTF 图 人耳有自己的声音信号分析系统来分析和定位声音。
传输到我们的耳朵,但我们只需要知道:声源和到达我们耳朵之前的信号是不同的;我们的左耳和右耳听到的声音是不同的,这可能是由于我们的进化视觉所致。
在黑暗中无法定位,但是耳朵可以通过左右耳发出的声音的差异进行定位和防御,这个滤波器(传递函数)称为HRTF(头部相关传递函数)。
从空间各个方向到双耳,我们可以得到一个滤波器矩阵来还原整个空间方向的声音信号。
HRTF 非常个性化。
每个人在成长过程中都会形成自己的听觉感知。
此外,我们每个人的头部尺寸不同,耳朵之间的距离不同,耳朵内部的轮廓和漩涡也不同。
此外,随着我??们的成长,我们会养成自己独特的聆听习惯。
可以说,同一个物体发出的声音,每个人听到的声音其实都略有不同。
如何还原人耳实际听到的声音?如今,科学家对此的探索并不新鲜。
近一个世纪前,AT&T 贝尔实验室将这项技术带到了芝加哥世界博览会上。
该公司的人类声音研究部门制造了一个机械化的人造头部——他们将这个假人命名为“奥斯卡”。
奥斯卡耳朵上戴着两个麦克风,坐在展示室里,拾取周围的声音。
无论奥斯卡听到什么,他都会记录下来。
AT&T 贝尔实验室提供的解决方案称为双耳音频。
双耳录音技术模拟真实人类头部的形状和左右耳之间的距离,可以录制接近真实人类听到的声音。
这是一种有效的“笨方法”,可以在物理层面上恢复HRTF。
沿着这条路,德国麦克风公司Neumann从2000年到2015年不断在双耳录音技术上取得各种突破——更好的拾音设备,将麦克风放置在模拟仿真人耳的内耳膜上。
2016年,AT&T实验室的双耳录音技术模拟器Oscar。
由于没有强劲的工业需求,双耳录音技术在本世纪一直发展缓慢。
直到这波VR热潮来临,它才重新回到舞台。
由于Oculus Rift、Sony Morpheus和Samsung Gear带来的VR普及,3D音频技术迎来了它的“文艺复兴”——因此也被称为VR音频。
3D音频技术有何难点? VR需要3D音频来营造更真实的沉浸感。
Jaunt 首席音频工程师 Adam Somers 在接受 THE VERGE 采访时这样描述:“就沉浸感而言,听觉占 50%,视觉占剩下的 50%。
” Jaunt是美国知名的VR制作公司。
去年获得上海中华文化产业基金(CMC)、迪士尼投资1万。
然而,仅双耳录音技术并不支持聆听时的头部运动。
当玩家在玩VR游戏时,如果身后传来声音,人的本能反应就是转头回头看。
如果此时声音继续在你面前出现,沉浸感就会大打折扣。
另一种还原真实声场的技术无法支持边听边转头,这就是环绕音频。
环绕声使用多个物理扬声器来营造宽广的声场,来自不同方向的声音通过不同的扬声器/扬声器播放。
这项技术最知名的公司是 DTS 和杜比。
例如,环绕声剧院将在观众周围放置许多扬声器/扬声器。
如果屏幕左侧发生爆炸,声音将从左侧扬声器发出,而不是右侧扬声器。
由于演奏者的位置是固定的,听者只能在固定点听到最真实的模拟声场。
真正的沉浸式体验来自于空间高、中、低音音频的全方位还原,即以人的头部为中心收集并还原一个球体中各个角度的声音。
如何解决这个问题呢?计算成为当务之急。
通过双耳录音技术获得声音后,恢复HRTF,然后进行计算,恢复各个方向的HRTF,合成一组随着头部转动和位置移动而自然改变声场的空间音频。
这三个环节当中——广播、录音;计算、渲染(处理、渲染);回放——最强的技术壁垒在于计算环节。
核心算法是对各个空间音频公司能力的考验。
两只大耳朵的公司口号说明了一切:“我们研究数学,这样你就可以专注于变得更棒。
”这家总部位于爱尔兰的公司目前正在研究空间音频技术。
领导。
有些团队使用了一些笨拙的方法来减少计算量。
例如,3dio创造了一种无线电设备,可以尽可能同时记录各个方向的HRTF。
3dio制作的四对模拟人耳的无线电设备。
在短片《Hear New York in 3D Audio》中,The Verge 展示了他们使用的音频设备——模拟人耳。
这种无线电设备可以在耳朵独特的物理结构下模拟声音的传输过程,然后再现纽约街头的真实声音。
。
通常可以通过三个指标来判断一个公司3D音频核心算法的技术水平: 1、定位:指声音的定位。
环绕声对声音的平坦度有较好的模拟效果,但垂直度较难模拟。
VR音频的难点还在于模拟上下声音。
能够实现逼真上下的技术更加先进。
2.传播:在封闭的空间中,声音不是只传播一次,而是被反射(反弹)无数次。
我们可以使用echo来理解它。
传播性用来描述是否能让用户感觉到自己确实处于真实的空间中。
这种真实感越强越好。
3、遮挡:声音传播过程中,如果中间有障碍物,这个障碍物就会影响声音的传播。
如果一项VR音频技术能够很好地模拟障碍物对声音的影响,那么它就是一项做得很好的VR音频技术。
除了以上三点之外,目前空间音频最前沿的解决方案就是Ambisonic技术。
因此,能否做到Ambisonic也是判断一个公司技术水平的一个指标。
Ambisonic也是一种声场模拟方法,但它考验的是团队在物理、数学和计算机方面的综合能力。
如果我们将太空中接收声音的某个位置想象成一个充气的气球,那么从空间各处传播的声波就会对气球表面施加力。
Ambisonic利用这个简单的原理,在空间中放置一堆扬声器,模拟现实生活中声波对气球的作用力,然后计算并还原HRTF。
通过Ambisonic获得的音频数据是最全面的数据,并且可以降级为任何其他音频格式。
例如,如果Ambisonic是图像中的jpg,那么杜比7.0和杜比5.1等音频格式就相当于像素。
您如何评价3D音频技术行业的现状? 3D音频技术必将改变所有应用场景。
整个空间音频行业有两个机会:第一个机会是开发音频引擎,其核心在于HRTF功能和Propagation等技术,即如何尽可能真实地还原游戏中的立体声。
目前简单的做法是在VR游戏中放置不同的虚拟扬声器,配合Oculus Audio SDK(实现了HRTF等效果,包括反射等)来实现空间音频。
有很多方法并不简单,需要有强大计算能力的团队。
成立于爱丁堡的“两只大耳朵”是其中的领导者之一。
他们制作的插件可能是目前业界技术最先进的插件之一。
第二个机会是实现3D音频在现实生活中的应用,即如何用全景视频录制多角度的VR音频。
这样,如果用户在观看全景视频时转动头部,声音就会动态调整。
从应用场景来看,3D音频技术对于虚拟音乐会尤为重要。
考虑到目前的全球市场,由于3D音频本身的技术难度,目前还没有一家公司或团队能够提供完美的解决方案。
大牌音频公司DTS做出的技术比较接近,但最终版本尚未公开,面临诸多挑战。
价格极高的可能性。
下图列出了全球最受关注的7个3D音频技术团队: 1。
VisiSonics VisiSonic 起步最早。
该团队来自美国马里兰大学实验室,今年10月与Oculus达成合作。
Oculus 购买了他们名为 RealSpace 3D 的技术,用于 Oculus Audio SDK。
他们设计了一种3D音视频同时录音装置,该装置由一个有顶部的柱形装置和一个球形装置组成,球形装置上有64个麦克风。
在硬件层面,技术一流,保持世界领先。
2. 两只大耳朵(Two Big Ears)是一支总部位于苏格兰爱丁堡的团队,最近被 Facebook 收购。
他们的核心技术是名为 3Dception 的 3D 音频引擎。
从插件的角度来看,这个团队是目前世界上技术最先进的。
在被 Facebook 收购之前,有传言称该团队用于 HTC Vive 音频的计算渲染。
3. 3dio sound是目前市场上空间音频录制领域最好的公司。
他们生产了一种有八只耳朵的无线电设备。
4、Thrive Audio是谷歌与Tilt Brush一起收购的公司,是谷歌VR战略布局的一部分。
该团队来自爱尔兰都柏林三一学院。
他们声称已经申请了两项专利。
5. Mint Muse:一支之前总部位于美国圣地亚哥的团队,最近搬到了上海。
主要创意团队来自高通。
他们专注于渲染质量、算法优化和延迟等领域。
他们设计和制作空间音频后期制作、编码和软件插件工具。
目前,他们不参与硬件生产。
该团队的目标是录音师。
他们正在开发一款专业的VR全景声混音软件,可以让录音者在编辑全景声的同时实时监控完成的效果,简化整个工作流程。
6. Waves是一家位于以色列的空间音频技术公司。
它之前制作过专业的工作室工具,例如插件和音效,并且是许多著名工作室的合作伙伴,例如Abbey Road。
7. Impulsonic是美国北卡罗来纳大学计算机科学系孵化的团队。
主要针对VR游戏和应用的3D音频开发,该产品名为Phonon。
成立于年。
创始人Anish Chandak博士表示,他创立时的想法非常简单:“帮助游戏设计师和开发者更轻松地制作高品质的空间音频。
”“大部分收入来自于 Phonon 的授权收入。
他们去年获得了美国国家科学基金会的投资,他们的研究也应用于一些政府项目。
大多数制作 VR 游戏的工作室还没有开始在 VR 上使用 3D 音频技术。
”规模大——主要是这个原因“穷”了,现在“冬天”来了,会变得更穷。
事实上,这些没有好内容的游戏工作室还在使用环绕声技术;只有少数极客风格的工作室才开始使用。
应用一些空间音频技术。
但是,3D音频是整个VR行业的基础技术领域,下一个突破点还可以等待应用层面。
人机大疆就是一个例子,早在无人机成为商用机型之前,大疆的创意团队就已经在飞行控制的技术点上进行了长期的研究和努力,那么它是值得每个用户花时间去使用的。
各个方面的技术都将足够成熟,以实现“沉浸式体验”。
让我们从 3D 音频开始。
参考文献: i.弗朗西斯·拉姆齐()。
空间。
声音的。
焦点新闻.pp. 62–64。
ISBN 0 3 0.ii。
Blauert, J. () 空间听觉:人类声音定位的心理物理学。
麻省理工学院出版社。
贝戈特,D.R. () 虚拟现实和多媒体的 3D 声音。