减弱器

元宇宙不缺创意,缺的是基建公司

发布时间:2023/5/16 18:19:49   

作者

陈晨编辑

靖宇

科幻小说《雪崩》是无比超前的。它出版的年,英特尔还在制造系列处理器,直到次年,奔腾处理器才被推出。

在小说中,尼尔·斯蒂芬森创造了一个并非以往想象中的互联网——元宇宙(Metaverse),在这个与现实世界紧密联系但又相互平行的时空里,人们可以借由各自的「化身」在其中交流和娱乐。

Facebook改名Meta后,越来越多的人才知道,原来这本科幻小说是「元宇宙」这个词的起点。一瞬间,一个书里并没有准确定义的概念,30年后开始成为了商业世界里火爆的新边疆。

只不过,在目前看起来比较接近「元宇宙」的VR行业里,即使设备销量逐渐攀升,但分辨率低、设备笨重、3D眩晕等问题还未完全解决。元宇宙看起来是个性感,但还有着众多技术问题无法解决,还非常遥远的概念。

「从Utility(效用)到Reality(现实),我认为元宇宙是有发展路径的,并且早晚会进化到改变我们现实世界的程度。」王奇所供职的公司声网,最近就开启了「元娱乐」的新探索,他成为了这条业务线的负责人。

这次他们在实践中,对于元宇宙下一步在技术上应该去解决什么这个问题,有了新的思考。

01、「元娱乐」里,声音技术是关键的下一步

「现在所谓的那些元宇宙的应用,离还原人类的真实体验还差得特别特别远。」

根据SensorTower0年的报告,自「元宇宙」概念爆发以来,平均每天都会新增一个「元宇宙」软件,其中,元宇宙社交类软件更是层出不穷。在一个个炫酷的demo里,我们似乎离再建一个虚拟现实很近了,但王奇并不这么认为。

00年4月,《堡垒之夜》里举办的「ASTRONOMICAL」虚拟演唱会吸引了万观众,玩家在霓虹灯束散射中舞动,很多玩家表示仿佛经历了一场真实的梦境。绚丽的布景渲染了人们对技术的最高想象,然而实际上,观众只是在「看」一场演唱会。算力等客观因素限制下,多人同屏和物理交互往往就如鱼与熊掌,玩家在一个「众人场」里能得到的交互体验其实很低。

《堡垒之夜》中的「ASTRONOMICAL」虚拟演唱会

「我们的元娱乐其实并不等同于元宇宙娱乐」,声网元娱乐业务线负责人王奇在接受采访时说,「我们更接近下一代的娱乐这个概念。」在他看来,现有的技术和体验还不能满足人类超越现实的需求,首先要思考的或许是如何去还原一个真实的世界。

5月16号,声网发布了「元娱乐」四大解决方案,其中,他们对音频的处理十分惹眼。

在发布会上,声网元语聊产品经理杨帆展示了一个多人会议的场景:代表每个参与者的头像分布在不同区域,而从其他人说话的声音信息中,能体会到明显的方位感。

这项技术被称作3D空间音频,贯穿在他们的元语聊、元K歌、元直播等方案里。

当用户操作Avatar在虚拟场景里移动时,听到的音效会根据Avatar的头部及脸部朝向、声源角度和距离不同而变化。比如,在玩家进入一个元语聊的房间时,会听到房间内正在播放的背景音乐,随着位置的移动、墙壁或卡座等障碍物的遮挡,玩家所听到的声音也会相应地逐渐清晰或减弱。

这项功能的实现,依赖于声网基于HRTF相关传递函数、心理感知声学、声源指向模拟等算法自研的一整套3D声场渲染引擎。通过这套渲染引擎,可以动态模拟空间中任意角度、朝向的声音在传递到左右耳时声音发生的变化。他们还可以通过声学建模的方式,模拟任意角度的音源方向导致的音色差异。

声网的空间音频技术

「这其实在业内还没有几家能够做到」,王奇谈到这些技术时颇为自豪。据他介绍,声网内部有一个音视频实验室,专门研究各种跟音频和视频相关的算法,其中就包括3D空间音频,此外还有人声模糊、模拟现实中空气衰减等技术。

在这些声音技术的加持下,玩家操作Avatar不仅可以「移步换景」,还可以「移步换声」,可以移动到其他玩家身边开启畅聊,也能凭借人声模糊技术既不受周围人说话声音的干扰,又保留环境氛围,在技术上极力还原现实世界中的真实听觉体验。

模拟现实其实十分困难的,因为对于一个玩家来说,一些很细微的「不合常理」都可能影响沉浸感。那些「不合理」会时时刻刻提醒玩家,这不是一个真实的世界。因此对于营造一个「栩栩如生」的虚拟世界来说,要不断地打磨环境,细化交互的颗粒度。

当然,这对技术实现来说并不容易。

除了声音的拟真外,声网解决方案中同样有对虚拟环境的拟真。在元语聊和元直播中,声网还基于3D引擎建模创建各种场景,能模拟碰撞、重力等物理效果。面部动捕技术、语音驱动嘴型的技术,则让玩家与Avatar的表情匹配,实时表情与语音匹配。

而为了让玩家在选择虚拟形象时不受性别限制,他们还将开发声纹变声技术,在声音上实现「anytoany」的模拟。萌妹子选择大叔形象后,也能在实时交流中拥有与虚拟形象匹配的低沉男音。

影响沉浸感的一大因素还在同步性与低延迟,就像《堡垒之夜》的那场虚拟演唱会,如果没有上千万人的同步参与,或许也不会如此轰动。

在那场盛大的虚拟演唱会中,玩家也被分到了上万个服务器上,才让千万量级的同步参与得以实现。而在实时通信和互动上,声网作为RTC领域全球头部企业,有着行业领先的技术优势。

声网的MetaKTV方案

声网的SD-RTN,是全球规模最大的软件定义实时网,

转载请注明:http://www.aideyishus.com/lkyy/4498.html

------分隔线----------------------------