当前位置: 减弱器 >> 减弱器介绍 >> MP3编码如何骗过你的耳朵
什么是心理声学?比如人耳的声音定位、听力范围这类研究都属于心理声学的范畴。在心理声学有一个非常经典的研究,就是等响曲线。这个曲线告诉我们,人耳对不同频率的声音感知相差极大,人的听觉范围在二十到两万赫兹之间。而在这个范围的不同频率下,我们听到的响度是不一样的。低频的声音需要更大的声压才能和中频较小的声压所形成的声音大小听起来相等。
就比如贝斯就需要更大的音量才能跟吉他声音听起来差不多大。这也是为什么贝斯这类低音乐器的音箱要比其他音箱的体积要大得多,而最低点出现在三千赫兹左右。所以说明人对这个频率的声音最敏感,只需要比较小的声压就能听到。比如我们听到的大部分警报声,基频都在一千到三千赫兹,这样人耳才能更容易捕捉这些声音,从而避免危险。有意思是,随着年龄增大,我们对声音的接收范围也在变小,大多数成年人听不到频率在一万六千赫兹以上的声音,沿着这个方向,等响曲线的发现者又研究出了一个更加神奇的东西,让我们意识到我们观和客观到底差距有多么巨大。这个东西就是“掩蔽”。
年的某天下午,一个叫Licklider的心理学家去看牙医。他跟医生说,我不需要打麻药,然后投出了一副耳机,开始听震耳欲聋的音乐。在巨大的声音中,牙医帮他搞定了三颗龋齿,而他就像被打了麻醉器一样,竟然没有感觉到疼。Licklider把这项技术命名为Audiac。之后他带着这玩意儿和牙医一起巡诊拔牙,还帮助了不少妇女缓解了分娩时的疼痛,Audiac用了一种强烈的听觉刺激来抑制疼痛。这就是一种跨感官的掩蔽效果。
在听觉系统中,一种声音也会被另一种同时发出的声音所掩盖。比如在一个乐队里,往往是吉他声在c位,但如果突然有相似频率的乐器加入,比如小号,那吉他的声音就会被短暂淹没。这一过程叫做同频掩蔽。我们来举例子,当一个频率从低到高的噪声,经过一个正弦音的时候,这个声音会被噪音掩盖。再比如你上课的时候,想要一身咳嗽来掩盖自己放屁的声音,那你最好要满足三个条件,一是咳嗽声的时长要大于等于屁声,二是咳嗽声的响度要大于等于屁声。三是保证两者的频率接近,这三个条件都满足,才是一次出色的掩蔽。那这和MP3有什么关系呢?
MP3的算法就是利用了人耳的这种特性,将歌曲中不同频率里被淹没的声音瞬间给丢掉了。这样就可以在减少文件体积的条件下最小程度的损失音质,但这还不够。当我们听到一个噪声戛然而止后,实际上会有一个-ms逐渐减弱的掩蔽效果。在噪音完全停止后的这段时间里,比他更小的声音会被掩蔽,我们是完全听不见的,就好像我们的耳朵需要ms的时间回复直觉一样。不光如此,噪音还会掩蔽在它之前的声音,虽然只有50ms,但对于感官来说已经是相当长的一段时间了。这意味着我们的大脑需要50ms的缓冲才能报告到意识里。而这个前后过程就叫做时间掩蔽
MP3压缩算法的核心就是利用一个精心迭代了许多年的人体听觉心理学模型,把音乐里的每一个瞬间对应在MP3文件格式里的每一帧,检查这个帧内。上述两种掩蔽作用所发生的频率和时间段,把那些被掩盖的、我们听不到的音频信息统统丢掉。这个过程并不单纯是精确地机械地判断。它的底色其实是感官上的把控。
在MP3算法测试初期,测试人员需要在海量的歌曲中找出MP3压缩算法的问题。比如要在各种歌曲的MP3和无损版本之间对比,而且每听一首歌他们都要评级。一共有4个等级。分别是:听不出区别、有一点区别、有点难听和非常难听。特别是最后两个选项,可以说是非常主观的判断了。这意味着MP3算法的发明和改进,实际上把人的主观判断作为考量的目标之一。我们不能说这种算法是完全主观的,它也不是绝对客观的。所以它的效果也不可能在所有歌曲中都是平均的。说到这里,就不得不说MP3发明过程中的一个小故事了。点个
转载请注明:http://www.aideyishus.com/lkyy/1793.html