数字音乐各种高保真音乐格式揭密
DVD-Audio
DVD-Audio是以DVD(DigitalVersatileDisc,数字多用途光盘)作为储存介质的新音乐媒体,于1999年3月出台。采样方式为LPCM(LinearPulseCodeModulation,线性脉冲编码调制),可选择采用MLP(MeridianLosslessPacking,无损压缩音频)技术减少庞大的信息容量。DVD-Audio的采样率有44.1KHz、48KHz、88.2KHz、96KHz、176.4KHz和192KHz等,可以16Bit、20Bit、24Bit精度量化,使用立体声录制时最大信息流量可达192KHz、24Bit,当采用5.1声道录制时最大采样率可达96KHz.DVD-Audio如此高的采样率最大的好处在于不需要繁复的超采样运算就可以得到正确的音乐信号波形,另一个好处是减少Jitter对音质的影响。DVD-Audio碟片目前的价位大概也在数百元左右。
SACD(SuperAudioCompactDisc)
SACD是索尼提出的以DVD为储存媒体的下一代音乐储存规格。SACD的最大特色在于摒弃PCM,改用Delta-SigmaModulation(△-∑调制,噪声修整技术),它是PWM(PulseWidthModulation,脉冲宽度调制)的一种。其实Delta-SigmaModulation是很常见的技术,低价的CD播放器、床头音响、CD随身听、声卡都是先将PCM信号经过Delta-SigmaModulation然后再转为模拟信号的。
Delta-SigmaModulation可以用较低的成本和比较少的数字滤波器达到较高品质的声音水准,因此大受欢迎,飞利浦的Bitstream(比特流)也属此类技术。索尼将其改良的Delta-SigmaModulation技术命名为DSD(DirectStreamDigital,直接流数字)。PWM不同于PCM采样,是以信号振幅大小为主,而且改为记录目前信息数值大于或是小于前一个信息,是相当复杂的技术。
SACD使用DSD的最大好处是从录音到播放全部都以Delta-SigmaModulation处理数字信号,不用在录音时先用PWM采样再转回PCM储存,放音时又要把PCM经过PWM处理再经转回模拟信号的层层手续(听起来很笨,可是绝大部分的CD都是这样工作的),因此可以降低失真。
SACD同样也有立体声和5.1声道的规格。由于SACD并非PCM编码,不需要多Bit储存振幅,只要1个Bit就够了,且采样率高达2822400Hz.SACD如同DVD-Audio有单面单层和单面双层的规格,比较特殊的是混合光盘(HybridDisc),此种格式第一层信息与普通CD相同,可以放到CD播放器中播放,第二层则是存放正宗的DSD信号,供SACD播放器播放。
DTSCD
DTSCD的信息格式与一般CD相同,都是16Bit、44.1KHz,可是记录的信息内容不是PCM采样信号,而是经过DTS(DigitalTheaterSystems)编码后的5.1声道信号。DTSCD欣赏时必须将CD转盘的数字输出接至支持DTS的解码器才能获得5.1声道模拟信号。由于DTSCD格式与普通CD相同,因此与HDCD、XRCD一样都可以用普通的方法复制。
名词解释
Dither:是数字音乐处理上非常神奇的技巧,目的是通过用少数的Bit达到与较多Bit同样的听觉效果,方法是在最后一个Bit(LSB)上动“手脚”。例如用16Bit记录听起来好似20Bit的信息,听到原先16Bit无法记录的微小信息。举例来说,现在我有个20Bit的采样信息,现在想将其存为16Bit的信息格式,最简单的转换方式就是直接把后面4个Bit去掉,但是这样就失去用20Bit录音/混音的意义。比较技巧性的方法是在第17~20Bit中加入一些噪音,这段噪音就叫做Dither.这些噪音加入后,可能会进位而改变第16个Bit的信息,然后我们再把最后4个Bit删掉,这个过程我们称为redithering,用意是让后面4个Bit的数据线性地反映在第16个Bit上。由于人耳具有轻易将噪音与乐音分离的能力,所以虽然我们加入了噪音,实际上我们却听到了更多音乐的细节。
我们通过一个比喻来让大家了解Dither:我们通过手指间的细缝只能看到眼前部分的图像,但是如果前后挥动手掌,就可以通过不同时刻看到的整个图像的各个部份,从而在大脑中建构出完整的图形信息,这就是大脑神奇的地方。Dither与此类似,但不是简单的理论就可以说得清楚的。在众多的Dither技术中,索尼(SONY)公司的SBM(SuperBitMapping,超级数码映像)、LIVESTUDIORECORDINGS的ULTRAMATRIXPROCESSING(超级矩阵处理)都是专攻20Bit转16Bit的技术。Dither的数字音讯处理用途非常广泛,凡是两个波形的相加、振幅的缩放、Normalize都会用到。现在的录音室已经发展到24Bit录音,在这个音乐CD还是主流储存媒体的时代,Dither还是非常重要的技术。顺便提一下,在影像处理领域,将24Bit的全彩图像以16Bit的高彩画面显示也会用到Dither的技术。
Jitter:一般翻译作时基误差,是数字音讯播放音质劣化的原因之一。Jitter会造成声音的改变,成因并非振幅信息本身的错误,而是时间部分出错。在前文数字化的过程中我们知道一个采样点包括振幅和时间这两项信息,而Jitter造成振幅没有在准确的时间呈现出来就使得波形扭曲。在普通的CD唱机中,由于读取机构是由信息流量来判断转速是否合适,而电路的工作时基又是以读出的一连串数字信号的多少来决定,因此当转速不稳定时,每秒读出的信息数量就有误差,而电路工作时基就受到影响,由电路工作时间所决定的各个采样点的出现时间与实际的时间就产生误差,这就是Jitter的成因之一。还有很多影响工作时脉的因素可能造成Jitter,例如音乐CD的重量与厚度是否均匀影响转动稳定性、反射面的材质、石英震荡的品质、CD转盘到DAC解码器之间的连接线都会造成Jitter.避免Jitter发生最直接的方法就是re-clock,将接收的数字信号先存到缓冲存储器中,在精确的时钟工作下重新送出这些数字信号,并且让后续的数字电路以这个时钟为工作基准。有些Hi-End器材使用不同于普通S/PDIF的单线数字传输接口,加入了包含时钟信号的接线。而S/PDIF将工作时基信息藏在信息的变化中,因此信息流量会影响工作时脉。
为了让读者对Jitter有更深刻的认识,笔者在此提出一个相关实验:准备一张音乐CD,通过这张母盘再复制一张音乐CD,然后用抓音轨软件检查确保这两张音乐CD的信息内容相同。可是,放入CD唱机中聆听时却发现两张CD的音质还是有很大差异。开始笔者猜测是因为CD唱机的读取机制不如计算机光驱精确,尝试用DigitalAudioLabs公司出品的专业声卡CardDeluxe录制从CD唱机数字输出(SPDIFOut)的数字录音信号,再经过多次对比,我们发现数字录音的结果与直接抓音轨的信息内容相同,也就是说CD唱机读取信息内容并没有问题,而影响音质的主要原因就是Jitter——单位时间信息流量不稳定的变动造成Jitter,但这些信息内容本身并没有出错,因此不能单从数字录音的信息发现错误。
推荐阅读