无论现在的多媒体电脑功能如何强大,其内部也只能处理数字信息。而我们听到的声音都是模拟信号,怎样才能让电脑也能处理这些声音数据呢?还有,究竟模拟音频与数字音频有什么不同呢?数字音频究竟有些什么优点呢?这些都是我们下面所要介绍的。 把模拟音频转成数字音频,在电脑音乐里就称作采样,其过程所用到的主要硬件设备便是模拟/数字转换器(Analog to Digital Converter,即ADC)。采样的过程实际上是将通常的模拟音频信号的电信号转换成许多称作“比特(Bit)”的二进制码0和1,这些0和1便构成了数字音频文件。如下图,图中的正弦曲线代表原始音频曲线;填了颜色的方格代表采样后得到的结果,二者越吻合说明采样结果越好。
上图中的横坐标便是采样频率;纵坐标便是采样分辨率。图中的格子从左到右,逐渐加密,先是加大横坐标的密度,然后加大纵坐标的密度。显然,当横坐标的单位越小即两个采样时刻的间隔越小,则越有利于保持原始声音的真实情况,换句话说,采样的频率越大则音质越有保证;同理,当纵坐标的单位越小则越有利于音质的提高,即采样的位数越大越好。有一点请大家注意,8位(8Bit)不是说把纵坐标分成8份,而是分成2^8=256份;同理16位是把纵坐标分成2^16=65536份;而24位则分成2^24=16777216份。现在我们来进行一个计算,看看一个数字音频文件的数据量到底有多大。假设我们是用44.1kHz、16bit来进行立体声(即两个声道)采样,即采样成标准的CD音质(也称作红皮书音频)。那么就是说,一秒钟内采样44.1千次,每次的数据量是16×2=32bit(因为立体声是两个声道)。而大家知道,一个字节(Byte)含有8个位(Bit),那么一秒钟内的数据量便是44.1k×32bit /(8bit / Byte)=176.4 kByte。一个汉字在电脑里占用两个字节,那么176.4kB的空间可以存储 176.4k / 2=88200个汉字,也就是说一秒钟的数字音频数据量与近九万个汉字(一部中篇小说)的数据量相当。由此可见,数字音频文件的数据量是十分庞大的。
也许有人会问,为什么要把CD音质的采样频率规定成44.1kHz而不是其他的频率呢?这个问题问得好。44.1kHz意味着每秒采样四万多下,这会不会太多了点呢?究竟每秒采样多少次才算合理呢?大家请看下图。图中,上半部分表示原始音频的波形;下半部分表示录制后的波形;红色的点表示采样点。
大家可以发现,上下波形之所以不吻合,是因为采样点不够多,或严谨一点说,是采样频率不够高。这种情况,我们称之为低频失真。
|