音乐音效软件合成

5628960 · 发表于 2007-6-26

声卡的技术指标很多，以下是各种具体指标的具体含义。如果您是个专业级的音响发烧友，这些牵涉到声音质量的具体指标可不能不看。

目录 [隐藏]
1 S/PDIF
2 采样位数与采样频率
3 复音数
4 动态范围
5 API接口
6 HRTF
7 ASIO
8 AC-3
9 DLS技术
10 SB1394标准

S/PDIF
S/PDIF是SONY、PHILIPS家用数字音频接口的简称，可以传输PCM流和Dolby Digital、dts这类环绕声压缩音频信号，所以在声卡上添加S/PDIF功能的最重大意义就在于让电脑声卡具备更加强大的设备扩展能力。S/PDIF技术应用在声卡上的表现即是声卡提供了S/PDIF In、S/PDIF Out接口，如果有数字解码器或者带有数字音频解码的音箱，你就可以使用S/PDIF接口作为数码音频输出，使用外置的DAC（Digital-Analog Converter：数字→模拟转换器，简称数模转换器）进行解码，以达到更好的音质。

S/PDIF接口一般有两种，一种是RCA同轴接口，另一种是TOSLINK光缆接口。其中RCA接口（是非标准的，它的优点是阻抗恒定、有较宽的传输带宽。在国际标准中，S/PDIF需要BNC接口75欧姆电缆传输，然而很多厂商由于各种原因频频使用RCA接口甚至使用3.5mm的小型立体声接口进行S/PDIF传输。

在多媒体声卡上，S/PDIF分为输出和输入两种形式，也就是通常所说的S/PDIF OUT和S/PDIF IN。声卡的S/PDIF OUT主要功能是将来自电脑的数字音频信号传输到各种外接设备。在目前的主流产品中，S/PDIF OUT功能已经非常普及，通常以同轴或者光纤接口的方式做在声卡主卡或者数字子卡上。而S/PDIF IN在声卡中主要功能则是接收来自其它设备的PCM信号，最典型的应用就是CD唱片的数字播放。虽然所有CD-ROM都具有CD播放能力，但效果有优劣之分。主要原因在于CD-ROM所采用的DAC品质不同，从而造成了效果上的差异。但如果你的声卡上拥有一个两针的S/PDIF IN插口，那么就可以通过一条两芯的数字CD信号传输线连接到CD-ROM的Audio Digital Out接口。这样当播放CD唱片的时候，CD上的PCM信号就不经过DAC，而直接被输出到声卡上，随后再由声卡进行D/A转换或者通过S/PDIF OUT输出。一般声卡CODEC芯片的D/A转换品质总是好过CD-ROM上的DAC，因此通过S/PDIF技术，CD播放质量就被有效提高了。

采样位数与采样频率
音频信号是连续的模拟信号，而电脑处理的却只能是数字信号。因此，电脑要对音频信号进行处理，首先必须进行模/数（A/D）的转换。这个转换过程实际上就是对音频信号的采样和量化过程，即把时间上连续的模拟信号转变为时间上不连续的数字信号，只要在连续量上等间隔的取足够多的点，就能逼真地模拟出原来的连续量。这个“取点”的过程我们称为采样（sampling），采样精度越高（“取点”越多）数字声音越逼真。其中信号幅度（电压值）方向采样精度，我们称之为采样位数（sampling resolution），时间方向的采样精度称为采样频率（sampling frequency）。

采样位数指的是每个采样点所代表音频信号的幅度。8bit的位数可以描述256种状态，而16bit则可以表示65536种状态。对于同一信号幅度而言，使用16bit的量化级来描述自然要比使用8bit来描述精确得多。其情形就尤如使用毫米为单位进行度量要比使用厘米为单位要精确一样。一般来说采样位数越高，声音就越清析。

采样频率是指每秒钟对音频信号的采样次数。单位时间内采样次数越多，即采样频率越高，数字信号就越接近原声。采样频率只要达到信号最高频率的两倍，就能精确描述被采样的信号。一般来说，人耳的听力范围在20hz到20Khz之间，因此，只要采样频率达到20Khz×2=40Khz时，就可以满足人们的要求。现时大多数声卡的采样频率都已达到44.1或48Khz，即达到所谓的CD音质水平了。

复音数
在各类声卡的命名中，我们经常会发现诸如64、128之类的数字。有些用户乃至商家将它们误认为是64位、128位声卡，是代表采样位数。其实64、128代表的只是此卡在MIDI合成时可以达到的最大复音数。所谓"复音"是指MIDI乐曲在一秒钟内发出的最大声音数目。波表支持的复音值如果太小，一些比较复杂的MIDI乐曲在合成时就会出现某些声部被丢失的情况，直接影响到播放效果。复音越多，音效越逼真，但这与采样位数无关，如今的波表声卡可以提供128以上的复音值。

另外需要注意的是"硬件支持复音"和"软件支持复音"之间的区别。所谓"硬件支持复音"是指其所有的复音数都由声卡芯片所生成，而"软件支持复音"则是在"硬件复音"的基础上以软件合成的方法，加大复音数，但这是需要CPU来带动的。眼下主流声卡所支持的最大硬件复音为64，而软件复音则可高达1024。

动态范围
动态范围指当声音的增益发生瞬间态突变，也就是当音量骤然或突然毫米波时，设备所有名承受的最大变化范围。这个数值越大，则表示声卡的动态范围越广，就越能表现出作品的情绪和起伏。一般声卡的动态范围在85dB左右，能够做到90dB以上动态范围的声卡是非常好的声卡了。

==Wave音效与MIDI音乐==

WAVE音效合成与MIDI音乐的合成是声卡最主要的功能。其中WAVE音效合成是由声卡的ADC模数转换器和DAC数模转换器来完成的。模拟音频信号经ADC转换后为数字音频后，以文件形式存放在磁盘等介质上，就成为声音文件。这类文件我们称之为wave form文件，通常以.wav为扩展名，因此也称为wav文件。WAVE音效可以逼真地模拟出自然界的各种声音效果。可惜的是wav文件需要占用很大的贮存空间，也正是这个缺点，造就了MP3的成长。

MIDI，即乐器数字化接口，是一种用于电脑与电子乐器之间进行数据交换的通信标准。MIDI文件（通常以.mid为文件扩展名）记录了用于合成MIDI音乐的各种控制指令，包括发声乐器、所用通道、音量大小等。由于MIDI文件本身不包含任何数字音频信号，因而所占的贮存空间比wav文件要小得多。MIDI文件回放需要通过声卡的MIDI合成器合成为不同的声音，而合成的方式有FM（调频）与Wave table（波表）两种。

大多数廉价的声卡都采用的FM合成方式，FM合成是通过振荡器产生正弦波，然后再叠加成各种乐器的波形。由于振荡器成本较高，即使是OPL3这类高档的FM合成器也只提供了4个振荡器，仅能产生20种复音，所以发出音乐听起来生硬呆板，带有明显的人工合成色彩。与FM合成不同，波表合成是采用真实的声音样本进行回放。声音样本记录了各种真实乐器的波形采样，并保存在声卡上的ROM或RAM中（要分辨一块声卡是否波表声卡，只需看卡上有没有ROM或RAM存储器即可）。目前中高档声卡大都采用了波表合成技术。

==输出信噪比==

“输出信噪比”是衡量声卡音质的一个重要因素，其概念为——输出信号电压与同时输出的噪音电压的比例，单位是分贝。这个数值越大，代表输出时信号中被掺入的噪音越小，音质就越纯净。声卡作为电脑的主要输出音源，对信噪比要求是相对较高的。由于声音通过声卡输出，需要通过一系列复杂的处理，所以决定一块声卡信噪比大小的因素也有很多。由于计算机内部的电磁辐射干扰很严重，所以集成声卡的信噪比很难做到很高，一般其的信噪比在80dB左右。PCI声卡一般拥有较高的信噪比（大多数可以轻易达到90dB），有的高达195dB以上。较高的信噪比保证了声音输出时的音色更纯，可以将杂音减少到最低限度。而音色的好坏则取决于产品所选用的音效芯片和卡的做工。如果可能的话，购买声卡前最好先进行试听，如果实在没有得试听的话，可以多留意周围媒体对它的评价，或许对你的选购有一些帮助。

API接口
API就是是编程接口的意思，其中包含了许多关于声音定位与处理的指令与规范。它的性能将直接影响三维音效的表现力，主要有下面几种：

Direct Sound 3D
Direct Sound 3D，是微软公司提出的3D效果定位技术，它最大特点就是硬件无关性，在声卡出现初期，许多声卡芯片没有自己的硬件3D音效处理能力，都是使用这种Direct Sound 3D来模拟出立体声。它所产生的效果均由CPU通过即时运算产生，比较耗费CPU资源，所以，此后推出的声卡都拥有了一个所谓的“硬件支持DS3D”能力。如果你在选购声卡时听销售商说声卡支持D3D多么好的话，千万不要就轻信这是一块好声卡，其实际听觉效果要看声卡自身采用的HRTF算法能力的强弱而定。
A3D
A3D是Aureal公司开发的一项专利技术。它是在Direct Sound 3D的API接口基础上发展起来的。A3D最大特点是能以精确定位（Positional）的3D音效增加新一代游戏软件交互的真实感，这就是通常所说的3D定位技术。A3D目前有1.0、2.0和A3D3.0三个版本。1.0版包括A3D Surround和A3D Interactive两大应用领域，特别强调在立体声硬件环境下就可以得到真实的声场模拟，A3D 1.0中同时间内只能处理8个音源，取样频率是22kHz，AUREAL声卡中的AU8820芯片使用的就是这种技术。2.0则是在1.0基础上加入了声波追踪技术，进一步加强了性能，A3D 2.0同时则可以处理16个音源，取样频率已达48kHz，它是当今定位效果最好的3D音频技术之一，AU8830芯片就支持这种技术。至于3.0版本早就被提出了，不过由于Aureal公司已经被创新收购，A3D3.0的前途还是个未知数。
由于Aureal的A3D技术在3D定位及交互性声音处理（这是两大关键部分）方面具有优势，加之支持Direct Sound 3D硬件加速，因而很多游戏开发商都是基于A3D进行3D游戏开发的。不过由于实现起来成本颇高，因而并不是每块PCI声卡都支持该技术。

A3D Surround
A3D Surround吸收了A3D技术和环绕声解码技术（如Dolby的 ProLogic和AC-3）之精华，突出特点是只使用两只普通音箱（或一副耳机）在环绕三维空间中，进行声音的精确定位（也就是说可产生与五个“虚拟音箱”相同的效果）。当然，这五组音频流并不像传统的“家庭影院”那样需要用5个实际的音箱进行回放，它实际上只是经过A3D Surround处理后用两个音箱播放出来的。这一技术被杜比实验室授予“Virtual Dolby”认证。
EAX
EAX是由创新公司在其SB LIVE！系列声卡中提出的标准，全名为Environmental Audio Extension，即环境音效。EAX是建立在DS3D上的，只是在后者的基础上增加了几种独有的声音效果命令。EAX的特点是着重对各种声音在不同环境条件下的变化和表现进行渲染，但对声音的定位能力不如A3D，EAX建议用户配备4声道环绕音箱系统。现在支持EAX2的主要就是EMU10K1和MU10K2芯片，它们分别为创新著名的SB Live!和Audigy系列声卡所采用，该芯片同时还支持A3D1、HRTF等技术，是目前流行兼容声卡中的精品。
注：目前，A3D和EAX是API接口中的两大流派，你在购买的时候，最好弄清楚选择的声卡支持哪些音效，所支持的版本是多少，是软件模拟还是硬件支持，这些都是十分关键的。

HRTF
HRTF是Head Related Transfer Function的缩写，中文意思是“头部对应传输功能”，它也是实现三维音效比较重要的一个因素。简单讲，HRTF是一种音效定位算法，它的实际作用在于用数字和算法欺骗我们的耳朵，使我们认为自己处了一个真实的声音环境中。3D定位是通过声卡芯片采用的HRTF算法实现的，定位效果也是由HRTF算法决定的。象Aureal和Creative这样的大公司，他们既能够开发出强大指令集规范，同时也可以开发出先进的HRTF算法并集成在自己的芯片中。当然也有一些厂商专门出售或者为声卡订定各种各样的HRTF算法，比较有名的就要算Sensaura 3D和Qsound。Sensaura 3D是由CRT公司提供的。Sensaura，支持包括A3D 1.0和EAX、DS3D在内的大部分主流3D音频API，此技术主要运用于ESS、YAMAHA和CMI的声卡芯片上。而QSound开发的Q3D，主要包括三个部分，第一部分是3D音效和听觉环境模型，第二部分是立体音乐加强，第三个部分是虚拟的环境音效，可以提供一个与EAX相仿的环境模拟功能，但效果还比较单一，与Sensaura大而全的性能指标相比稍逊一筹。此外C-MEDIA在CMI8738上则使用自己的HRTF算法，称为C3DX，支持EAX和DS3D，实际效果很一般。

==IAS== IAS是Interactive Around-Sound的缩写，它是 EAR（Extreme Audio Reality）公司在开发者和硬件厂商的协助下开发出来的专利音频技术，该技术可以满足测试系统硬件、管理所有的音效平台的需求。开发者只需写一套音效代码，所有基于Windows 95/98/2000的音频硬件将通过同样的编程接口来获得支持。IAS为音效设计者管理所有的音效资源，提供了DS3D（Direct Sound 3D）支持。此外，它的音效输出引擎会自动配置最佳的3D音频解决方案，其中有四信道模式的声卡将是首要的目标。而DS3D 可以在现有的双喇叭平台上获得支持。

ASIO
ASIO是Audio Stream Input Output的缩写，可翻译为“音频流输入/输出”的意思。通常这是专业声卡或高档音频工作站才会具备的性能。采用ASIO技术可以减少系统对音频流信号的延迟，增强声卡硬件的音频处理能力。同样一块声卡，假设使用 MME 驱动时的延迟时间为750毫秒，那么当换成ASIO驱动后延迟量就有可能会降低到40毫秒以下。

但是并非所有的声卡都能够支持ASIO。ASIO不仅定义驱动标准，还必须要求声卡主芯片的硬件支持才能够得以实现。只有那些价格高贵的专业声卡，在设计中才会考虑到对ASIO的支持。我们常所用的声卡，包括创新过去的SB Live!系列都属于民用卡的范畴，没有配备了ASIO驱动的。不过创新SoundBlaster Audigy已经开始全面支持ASIO技术。

注：SB Live!的主芯片EMU10K1本身支持ASIO，只是这一性能并未在创新自带的LiveWare! 3.0驱动中体现出来。因此，当你将SB Live!的驱动程序换成采用同样规格设计的E_mu APS录音卡的驱动后，音频处理软件就会报告说找到ASIO！另外CMI8738本身也是具备ASIO的潜质，只不过至今还没有合适的驱动将其发挥出来。

AC-3
AC-3是完全数字式的编码信号，所以正式英文名为“Dolby Digital”，是由著名的美国杜比实验室（Dolby Laboratories）。Dolby的一个环绕声标准。AC-3规定了6个相互独立的声轨，分别是——前置两声道，后置环绕两声道，一个中置声道和一个低音增强声道。其中前置、环绕和中置五个声道建议为全频带扬声器，低音炮负责传送低与80Hz的超重低音。早期的AC-3最高只能支持5.1声道，在经过不断的升级改进，目前AC-3的6.1 EX系统增加了后部环绕中置的设计，让用户可以体验到更加精准的定位。

对于AC-3，目前通过硬件解码和软件解码这两种方式实现。硬件解码是通过支持AC-3信号传输声卡中的解码器，将声间进行5.1声道分离后通过5.1音箱输出。软件解码就是通过软件来进行解码的，（如DVD播放软件WinDVD、PowerDVD都可以支持AC-3解码，当然声卡也必须支持模拟六声道输出。），不过这种工作方式比较大的缺陷在于解码运算需要通过CPU来完成，会增加了系统负担，而且软解码的定位能力依然较逊色，声场相对较散。

虽然软件模拟AC-3存在着缺陷，其成本相对低廉，目前中低档的声卡大都是使用这种方式。

DLS技术
DLS全称为"Down Loadable Sample"，意为“可供下载的采样音色库”。其原理与软波表颇有异曲同工之处，也是将音色库存贮在硬盘中，待播放时调入系统内存。但不同点在于运用DLS技术后，合成MIDI时并不利用CPU来运算，而依靠声卡自己的音频处理芯片进行合成。其中原因在于PCI声卡的数据宽带达到133Mb/秒，大大加宽了系统内存与声卡之间的传输通道，PCI声卡就可使用先进的DLS技术，将波表音色储存于硬盘中，通过声卡芯片处理，在播放MIDI时调入内存。从而既免去了传统ISA波表声卡所要配备的音色库内存，又大大降低了播放MIDI时的CPU占用率。这样不但提供了良好的MIDI合成效果又可免去ISA波表声卡上必须配备的音色库内存，而且这种波表库可以随时更新，并利用DLS音色编辑软件进行修改，这都是传统波表所无法比拟的优势。

SB1394标准
SB1394是创新公司为达到高速数字音频传送（约400Mbps）所提出的IEEE1394兼容标准。创新的SB1394标准保证通过SB1394连接的1394接口设备可发挥最大效能，传输速度高达400Mbps，使主机与外设之间大文件的高速传送成为可能。Sound Blaster Audigy2声卡就内置SB1394，可通过IEEE 1394标准接口外接设备如DV摄象机等，并可连接63台电脑进行低延迟的联网游戏

帐号		自动登录	找回密码
密码			快速注册

[转载] 音乐音效软件合成