音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 18608|回复: 1

[教程] 电脑与声音

[复制链接]

2万

积分

4

听众

-1449

音贝

音频应用初级会员

Rank: 6Rank: 6

积分
28492
发表于 2007-10-12 | |阅读模式
音频应用公众号资讯免费发布推广
看看声音
+ m5 c8 ]8 @) a  }7 A7 I& W7 g3 \& s9 ?( u2 l. L: y5 I' o
声音是听的,怎么能看?别急,听我慢慢道来。同学们可以在物理课里了解到,声音是一种波,波是起伏的,具有周期性和一定的幅度。周期性表现为频率,控制音调的高低。频率越高,声音就越尖,反之就越沉。比如说男生的声音都比较低沉,就是因为男生的声带较宽,发出的声音主要集中在低频部分的缘故。图1和图2就分别是1000Hz和100Hz的声音波形图,这两段声音的长度都是0.01秒。 7 b. ~+ O  ?* y, m; P' T
060708131678325.gif : K5 H* s9 D2 V

6 m% Y1 i" G1 {- N图1   060708131678323.gif
; h" w) X8 n: E5 H4 e3 o
/ p! k$ |* G. h2 p图28 ?+ {! o% v- Q1 B, Z
8 [' D& ?& [# R0 A4 Z2 i; q
幅度控制的就是声音的音量了,幅度越大,声音越响,反之就越弱。图3中的波形也是1000Hz 0.01秒,但幅度与图1不同。说说看,哪个声音更大?
1 ~6 w8 @! ^' U' o+ |; a; H 060708131678324.gif - x( H, A* h& \' \
图37 G, ~/ P1 @% i" U
' g6 a# z% f- l& f, @  Y
电脑发声
; F1 n( G* H! c9 B3 Y0 f
) [2 a: }8 D0 i( G0 d4 b; d9 }我们说话是靠声带的振动,电脑中产生声音(电源风扇或硬盘、光驱的噪音不在其内)是通过声卡产生特定的电信号,从而控制喇叭发出声音。电脑的声音由于产生机制的不同而分为两种:合成音乐和数字声音。
: a& {+ J% X5 M3 T# {2 ]% H; U3 {  x2 m$ \* g/ [: }. j6 i) {8 e
合成音乐指的是根据乐谱去演奏乐器的声音而组合形成的音乐。目前的主流声音卡都是使用波表(Wave table)合成法,也就说使用真正乐器的数字声音来演奏乐谱。影响合成音乐的质量因素主要有:波表数据的真实性、可以同时演奏乐器的通道数(复音数)、是否支持合唱和混响等。在后面将要提到的MIDI就是合成音乐的标准。. O3 m4 D2 F* K' \- ?
6 [; I' R. s3 R
数字声音是指将人听到的声音(又称为模拟声音)进行数字化转换(量化)后得到的数据。这一转换过程在使用计算机进行录音时由声卡自动完成,又称为模/数转换。但由于扬声器只能接受模拟信号,所以声卡输出前要还要把数字声音转换回模拟声音,也即数/模转换。, o6 |+ Q% s# v# ?& v) \

% [/ j9 ~8 V. c: i声音质量( N: k( E+ c1 j% G1 @3 p
$ j: G+ R( F; s5 w- y- _  l, i$ ~3 ]
影响数字声音质量的主要因素有三个:采样频率、数字量的位数(简称量化位数)以及声道数。. R5 _" E. @9 r4 V, C# ?

0 E! u2 I* w# T; ^% C7 u采样频率决定的是声音的保真度。具体说来就是一秒钟的声音分成多少个数据去表示。可以想象,这个频率当然是越高越好。频率以kHz(千赫兹)去衡量。44.1kHz表示将一秒钟的声音用44100个采样样本数据去表示。目前最常用的三种采样频率分别为:电话效果(11 kHz)、FM电台效果(22 kHz)和CD效果(44.1 kHz),市场上的非专业声卡的最高采样率为48kHz,专业声卡可高达96kHz或以上。一般人的耳朵能听到的频率范围是从20Hz到20kHz。而将声音数字化之所以需要44.1kHz是因为根据采样原理,采样频率至少是播放频率的两倍才足以在播放时正确还原。再考虑到有些乐器发出的高于20kHz的声音对人也有一定的作用,所以定在44.1kHz。8 r, S. F5 b& w; {  @( c

" ^+ c. @8 j& i) t) A& u: L量化位数表示的是声音的振幅,决定的是音乐的动态范围,所谓动态范围是波形的基线与波形上限间的单位。简单地说,位数越多,音质越细腻。量化位数主要有8位和16位两种。8位的声音从最低到最高只有28=256个级别,16位声音有216=65536个级别。专业级别使用24位甚至32位。- [8 Y7 x# @# N0 I
2 Z. E& D* P& t9 V2 |: C4 c) I( X
下面是两幅关于声音量化的说明图:
! F5 y$ |8 B# Y  C5 e8 p+ k6 W' a! b, K, d( s6 u: A" T$ o1 u
    060708131678321.gif  
! U( f% w3 `% o4 I+ ?% X
0 d- n) P( q( E声道数表明在同一时刻声音是只产生一个波形(单声道)还是产生两个波形(立体声双声道)。顾名思义,立体声听起来比单声道具有空间感。
+ r& ?& D; g) Q+ k  P0 _- J9 o: n" ]. a4 p
声音数据量一般都被称为海量数据。这是因为对音质要求越高,数据量就越大。大家平时听的CD的质量是44.1kHz、16位的立体声音乐,一分钟这种质量的声音就需要10M字节的存储空间。因此,需要采用压缩技术,才能方便地进行声音的传送。比如现在非常流行的MP3,就是一种压缩技术。这就涉及到了声音的处理。6 }5 d$ B! _( Q, z" N7 G

) [% u4 Z! t) J7 y* k; q% x数字声音处理
1 ~% v* u  c0 u: r) C
+ |" Z1 I8 i8 U6 \- u! {* ?数字声音的处理主要分为三个方面:压缩、编辑和效果处理。  Y$ l! B0 E. q' r& t, E
" B* E+ Y/ o4 T4 S" J
我们刚才谈到的MP3技术就是对数字声音的压缩处理的一种。目前有很多种对声音进行压缩的方法,各有不同的应用范围,比如程控交换电话中的是ADPCM(差分脉冲编码调制),手机中用的是GSM,而对于音乐,用的就是MP3了。
$ V" J) J, P  i; r. p- g  ?" n9 }
0 k, H% J( e8 F2 t压缩的目的就是降低数据量,以便于传输,这一过程称为编码。而在播放时,便需要有一个解码的过程,将压缩了的数据还原为可以直接播放的数字声音。比如现在非常流行的WINAMP,就是从播放MP3这一个功能起家的。7 M7 c6 b$ W8 t2 _
8 u9 e2 B, A! M  @- f) c0 \+ U
声音的编辑常常是进行分段、组合、首尾处理等,类似于我们对文本进行编辑。效果处理也常常放在编辑操作中同时进行。常用的处理有回声处理、倒叙处理、音色效果处理等等。在这里给大家介绍一个适合入门者使用的中文免费软件:WaveCN。/ u. f9 c! S" B8 z6 B

& `8 X' i: m: X6 S3 l1 }音质的判断
( H0 H! @- i1 r# D, e5 _0 h6 N# Z' t+ Y
在对数字声音进行处理时,都希望得到效果好的声音,可究竟怎么样才算效果好呢?除了前面提到的那几个基本因素之外,还有一些主观上的音质判断,比如清晰与浑浊、圆润与发毛、临场感、立体感等等。
! V2 s. X: d5 A4 E! v3 s! c7 X: |# v! j* w7 U8 I* p1 P0 Y4 p
音质判断一般都需要受过专业训练的人才能掌握,不过也有普通人也可以明白的,比如立体感。立体感就是听者能否根据声音的变化去判断音源的位置。对于游戏玩家来说,游戏中的声音是否具有立体感是非常重要的。现在许多流行的游戏都在这方面狠下工夫,力求给玩家营造置身其中的感觉。比如Need For Speed系列,很早就已经支持Dolby环绕立体声,增加驾驶的真实感;又如Delta Force这一类第一人称射击游戏通过支持Direct Sound 3D技术来使得玩家可以通过敌人开枪的声音来判断敌人的方位、子弹的来路(否则就死得不明不白了)。6 X# x( i! T% U6 t2 W
3 }& Y& s$ K6 t9 \; O$ K
    在这里介绍了这么多,其实只是电脑声音这门学科中的一小部分,在计算机领域里声音的应用是非常广泛的,包括语音识别、语音合成等等,以后慢慢就会接触到的了。
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

1991

积分

2

听众

-203

音贝

音频应用新手发布

Rank: 3

积分
1991
发表于 2007-10-31 |
好文章,不错啊,点赞一下,我收藏了啊!~!!!
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表