音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 15250|回复: 3

[音频] 音频硬件发展史,以及DSD是如何产生的 一起说一说音频

[复制链接]

1万

积分

2

听众

-1464

音贝

音频应用注册会员

Rank: 4Rank: 4

积分
10835
发表于 2007-6-9 | |阅读模式
音频应用公众号资讯免费发布推广
说到音频设备的硬件,无一不提到的就是DAC

对于硬件感兴趣的朋友们可以进来看看

不感兴趣的可以点击右上角的红叉

我还是想强调一下关于DSD以及模拟味这个东东

尽量用比较直白的话把音频阐述清楚

DAC 顾名思义,数模转换器

数模转换器负责将101010101数字信号转换成耳朵可以听到的声波模拟信号。

这个过程是非常漫长的,

打个比方

假如一首歌的大小是3分钟,这首歌的容量是5mb大小

播放器需要把FLAC、APE、MP3等压缩文件进行解压缩,解压缩成WAV这种直流无压缩音频

比如解压缩之后,WAV格式达到了20mb大小

然后播放器需要将WAV音频,这20mb大小的文件,平均拆分成3分钟,均匀地送给DAC慢慢解码

如果这20mb大小的文件一瞬间送给DAC,1秒转换完成,那么听到的将会是爆音。

那么,这里面就涉及到,如何将20mb大小的文件平均拆分成3分钟的问题。

如果时钟不够精准,那么音频文件会多多少少产生一些错位,当然这些错位是非常小的,或者说叫做时机抖动

抖动分为很多种类,当然,这种情况就是非常细微的时间上的抖动。

这种细小的抖动可能会让人产生不耐听的厌烦感,但不至于让歌曲产生爆音。

这种时间上的抖动,大多源自CPU,CPU负责解压缩音频文件,但CPU可不保证能够均匀输送数据
早期的电脑,程序一多,就能够感到音质明显的下降,或者产生爆音,这就是CPU带来的时间上的错误。

早期的DAC,数字模拟转换器,只有一个功能
那就是数字转换模拟

那时候是最纯正的声音也可以这样理解。

但是人们无法满足。

因为,人们又发现,PCM这种采样,也就是奈奎斯特采样,人们发现了这种采样会产生高频部分的镜像噪声

想深度研究的朋友们可以看Delta-Sigma Data Converters这本书
作者:Norsworthy, Steven J./ Schreier, Richard (EDT)/ Temes, Gabor C. (EDT)/ Norsworthy, Steven J. (EDT)/ Schreier, Richard/ Temes, Gabor C.

这部分高频镜像噪声的能量非常大,在一些非线性模拟电路里很有可能折射到人耳可以听到的20K以内,影响听感,并且影响DAC性噪比。

人们为了滤除这种让人恼怒的镜像噪声,早期的解决办法就是
在模拟部分加入LPF:低通滤波器

滤除20K以上的杂波

但是由于这部分采样噪声太接近20K了,模拟低通滤波器需要串联好多运放进行联合滤除

但是DAC的信噪比依然很低。

模拟低通滤波器也有很多不稳定的地方
毕竟他处理的是模拟信号

大家也知道,不同的运放有不同的音色

受温度、体积、布线等因素,当然还有成本考虑

数字滤波器就诞生了

数字滤波器对比传统的模拟滤波器

更精准

相位更线性

不会受零件(电容、电阻、运放、温飘)等影响

更灵活

容易仿真

数字在采样周期就可以计算完成,而模拟滤波器要抗锯齿,高频率

数字滤波器需要DAC(一般播放器)、或者独立DSP完成(高档播放器)

加入了数字滤波器的DAC芯片,分分钟把信噪比秒到了110db+的节奏
这在早期音频是难以想象的。

数字滤波器在DAC芯片的前方工作,

他的工作原理基本上采用插值的办法

或者也叫做数字插值滤波器

对于原始音频进行插值,让镜像噪声远离20K,(20K内即是人耳可以听到的频率)

然后在DAC后边的部分只需要加入1-2枚简单的运放,进行简单的LPF过滤就可以了

这样的DAC史无前例的达到了110+db的信噪比,可以说比早期的旧款播放器提高了不止一个档次。

但是人们总是欲求不满的

为什么在加入了数字滤波器的DAC却丢失了老烧们所说的“味道”呢?

滤除噪声除了需要数字滤波器,而且需要噪声整形器
这两个部分就是决定机器档次和品质的关键成分之一。
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

1万

积分

2

听众

-1464

音贝

音频应用注册会员

Rank: 4Rank: 4

积分
10835
 楼主| 发表于 2007-6-14 |
他考虑但让CPU出来的数据后加入缓存,再分配全新的时钟。
其实现在很多的播放器都会加入FIFO这种缓存,就是如你想象的那样
再通过独立的时钟,使数据按照新的时钟传送给DAC芯片
当然这种工作方式是专业音频很少采用的
因为这样的工作是非常耽误时间的,
混音师要求时间上毫无延迟感,并且又要保证音质
那么是不是没有解决办法了呢?
当然不是
DPLL(数字锁相环)就可以完美解决。
当然,这种高级DPLL是非常昂贵的,也就是专业机器价格高的另一个原因。

DPLL数字锁相环主要由相位参考提取电路、晶体振荡器、分频器、相位比较器、脉冲补抹门等组成。分频器输出的信号频率与所需频率十分接近,把它和从信号中提取的相位参考信号同时送入相位比较器,比较结果示出本地频率高了时就通过补抹门抹掉一个输入分频器的脉冲,相当于本地振荡频率降低;相反,若示出本地频率低了时就在分频器输入端的两个输入脉冲间插入一个脉冲,相当于本地振荡频率上升,从而达到同步。
有一点运放中采用的“负反馈”的感觉,即:校正作用

当然DPLL是时钟上的校正器。

全新的ESS9018即是带有这样的DPLL,所以价格很高,受到专业厂家的青睐。

AVID、Weiss、Apogee等大牌厂家均采用9018

是不是采用了9018的机器抗抖动性能都很好呢?

由HIFIDIY广州线下活动可以看出
有些采用了ES9018的DAC,抗抖动性能并不是那么好





我们可以对比一下官方ES9018电路板的测试结果




测试项目为J-test测试

主要由测试仪添加抖动,测试DAC抗抖动性能如何

当然,你也可以这样理解

理解为这台机器吃不吃转盘

那么为什么同样含有DPLL的9018,测试结果却大相径庭呢?

我们查阅ESS的ES9018官方手册可以发现

ES9018的DPLL带宽可以编程

而且从默认(Defaults)到128x可以自由设定

带宽越宽,说明DPLL的作用越小,DPLL越容易锁定音源,并且抗抖动性能越不明显

一些日本人正在尝试No Bandwidth 也就是高难度的“无带宽”

这样的设定对于数字源的要求是非常苛刻的。








所以,我们不难看出,并不是用了ES9018的机器都可以完好DPLL

如果数字源的时钟抖动非常巨大,ES9018就会“失锁”并且自我降级

对我的感觉,好像是这枚DPLL并不是为了拯救抖动,而是考验抖动啊!

如果我们回到之前的话题

为什么加了数字滤波器的DAC,会丢失掉模拟味?

也就是老烧们说的:为什么现代音频设备,数码声

但是似乎又找不到什么借口,因为现代的音频设备确实指标很高

原来猫腻呢就出现在数字滤波器上

一些偏执的DIY狂人,坚持“回到过去” 他们制作出很多种NOS-DAC

NOS-DAC即是不含有数字滤波器的DAC






如图,方波由于傅里叶变换造成声音上的回波即是数码味的真正来源

如图,方波由于傅里叶变换造成声音上的回波即是数码味的真正来源
这种回波被称之为“吉布斯现象”

欧胜微电子(Wolfson)技术营销John Crawford表示,自从大约30年前CD播放器问世以来,人们就一直在抱怨数字音乐不够真实,无法带来美好的听觉感受。
究其原因,一个关键因素就是数据转换器内置的数字滤波器。
由于数模转换器中FIR滤波器的存在,会产生不自然的振铃和延迟。
在重现原始信号时,产生一定数量的误差,并损害原始信号。
这将直接影响人们对音乐品质的感受。
这也是数字回放一直存在的典型问题。
传统的滤波器封装主要关注的是频率响应控制,但却忽略了问题的关键所在。
Wolfson在其旗舰产品AudioPlus PureSound DAC WM8741中,开发了具有专利技术的数字滤波器,可以根据特定的要求裁减音频响应,使数字音乐更加真实和自然。
Crawford表示,WM8741的优势在于使用先进数字滤波器来裁减音频信号,并可以使之呈现完美的“模拟感觉”。

音频上的很多数字滤波器算法可以消除这样的回波。

当然,代价就是牺牲一部分的空间感和素质。

所以现在很多数字滤波器的精度由24bit上升到了32bit,这就意味着

其内部运算起点就有180db+的动态

很多人说我听CD格式才16bit

其实你听得早就不是原汁原味的CD啦,

你听到的是数字滤波器插值运算后的全新音频

索尼公司和飞利浦为了避免这种无聊的插值手段

开发出了全新的数据格式:DSD

DSD即:替你插值,帮您提前插好

而且这种插值是真实的声音采集,或者是电脑运算(假DSD)

最新的AKM4137就可以将PCM转换为DSD

由于DSD是1bit格式,当然有一些动态上的缺陷。

真正的次世代公认为是6bit新版本DSD,当然这种不伦不类的格式只有少数学究们和一部分厂家认同。

想具体了解DSD是如何记录声音的
可以维基一下:脉冲宽度调制、脉冲密度调制等 (PWM、PDM、SDM不分家,但本质与PCM不同)

英语:Pulse Width Modulation,缩写:PWM

想具体了解PCM是如何记录声音的
可以维基一下:脉冲编码调制

英文:Pulse-code modulation,缩写:PCM






在图标中,一个正弦波(红色曲线)被取样和量化为PCM。正弦波在每段固定时间内被取一次样,即x轴的刻度。而每一个样本则依照某种运算法(在这个例子中是ceiling function),选定它们在y轴上的位置。这样便产生完全离散的输入信号的替代物,很容易编码成为数字数据,以作保存或操纵。以右图为例,很清楚看出样本为9、11、12、13、14、14、15、15、15、14…等,将它们以二进制编码,就得到一组一组的数字:1001、1011、1100、1101、1110、1111、1111、1111、1110…等,这些数字数据之后就可以被特定用途的DSP或者一般的CPU所处理。有一些PCM数据流可以和较大的聚合数据流作多任务传输(multiplex),通常在物理层传输数据时都会这么作。这个技术称作 “时分多路复用(Time-Division Multiplexing,TDM)” (或 “分时多任务”,“时分复用”),非常广泛地使用,例如现代的公共电话系统。

有许多方法可以内置一个处理调制的真实设备。在真实系统中,这种设备一般被放在单一个芯片中,并搭配一个晶振,称作“模拟至数字转换器(analog-to-digital converter,ADC)”。这些设备通过晶振触动输入信号的接受,并且输出数字化的信号至某种处理器。

PCM有哪些限制:

可注意的是,在任何PCM系统中,本质上有两种损害的来源:

在量化时,取样必须迫于选择接近哪一个整数值(即量化误差)。
在样本与样本之间没有任何数据,根据取样原理,这代表任何频率大于或等于1/2fs(fs即采样率)的信号,会产生有损,或者完全消失(aliasing error)。(楼主之前提到的镜像噪声)这又称作奈奎斯特频率(Nyquist frequency)。

由于所有样本都依据时间取样,重制时至关重要的便是一个准确的晶振。如果编码或解码时,任何一方的晶振不稳定,频率漂移就会使输出设备的质量降低。如果两方的频率具有些微的差异,稳定的误差对于质量而言并非巨大的问题。但一旦晶振并非稳定的(即脉动的间距不相等),不论是音频或者视频上,都将造成巨大的有损。

可以总结一下,PCM系统主要受到镜像噪声以及晶振的影响

DSD:
脉冲宽度调制(英语:Pulse Width Modulation,缩写:PWM),简称脉宽调制,是将模拟信号 转换为脉波的一种技术,一般转换后脉波的周期固定,但脉波的占空比会依模拟信号的大小而改变。






DSD有效解决了镜像噪声的问题和晶振需求严格的双重问题
但不可避免带来音量上的缺乏
(主要因为早期音量竞赛引起的,感兴趣的朋友可以查看【回归理性】对话Thorsten·Loesch(解读PCM vs DSD ) )


DSD 2.8M可以和24bit 384K的PCM做数据转化

但是
转化后的PCM会丢失掉DSD的时域信息
转化后的DSD会丢失掉PCM的振幅信息

PCM吃晶振,吃滤波
DSD吃音量,吃磁盘空间

任何频率大于或等于1/2fs(fs即采样率)的信号,会产生有损,或者完全消失(aliasing error)。(楼主之前提到的镜像噪声)这又称作奈奎斯特频率(Nyquist frequency)

如果CD的取样是44.1K,那么22.05K的部分及以上部分一定会出现噪声

人耳的听力恰好是20K

如何滤波,就是早期人们考虑最多的事情

22.05K及以上部分,人耳本是听不到的,但是模拟电路非线性等缘故
很有可能将这部分高能量的镜像噪声折回20K以内,影响听感。

打个比方:测一排人的身高
1.8m,1.8m,1.5m,1.6m 这就是pcm的记录方式,
而dsd则是0,0,-0.3m,+0.1m


引用第75楼wxwxwx0于2014-08-20 23:10发表的 :


是这样的哈,完全没错,802味道好些,901细节和空间感要好
WM和AKM芯片采用的是滤波器1的工作方式,

我猜测模拟味要比市面上常用的滤波器3的工作方式有味道

这也是我本人特别喜欢AKM芯片的原因之一。(32bit,精度比WM更好)

当然,高端厂家完全不用考虑DAC自带数字滤波器的工作方式,他们都自己设计滤波器

所有的DAC都有外置的滤波器接口,9018也不例外

谢谢您帮我验证

我继续猜测,上一代芯片,便携设备不考虑用AKM主要原因就是因为耗电量太大

今年很多AKM旗舰芯片功耗降低了5倍,应该会有更多厂家愿意使用吧。
我大胆预言一下,不仅仅是什么七彩虹C5,将来将会有更多便携播放器采用AKM芯片

如果CS收购WM没什么大的动作,未来两年内,市面上的主流芯片将会被AKM霸占

说实话,AKM的内部数字滤波器和还好,倒是噪声整形器需要提高。

目前AKM比较头疼的部分就是抗抖动,当然这个技术部分被9018牢牢掌握

但是AKM芯片群延迟性能非常好。AKM可能会走PCM转化DSD的思路,缩小DAC对于时钟上的要求

目前时钟技术被两家公司牢牢掌握,1 ESS9018, 2 Prismsound
(Prismsound的2ndDPLL和SNS噪声整形技术震撼强劲)

所以你可以看到Prismsound就没有像其他公司一样如此依赖9018

今年AKM有一个小动作就是在他家旗舰DAC产品,比如AK4495 或AK4490身上加入“海湾倍泉增”(谷歌翻译)开关电容滤波器,用来缓解时钟抖动英文原称“OSR Doubler”电容滤波器
The AK4490 integrates a newly developed switched capacitor filter “OSR Doubler”, making it capable of supporting wide range signals and achieving low out-of-band noise while realizing low power consumption

为什么大多数便携设备都要用滤波器3

因为这种简单的滤波方式能够最佳还原声场和空间感,能在短时间PK中产生一耳朵差距

当然缺点就是没有味道(所以有时候逃不出老烧们的法耳)
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

1万

积分

2

听众

-1464

音贝

音频应用注册会员

Rank: 4Rank: 4

积分
10835
 楼主| 发表于 2007-6-14 |
滤波器3会有什么缺点

1,假细节

2,数码声

3,不耐听

优点:

1,高素质

2,高结像

引用第80楼workwonder于2014-08-21 01:08发表的 :


评价一下国内的乐之邦的数字音频技术怎么样?

乐之邦和QLS目前停留在励志在CPU部分下功夫

他们致力于CPU部分,也就是说尽量在数据源头产生更低的时机抖动

这样解决问题的优点就是便携播放器解构更加精简化

缺点就是台式机无法保证长距离传输稳定

但是目前在数字滤波器和噪声整形这个部分,还没有什么国产厂家可以做出来。

其实音频部分真正的技术含量依然是集中在数字滤波器、噪声整形器、DPLL这三个方面

DPLL可以依赖ES9018帮助解决,但是数字滤波器、噪声整形器这两个部分可以依赖AKM芯片

看取舍吧。

目前绝大多数DIR芯片(同轴、光纤接收芯片)都有一个简单的PLL尽量不使长距离传输产生抖动

高档的DAC会在同轴、光纤接收后加入FIFO缓存,(FIFO的难度其实很大)

这也就区分出有些机器吃转盘,有些机器不吃转盘

什么叫做吃转盘

就是可以理解为这台DAC拿到数字信号后的信号重新整理能力

Prismsound公司的绝大部分高端设备都有数字信号整形功能

即:就算是垃圾转盘,通过数字整形,也可以得到非常优秀的数字信号

所以我们不能一概而论贬低说有些人能听出来USB线材对声音造成的影响,

具体还要看不同的机器是如何设计的。




数字音频S/PDIF格式的传输
平衡传输方式,我认为在民用音响中是没必要,在专业领域里由于可能要传输的线路很长,所以用平衡的方式比较好。在我们一般的发烧器材中,最长不过就是1米多,这种情况下是没有必要用平衡性线的。在AP-2007这样很专业的测试仪器中的平衡端口其实也是负端接地的,并不是真正平衡方式,也就可以看出,短距离传输用平衡的方式是完全没必要的。(为什么平衡接口和非平衡接口的音质不一样,主要原因是电路不同造成的,通常非平衡耳机插口的LPF电路要比平衡电路多一级运放滤波)

光纤传输可以很好实现电气隔离,使数字音源和解码器之的地线也完全隔离,减少了串扰的几率。但是就目前数字音频专用光纤来说,其存在传输速率低的弊端,同时由于光反射等因素造成信号抖动比较大。因此光纤传输基本都是用于如CD随身听的数字输出等一般的娱乐消费品上。在传输速度上,实测只能达到96KHz的取样率,为了能有更好的输出波形,光纤头的输出脚接一个10K的上拉电阻,但是所测到的信号波形还是犹如三角波一般。而当输出信号取样率高达192KHz时,则经光纤头转换出的电信号波形则完全变了样,就像很尖锐的锯齿一般,这时候DAC的模拟输出是一片噪声,或者有模拟信号输出而夹带很大的爆音。

Hi-Fi音响中,最合适的数字音频传输方式还是同轴传输线方式。其构造是中心是一条实心导体,外套金属导管,其中两导体之间的填充物的介电常数和两导体之间的半径比例共同决定了该同轴传输线的特征阻抗。在数字音响中,通常使用的是特征阻抗为75欧姆的同轴传输线,在传输线的两端所接的负载都为75欧姆,使信号无反射实现低抖动传输。现在很多人RCA头代替75欧姆BNC头,而RCA头是普通低频用接头,其在高频状态下所呈现的特征阻抗没有被人为设计,所以可能会严重偏离75欧姆,从而使传输线在接头处出现阻抗不连续而发生反射等。有更甚的直接用模拟音频屏蔽线代替同轴电缆,这种情况下不但传输线特征阻抗严重偏离75欧姆还可能是传输线的特征阻抗分布参数不连续也就是说这条线在不同点上所呈现的阻抗是不一样的,这是产生的反射情况更加复杂,使抖动增加可能性更大。虽然就算是传输192KHz取样率/24bits的数字音频信号,其SPDIF信号的速率也只有10Mb/s也就是最高频率也就10MHz不会形成明显的反射,但是挑剔的发烧友眼中是容不下一粒沙的,与其用使用昂贵的发烧保险丝籍以改善音质,还不如在这些不符合理论要求的细节上做完善可能带来更大的音质提高,一个普通镀镍的BNC头要好过一个镀满纯金的RAC头。

欢迎厂家入驻,推文!免费!微信:yinpinyingyong

2万

积分

6

听众

-72

音贝

音频应用初级会员

Rank: 6Rank: 6

积分
28283
发表于 2007-6-18 |
我来支持了!:lol
问好!
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表