音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 18257|回复: 1

[资讯] 什么是物理建模合成?

[复制链接]

636

积分

3

听众

14

音贝

音频应用新手发布

Rank: 3

积分
636
QQ
发表于 2009-7-29 | |阅读模式
音频应用公众号资讯免费发布推广
什么是物理建模合成?

物理建模合成是一系列利用数学模型模拟声学乐器或其他发声物体物理特性的方法。具体而言,数学模型用于描述特定物体的物理特性,包括其形状、大小、材料以及受激时的振动或共振方式。通常情况下,这种方法是将建模对象分成若干部分。最基本的是两个部分:激励器和共振器。

640_wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1 (13).jpg
激励器模拟迫使物体振动的初始能量源。我们不会直接听到它的声音,但它会反映在模型的反应上。激励器通常取决于所建模的乐器,它的形状可以模拟琴弓、弹拨装置、呼吸或气流的行为。在实际应用中,激励器可以是简单的咔嗒声、异形噪音,甚至是预先录制的音频样本。
共鸣器代表模拟乐器的声共振特性。它表达了乐器的特征频率、谐波平衡以及声音随时间衰减的情况。根据具体情况,共鸣器模型可以代表弦乐器的主体、管乐器的气柱或鼓的膜和壳。谐振器的功能可以由一系列谐振滤波器、带反馈的延迟线或不同元素的组合来实现。
在进一步讨论之前,我们需要注意的是,虽然物理建模方法旨在模拟物理对象的行为,但模型一旦创建,我们就不再受物理领域的限制。因此,物理建模不仅能让我们模拟声学乐器,还为我们提供了一个探索奇异抽象概念的独特机会。例如,如果以近乎音频的速度拨动琴弦会怎样?又或者,你想尝试一种在弹奏时琴身逐渐膨胀的乐器?物理建模合成让这一切成为可能,可以说是超级物理建模。
物理建模合成的起源
640_wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1 (14).jpg

物理建模合成的最早形式是语音合成。几个世纪以来,人类一直试图制造出会说话的机器。在不同时期,他们取得了不同程度的成功。1769年,奥匈帝国发明家沃尔夫冈-冯-肯佩兰研制出第一台基于解剖学原理的功能性机械语音合成器--"说话机器"。该仪器由厨房风箱、从风笛上拆下的簧片和单簧管铃等一套简陋材料组装而成。虽然结构简单,但它却能发出一系列元音,在人工干预下,表演者还能提取出更多的发音转折。直到 1804年去世前,Kempler一直在不断改进这一装置。他又进行了两次重大改进,最后一次完全能够用多种语言说出整个句子。继肯佩伦的机器之后,其他语音合成工具也开始出现。其中,约瑟夫-法布尔制造的 "Euphonia "于 1846 年首次公开展出。Euphonia具有一个复杂的机械装置,包括一条电报线路、一系列风箱、板和腔体、一个人脸复制品以及17个杠杆,通过操作这些杠杆可以将各种音调合成所有欧洲语言中的任何单词。
将近一个世纪后,霍默-达德利(Homer Dudley)在贝尔实验室开发了一个声道模拟模型,该模型成为第一台电子语音合成器 Voder(1939年)的主动部分。与 Euphonia 类似,Voder 的电路由一系列按键、腕杆和音高踏板控制。通过高度熟练和协调的手势,该仪器几乎可以发出任何类似语音的声音,音调多变,八度范围不同。贝尔实验室对语音合成的研究并未止步于 Voder,1961年,马克斯-马修斯领导的团队在软件领域实现了这一概念。马修斯与创建凯利-洛赫鲍姆声道模型的工程师合作,"教 "计算机如何唱歌。这项工作的成果就是著名的计算机语音合成 "雏菊钟",又名 "双人自行车"--库布里克的《2001:太空漫游》中 HAL 计算机最后时刻的灵感来源。
然而,1983年斯坦福大学音乐和声学计算机研究中心(CCRMA)发明的卡普拉斯-斯特朗技术才真正开始起步。该算法由亚历山大-斯特朗(Alexander Strong)发明,然后由研究生凯文-卡普拉斯(Kevin Karplus)进行分析,它提供了一种强大的方法来合成弹拨或敲击琴弦的逼真模型。后来,朱利叶斯-奥里昂-史密斯三世博士将其扩展为数字波导合成,一种用于合成各种声学对象(包括管、钟、鼓、板和弦乐)的综合框架。时至今日,大多数物理建模合成器都采用了这种方法。
物理建模技术的发展引起了日本品牌雅马哈的兴趣,1989 年,该公司与学校签署了一项协议,共同开发数字波导法。1993年,雅马哈推出了第一款完全基于物理建模方法的商用硬件乐器--雅马哈 VL1。即使以今天的标准来看,VL1 也令人印象深刻,它是一种表现力惊人的乐器,可以通过编程产生细微的声音,从逼真的模拟到完全抽象和怪异的声音,应有尽有。公司后来又推出了一系列物理建模乐器,包括 VL1-m、VL7 和 VL70-m。
在 VL1 发布之时,人们曾猜测物理建模合成将成为下一个风口,然而它并没有像现在这样风靡一时,调频合成仍然占据着主导地位,这主要有两个原因。其一,创建细微而逼真的物理现象模型需要大量的计算能力,而计算能力是昂贵的,因此制造这种仪器以及获得这种仪器都需要大量投资。此外,调频合成在处理许多所需的声音设计任务方面已经相当强大和有效,因此过渡是值得商榷的。其次,物理建模方法的真正表现力需要一个扩展的控制器范例,一个超越音符开启/速度甚至触后的范例。虽然雅马哈已经为 VL1 配备了 BC2 呼吸控制器,但当时常见的 MIDI 控制器缺乏我们今天所能享受到的许多表现力功能。这些因素无疑阻碍了物理建模方法在当时的普及。
随着我们克服了过去的技术限制,我们开始看到越来越多基于物理建模的乐器。目前最流行的音乐制作软件之一 Ableton Live 就提供了几种基于物理建模方法的设备,Tension、Collision和Corpus,所有这些都是与专门从事物理建模方法的软件公司 Applied Acoustics Systems 共同开发的。AAS 还独立开发了一系列物理建模插件,其中最著名的是 Cromaphone。Madrona Labs 独有的半模块化软件乐器系列中,Kaiv--一款功能强大的合成器,融合了颗粒合成和物理建模合成。独立音乐软件制作人乔治-桑克里斯托福罗(Giorgio Sancristoforo)也对物理建模进行了探索,即他著名的Gleetchlab 中的 TAMS 合成器和Substantia。
在硬件领域,基于物理建模的乐器也出现了激增。现已解散的 Mutable Instruments 公司通过其标志性模块 Elements 和 Rings 将这种方法带入模块化生态系统。将设计开源也确保了这些模块将继续由其他制造商生产,例如 After Later Audio 生产的 Quarks、Atom 和 Resonate。其他几个Eurorack 品牌也提供原创的物理建模设计,包括 2hp 的 Pluck 和 Bell、Intellijel的 Plonk 和 Qu-Bit Electronix 的 Surface。华尔道夫公司的 Quantum 和 Iridium 这对超大型合成器也采用了这种方法。
物理建模合成的类型
我们已经明确指出,物理建模合成包含多种不同的声音设计方法,因此在本节中,我们将概述几种最常见的物理建模合成方法。虽然我们无法深入探讨每种方法,但我们将对特定方法的实现方式进行一般性描述。
让我们从前面提到的卡尔普斯-斯特朗合成法开始。正如我们所说,这种方法的目的是模拟振动弦的行为。其算法包括使用短脉冲噪声或单个咔嗒声作为激励,然后通过带有反馈回路的短延迟线进行处理。延迟时间的变化与琴弦的长度成正比,与音高成反比,而反馈量则与琴弦的衰减时间相对应。数字波导合成依靠波导理论的原理来模拟声音在各种物理介质中的传播效果。这包括弦、板、管和膜。在这种方法中,我们可以修改激励信号和延迟线的虚拟属性,以匹配物理对象的特定属性,如大小、直径、形状、材料、质量等。虽然 DWS 算法与卡普拉斯-斯特朗算法相似,但它提供了更多的细微差别和灵活性,因此可用于制作各种声学乐器的拟真版本。
另一种常见的物理建模合成方式是模态合成。模态合成具有与上述方法类似的 "激励器-谐振器 "结构,但构成谐振器的不是延迟线,而是一系列谐振带通滤波器,这些谐振带通滤波器经调整后与特定声学对象的谐振频率相匹配。它实际上类似于加法合成,意味着任何复杂的声音都可以分解成一系列正弦波部分。这使得模态合成具有惊人的灵活性,因为从技术上讲,它可以用来模拟任何声音的音色,而且细节非常丰富。前面提到的 "可变乐器 "模块就是采用了这种方法。
语音合成本身是一门特别复杂的学科,主要分为两种不同的方法:声位合成和串联合成。声位合成是指使用模拟声道共振的数字滤波器来处理源波形(即脉冲或噪声波形)的频谱。通过增强特定频段,我们可以产生全范围的元音,然后对其进行进一步整形和调制,以产生所需的声音。串联合成的工作原理是分析大量预先录制的声音(如语音、音乐或环境声音)数据库的频谱特征,并将其分解成小颗粒。但与典型的颗粒合成不同的是,这些颗粒会被编入索引,连同它们的音高、持续时间和其他属性信息一起存储在数据库中。当需要生成新的声音时,系统会根据声音与所需声音的频谱相似度,从数据库中选择并连接适当的音粒。生成的声音是单个单元的组合,可以进行实时处理,以产生各种声音和质感。如果你想尝试语音合成,我们强烈推荐你看看尼尔-塔彭设计的极具娱乐性的粉红色长号乐器。
此外,不得不提的是,其他合成方法也可以在不同阶段融入物理建模。我们已经在模态合成中看到了加法技术的应用。另一个例子是颗粒合成,它在模拟复杂的物理行为(如弹跳、蜂群等)时非常有用。事实上,在物理建模的各种实现中,颗粒合成通常用于定义激励阶段的行为,上文提到的 Madrona Labs 的 Kaivo 就是一个很好的例子。
优点和缺点
与许多其他声音合成方法相比,物理建模相对较新。虽然这种方法的潜力在90年代初就已显现,但我们才刚刚开始探索这种方法的全部可能性。在讨论这种方法的利弊时,我们必须考虑到它所处的独特地位。其他技术的目的是合成与原声乐器相似的音色,而物理建模的固有主张是,它可以产生逼真的虚拟替代品。因此,我们可以根据具体情况来判断它在这一领域的有效性。
该方法的最大障碍之一是对高处理能力的要求。尽管我们今天比二十年前做得更好,但仍有明显的改进空间。不过,很明显,随着数字技术的日益强大,真实世界和虚拟世界在声音和体验方面的分界线将越来越模糊。我们不知道未来的乐器究竟会是什么样子,但可以肯定的是,物理建模合成将成为未来的一部分。
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

636

积分

3

听众

14

音贝

音频应用新手发布

Rank: 3

积分
636
QQ
 楼主| 发表于 2009-8-7 |
而对于合成器,至少在常见的排列方式中,情况往往恰恰相反。在大多数合成器中,我们每次按下一个键,都会向振荡器发送一个音高值,并触发一个包络,从而动态地打开一个放大器。无论我们按下多少次键,都会得到始终如一的声音。这并不是说合成器的各个组件之间没有复杂的相互作用。工程师们专门想出了各种办法,以实现现代合成器的稳定性和可靠性。合成器的恒定性是其设计的一部分,如果我们想增加不稳定性和细微差别,通常可以通过编程来实现。
例如,我们可以通过采样和保持(sample-and-hold)等模块注入一定程度的随机性,这样每次触发一个按键,音色就会发生轻微变化。虽然利用可控随机性可以实现很多有趣的效果,但这并不能直接转化为物理对象之间交互的复杂性。你可以使用减法、加法或基于调频的方法来模仿吉他的音色,但这些方法无法回答这样一个问题:当你用手指拨动琴弦时,究竟会发生什么?这就是物理建模的用武之地。
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表