音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 3515|回复: 0

[资讯] Stability AI 发布人工智能音乐生成器 Stable Audio

[复制链接]

669

积分

1

听众

23

音贝

音频应用新手发布

Rank: 3

积分
669
发表于 2023-9-15 | |阅读模式
音频应用公众号资讯免费发布推广
Stability AI 发布人工智能音乐生成器 Stable Audio+ H$ t0 |8 `; {1 G  w7 y% G

3 W* V& g- Z4 d, ~3 ostability AI 是一家总部位于伦敦的初创公司,开发了开源图像生成人工智能模型 Stable Diffusion,该公司发布了Stable Audio ,这是一种能够使用“潜在扩散”技术创建用于商业用途的高质量音乐的工具。
5 F& B& e4 d, i6 O2 @+ q3 S. {3 z' l+ N. c2 Z- x
就在这家人工智能初创公司开始探索生成音频并软发布其 Dance Diffusion AI 音乐工具一年后,据报道,Stability AI 面临着投资者的压力,要求为其创收产品注入超过 1 亿美元的资金。
* e  q6 n+ J( m' C# L2 i9 f2 S8 K9 D" Z* M: t4 \
据彭博社最初报道,该公司已筹集了超过 1.25 亿美元的资金,最近又在 6 月份通过可转换票据筹集了 2500 万美元。此次交易预计将使该初创公司最初的 10 亿美元估值增加至 40 亿美元。
5 m1 l2 p  @- D Gradient_1 (2).png . b+ N) |1 s+ x9 Q" \# Q
怎么运行的
% }4 v% @5 r, V! ]: ~0 k) F据TechCrunch 独家报道,Stable Audio 是由 Stability 的音频团队开发的,该团队于 4 月份正式成立,从 Dance Diffusion 中汲取灵感。" I* B9 r9 z- P

$ Z' J2 x. S2 g/ U: @* Q据 Stability AI 称,这款新工具是“首款用于音乐和音效生成的产品”,能够创建用于商业用途的高质量 44.1 kHz 立体声。通过利用其音频模型的潜在扩散,与其他一些生成式人工智能模型相比,它还能够生成具有更连贯和旋律效果的器乐。
6 S+ c; A; s+ J4 W% a8 }6 w; v" j, s; e- f; r0 j' l+ U3 L3 `4 ]2 y% h
值得注意的是,生成的音乐曲目长约 90 秒,其连贯性超出了其他人工智能工具通常生成的较短音频片段的范围。- n' B+ `6 _0 b8 [8 U8 }) C" E# I

( L# \% I9 \" Z; V7 W- F+ P. V6 M与 Dance Diffusion(从有限的声音采样生成简短的随机音频片段)不同,Stable Audio 可以生成更长的音频 - 长达 90 秒,用户还可以利用文本提示更好地控制音乐曲目的生成和所需的长度。 ) O7 l" h- E$ a! X* g, q. c

8 j9 p$ @! w$ C稳定音频输出背后的秘密是“潜在扩散”,这种技术类似于稳定扩散中用于生成图像的技术。该模型逐渐从起始歌曲中减去噪音,使其更接近所提供的文本描述。它在商业音乐库 AudioSparx 的帮助下,对一系列歌曲(不包括声乐曲目)进行了训练,以避免道德和版权问题。
4 b, \1 s# Z8 H7 D9 X# M! {9 ^- U/ ~' k, |' f: E5 H
Stability AI 音频副总裁 Ed Newton-Rex 通过电子邮件告诉TechCrunch,该初创公司目前正在跨各种内容类型(或“模式”)构建“基础人工智能模型”。
$ H2 |% S* T/ {/ n2 b3 A% y
  o2 t. H2 `/ w他详细阐述了稳定扩散的扩展,包括语言、代码和音乐。“我们相信生成人工智能的未来是多模态的,”他解释道。
7 \0 @9 i( j" r: v2 m; z3 m  I1 @) X
稳定音频目前通过网络应用程序提供,因为它不是开源的。在 Pro Tier 会员资格下,用户每月可以创建 500 首商业化曲目,最长长度为 90 秒,费用为 11.99 美元。
, E# s$ z5 r7 |$ p" Y6 X6 M& Q: W( C# R  Q9 C6 P" h
另一方面,免费用户每月只能播放 20 首非商业化曲目,每首曲目时长 20 秒。 ' n; m3 D# y4 m
, ^/ K5 F2 w( {: H+ K
据TechCrunch 报道,Stable Audio 的服务条款还表明,Stability 可能会将用户的提示、歌曲和数据用于各种目的,包括开发未来的模型和服务。9 U' Y/ w  l5 [1 E6 k
& j3 [  q  G& O, O
版权问题1 `  ^/ M* U$ U- ?& j5 Y1 n8 G# B
虽然稳定音频等生成式人工智能工具具有商业用途的潜力,但它们引起了版权和道德方面的担忧。
' K' g( R" L! x
( i% U4 {: i7 Y9 @" B虽然美国版权局(USCO)尚未发布其对人工智能生成音乐的官方立场;上个月,一位联邦法官裁定人工智能生成的音乐不能获得版权保护。 * S6 e: x0 f3 e- N9 N& \# {
& U' B1 e+ t) V
在斯蒂芬·塞勒诉希拉·珀尔穆特和美国版权局一案中,贝丽尔·豪厄尔法官强调,“人类作者身份是版权的基本要求”,其中“公众是版权法的主要受益者”。USCO 发言人同意豪威尔法官的决定,但没有提供任何进一步评论。5 m* F3 @  V; r7 i
- P) s4 R3 a$ ~. A, c& u8 {/ b
本月早些时候,USCO 拒绝向另一个涉及使用 Midjourney 的人工智能生成艺术项目提供版权保护,理由是它“不是人类创作的产物”。
  S5 p( m! H* J* M/ R. [% i( k" ~2 J& \4 [% a: W$ i
Stability 的方法也没有考虑直接补偿艺术家在训练模型时使用他们的作品。然而,一些艺术家可以选择从训练数据集中删除他们的作品。Stability 的合作伙伴 AudioSparx 为平台上的音乐家提供收入分成,如果他们选择参加培训或为未来版本做出贡献,他们就可以从 Stable Audio 中获利。. q/ o: W& a* Z$ ]: k

8 B# P# m4 O3 CStability AI 最近面临财务问题,包括延迟向员工付款和工资税,尽管该公司否认有任何此类困难。虽然该公司的目标是通过 Stable Audio 和其他人工智能模型扭转命运,但要成为生成人工智能和音乐领域的有力竞争者,它肯定面临一些挑战。 $ Q  ~) \4 R/ ~
) f9 {# G4 S% v* S
编者注:本文由nft now工作人员与OpenAI的GPT-3.5合作撰写。: X- l* }& N$ N4 c) ?% Y
4 H7 e- I' U' R3 M/ D8 \! Y6 I
https://stability.ai/stable-audio
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表