
今年以来,人工智能参与创作的作品不断突破圈层,成为文化领域的热点现象。
年初,一位《原神》玩家利用游戏台词作为歌词,并通过Suno进行谱曲的《奥奇坎竟是我自己》在B站迅速走红,截至目前播放量已接近640万次。有网友感慨道:“对比抖音上那些拼接剪辑的流行金曲,这款AI完成的编曲作品简直形成了碾压级的优势。”
当时就有观察者指出,“AI给予创作者的感受是:你只需专注构思创意与核心点子,剩下的实现环节尽可交给人工智能处理。”这一观点逐渐获得了广泛认同。
今年三月,程序员Yapie借助DeepSeek和Make Best Music等工具,以“从暗恋到分手的七日情感历程”为叙事线索,仅用几个小时便完成了《七天爱人》的词曲创作。歌曲在网易云音乐上线后,播放量快速突破200万,评论数超过4600条,并成功跻身飙升榜、赏音榜等主流榜单,与毛不易、陈奕迅等知名歌手的作品并列。
“无数默默无闻的音乐人倾尽心血创作,却可能难以匹敌AI的效率与产出。”有网友如此评论。更值得注意的是,《七天爱人》还在商业层面实现了突破,其版权最终以数万元的价格售出,这为大众探索AI音乐变现路径提供了重要参考。
如今,在不被提前告知的情况下,普通听众已很难辨别一首作品是否由AI生成。今年七月,Spotify上每月听众量超百万的迷幻摇滚乐队Velvet Sundown被曝光其音乐实为由Suno等生成式工具制作,公众方才恍然大悟。
“内容创作者对AI的态度已经发生了显著转变。”专注于AI内容创业的火星电波创始人徐文健表示。
网友Chaosprint分享了他的观念演变过程:
我大约在2017年就开始接触AI音乐,最初是受到AlphaGo的启发。早期主要研究机器听觉相关领域,例如Nick Collins的一些研究成果。我一直对AI能否进行实时音乐编程(live coding)充满好奇。2019年,我开发了一个名为RaveForce的项目,算是一次有趣的实验。当时GANsynth非常流行,效果令人惊艳,但音质总有些“模糊感”。至于MIDI生成,我认为它也不算真正意义上的“音乐创作”。
如今,我的看法有所改变。音质问题或许会像当年的MP3一样,初期虽有不足,但逐渐会成为“足够好”的标准,扩散模型似乎正在推动这一进程。而MIDI如果运用得当,其实是一个潜力巨大的工具。人声合成与转换技术现在也特别出色,它们更像是一种高级而实用的“插件”。
回顾2023年,许多人担忧被替代,对AI创作抱有排斥与不屑;到了2024年,头部创作者开始将AI视为助手与灵感源泉,发现了提升效率与突破创意的可能;时至今日,创作者们变得更加务实,焦点已从“是否使用AI”转向“如何高效利用AI”。
据相关报道,截至2023年,AI已生成超过一亿首音乐作品。行业内部人士预测,AI音乐的市场收益将在2026年达到70亿美元;到2030年,AI音乐有望占据全球音乐市场50%的份额。
从艺术视角看,音乐的魅力恰恰在于不同乐器在某一刻达成的和谐共鸣——无论是节奏、音调还是音色。另一方面,AI音乐在商业应用场景中颇具实用价值,例如广告配乐、短视频背景音等。这类内容更注重“功能属性”,只需营造基本氛围,无需投入大量时间进行复杂创作。在此类场景中,AI音乐无疑是合适的选择。
“AI是执行者,是人类能力边界的延伸。人才是主导者,负责定义问题与目标,指挥AI完成工作。”徐文健强调。
根据他的经验,当前创作者在创作过程中的核心任务是定义“美”的标准,通过持续反馈迭代、个性化记忆设置以及创作目标与边界的划定来引导模型。此外,应以技术生成为主,人工编辑为辅。“将人想象成总监,技术能解决80%的基础工作,人则负责修正10%的错漏并添加10%的画龙点睛之笔。”
整体而言,AI目前在创作领域的核心价值在于“补位”:帮助普通人实现创作梦想,无需耗费数年时间与数万元学习乐理,仅需输入情感经历、个人感悟等,即可生成具有个人风格的音乐;对于专业创作者,AI的价值在于提升效率,而非取代其创造性产出。
对于此前热议的AI导致失业的问题,徐文健坦言:“工作被替代的担忧确实存在,但这与历次工业革命的情形相似。AI在淘汰部分旧岗位的同时,也在创造大量新机会。善于利用AI的人将获得前所未有的生产力。”
早期阶段,AI创作规则简单、输出粗糙,高度依赖人工筛选与后期处理。如今,大模型已能基于文本深入理解情感与语义关系,并生成完整的音乐作品。
“目前AI音频技术在很大程度上已可替代中低端及标准化需求的传统音频制作。”徐文健表示,“但在情感叙事、高端真人质感、互动性与实时性方面仍有优化空间。”
“音乐生成与文本生成差异显著。”Suno联合创始人兼CEO Mikey Shulman指出,文本、代码等生成解决的是客观问题,例如提升SOTA分数、优化基准测试表现,但音乐完全是主观的。因此,Shulman认为,音乐生成领域的模型将保持相对轻量化,但需要通过其他技术赋予模型“良好的品味”。
Suno采用了Transformer架构,但Shulman称其竞争优势不在于模型架构创新,而在于音频表征的创新。例如,音频如何“分词”并无标准答案,但通过持续钻研并借鉴开源社区经验,能够找到高效的方法。
对于Suno这类工具,生成速度是关键指标,确保用户首次创作就能获得惊艳体验至关重要。“我们曾在产品中测试人为增加延迟,发现用户好感度会下降。虽然有时‘加载中’提示能让人感觉‘正在生成有价值的内容’,但10秒等待就是比8秒更差。”
创作过程中,尽管单个AI工具能力强大,但创作者通常需要将不同工具串联成完整工作流,例如使用DeepSeek、ChatGPT作词,Suno、Udio作曲等。在徐文健看来,未来必然会出现“AI创作操作系统”或全能平台,这类平台具备两大特征:
统一创作者工作空间。例如在一个界面内无缝切换文本、图像、音频、视频的创作,素材与数据可自由流转,无需在不同软件间导入导出。
具备全局理解与任务协作能力。系统能自动解析用户指令,并调用内部各类Agent协同完成任务。
徐文健指出,当前AI创作工具链中,每个环节都至关重要,而结合后的真正核心在于:由Agent构成的自动化工作流。
此外,业内资深专家也表示,用户需求日益多元化,AI创作工具需提供低时延的多元能力,包括图片、视频、音乐生成以及长视频生成等。因此,集成业界优质AI能力,优化工具链与工作流、降低成本,使创作流程简单高效,对工具提供方而言十分关键。
GPU开销通常是AI创作工具的主要支出项。尽管厂商希望GPU价格下降,但大概率只会使用更多GPU,因为行业仍在持续进行高质量研究与实验,不断推动技术迭代。
AI能迅速掌握“爆款公式”,但真正触动人心的作品,往往源于个体独特的情感偏差。
徐文健表示,“人类创作者的壁垒在‘道’,而非‘术’。技法将变得不再那么重要,人类如何理解世界、如何解构与定义问题、如何将真实生活中独属于自己的感悟表达出来,将成为人类的持久优势。”
Shulman也提到,未来音乐创作的趋势是“品味比技能更重要”。“AI让海量内容创作变得容易,而能从海量内容中筛选出优秀作品、凭听觉判断优劣的人,将越来越受认可。”
“未来的音乐创作者,可能不必精通钢琴或吉他,但需要能从Suno生成的内容中甄选佳作,并调整至符合预期。”他认为这一趋势正在加速,例如此前有人依靠“制作歌单”成名,他们仅凭“出色品味”整理他人作品,便能吸引大量听众。
Shulman认为,让模型契合人类品味颇具挑战。当前他们采用的技术与“基于人类反馈的强化学习(RLHF)”类似,但他不确定这是否是未来方向。“让音乐模型契合人类品味,未必能沿用与大模型相同的方法。”
目前,对普通人而言,AI创作工具已能生成“60分水平”的合格作品,确保具备个人特色并满足基础创作需求。对专业人士,则需优化AI音乐Agent能力,学习全网优秀曲风、词曲设计及音乐人表达习惯。AI在创新性词曲创作、复杂多曲风节拍设计等方面仍有难点,未来需突破这些瓶颈以提供更高价值。
“我真正期待的是,AI能从底层真正‘理解’音乐。例如,机器人能自主学习合成器参数如何影响声音。那时我们便能像深度强化学习破解8bit游戏那样,创造出全新的音乐形式,而非像现在这样,用大量受版权保护的音乐训练模型,修修改改再出售——这种方式过于廉价了。”Chaosprint如是说。
本文由主机测评网于2026-01-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260116424.html