当前位置: 首页 » 资讯 » 新科技 » 正文

音乐版DeepSeek面世!MurekaO1炸翻AI圈,又是中国团队打造

IP属地 北京 编辑:苏婉清 雷科技 时间:2025-03-26 23:02:20

一、中国AI突破再临:音乐工业革命迎来东方引擎

2025年第一季度,中国AI产业以"三连跳"的姿态完成技术版图扩张:2月DeepSeek以开源策略重构大模型竞争格局,3月Manus重新定义智能体协作范式,而3月末,当硅谷还在讨论“AI是否具备真正的艺术创造力”时,一组来自中国的代码已悄然改写了音乐产业的底层逻辑。

3月26日,全球首个开放API以及模型微调功能的AI音乐生成平台Mureka正式亮相。不论是开发者,还是音乐平台,现在都可以将Mureka的音乐生成能力无缝集成到自己的产品或平台中,更容易地应用AI音乐功能拓展自己的商业价值;而对于普通用户,可以通过网页和app随时随地创作无门槛的创作音乐内容。

在人工智能技术持续突破与市场需求双重驱动下,AI生成音乐行业正迎来爆发式增长,年复合增长率超过16.3%。Mureka的横空出世,直指全球540亿美元音乐产业的核心腹地。其颠覆性在于:当Suno还在优化单曲生成时,Mureka已构建起覆盖创作、生产、商业化的完整生态链。

硅谷尚未意识到的危机在于:当音乐生产的核心工具链被一家中国公司定义,全球文化产业的权力结构正在发生静默转移正如20世纪好莱坞通过电影工业标准统治全球娱乐业,今天Mureka的API接口、模型协议、音色库,正在成为AI时代音乐产业的新基建。

二、核心能力:为什么说Mureka是“音乐界的原子弹”?

昆仑万维今日重磅发布2款革命性音乐大模型。

其中,Mureka V6搭载了自主研发的ICL(in-context learning)技术,通过创新性的声场扩展技术,使人声质感更加细腻饱满,混音设计更显专业水准,为用户带来前所未有的听觉盛宴。

而Mureka O1则是基于V6版本的深度优化升级之作。该产品在推理过程中创新性地融入了思考与自我批判机制,显著提升了音乐作品的品质。作为首款支持COT(Chain of Thoughts——思维链)技术的AI音乐创作系统,O1以其强大的多语言音乐创作能力、精准的场景化背景音乐(BGM)生成功能以及先进的AI音乐编辑技术,全面革新了传统音乐创作模式,主要功能包括:

多语言覆盖:支持美欧亚主流10种语言的歌词与音乐生成,涵盖多种风格与流派,满足全球用户需求。

场景化BGM生产:需输入场景描述性prompt,即可生成与特定场景完美契合的完整背景音乐。

音轨分离下载:提供音乐生成的独立的人声、伴奏等多轨输出,方便用户后续混音与二次创作。

音色克隆:行业领先的AI音色克隆,精准模拟歌手音色,一键生成个性化专属作品。

跨语言改编功能:用户可上传参考曲目,以不同语言重新填词,一键生成精准保留原曲旋律的跨语言改编版本。

Mureka在整体交互设计上展现出极致的用户友好性,即便是初次接触的用户也能轻松上手。在简单模式下,用户只需输入一段简洁的提示词,系统便能迅速生成一段高质量的音乐作品。

经过ZF团队对多种常用场景的深度测试,Mureka的表现令人惊叹。无论是古典、流行、摇滚还是电子音乐,Mureka都能精准捕捉并完美呈现各类音乐风格的精髓。更令人称道的是,其生成的人声自然流畅,完全听不出任何AI痕迹,甚至能够灵活驾驭多种语言的演唱,展现出卓越的多语言处理能力。

图 | Mureka 01进入界面,图中箭头所示位置(Mureka官网)

1.情感驱动的音乐:“生成一首情感丰富的音乐,表达出从孤独到希望的情感转变,开始时使用低沉的音调,逐渐转向明亮和激昂。”

2.背景音乐创作:“生成一首适合背景使用的轻松爵士音乐,节奏舒缓,适合用作咖啡馆的背景音乐。”

3.风格模仿:“生成一首受艾德·希兰(Ed Sheeran)的Shape of You启发的英文歌曲,带有情感的歌词,旋律悠扬。”

4.传统乐器的使用:“请生成一首以古筝为主旋律的中国风歌曲,背景加入轻微的现代电子元素,整体氛围平静。”

在高级模式中,Mureka为用户提供了更为精细的创作控制,赋予音乐创作无限可能。用户不仅可以输入自定义歌词,还能通过导入特定歌曲链接或人声样本来实现风格模仿,轻松打造出如霉霉般独具魅力的音乐作品。

以下是ZF团队基于霉霉在YouTube上发布的《Fortnight》为灵感,通过Mureka生成的一首流行歌曲。其旋律的流畅性、歌词的情感深度以及人声的细腻表现,都达到了令人惊叹的水准。如果不提前告知这是AI生成的作品,绝大多数听众恐怕都会误以为这是她全新专辑中的作品。

而在客观的专业主观音乐评测中,Mureka O1也展现了出色的音乐品质,其整体听感表现优于Suno V4。尤其在乐器演奏的多样性和配器设计上,Mureka O1表现更为突出,能够呈现更丰富的音乐层次。此外,它在音质清晰度、人声自然度以及背景音乐(BGM)的细腻程度上也有显著提升。

图 | Mureka 01在文本生成音乐的主观测评中得分

在客观评测中,Mureka O1的表现依然令人瞩目。评测选取了100条英文提示词,并分别使用相同的提示词生成了100首英文歌曲进行横向对比。为确保评测的公正性,测试采用了近期发布的开源预训练模型作为基准进行测算。结果显示,Mureka O1在多个关键指标上均展现出显著优势,几乎完胜Suno。

图 | Mureka 01在文本生成音乐的客观测评中得分

而这场技术革命正在重塑艺术创作的本质认知。

《Mureka》AI音乐人MV,歌手:Mureka;该作品由AI生成,其中音乐由Mureka生成,视频由SkyReels技术支持生成。

对于普通用户而言,Mureka通过语义联想式创作,将音乐表达的门槛降至“文字转旋律”的直觉层级。用户无需掌握复杂的乐理知识,只需输入如“失恋emo+下雨”这样的情感关键词,AI便能生成一首媲美Spotify热单的原创音乐。更有趣的是,Mureka的语言处理能力还能实现跨文化创作,例如将东北话喊麦翻译成英文版,生成的作品甚至可能在TikTok上收获百万播放量,让本土文化以全新的形式走向全球。

对于职业音乐人,Mureka提供了更为专业的创作工具。通过风格迁移引擎,音乐人可以将古典乐章重构为电子变奏的实验作品,探索传统与现代的融合。此外,Mureka支持定制化模型训练,例如基于“周杰伦中国风”风格的模型,音乐人可以在1小时内批量生成高质量的DEMO,极大提升创作效率。更具突破性的是,Mureka的音色还原技术甚至能够“复活”已故歌手的音色,例如实现梅艳芳与当代歌手的跨时空合唱《夕阳之歌》。

对于企业和开发者,Mureka的商业化应用场景同样丰富。品牌可以通过输入“夏日气泡水”这样的关键词,由AI生成10版风格各异的广告神曲,满足多样化的营销需求。此外,Mureka的API接口为开发者提供了广阔的集成空间,例如健身APP可以接入Mureka,实时生成与用户心率匹配的热血BGM,为用户打造沉浸式的运动体验。

三、技术突破:AI音乐赛道的中国解法

Mureka之所以能够实现近乎“Bug级”的卓越表现,其核心在于MusiCoT技术的突破性应用。MusiCoT通过三个维度的协同架构构建了人机协同新范式:底层技术革新、创作流程再造与生态价值延伸。

值得一提的是,中国AI团队秉持开放共享的技术理念和透明创新的研发态度,毅然选择开源MusiCoT的技术细节。

项目主页:MusiCoT.github.io

根据论文披露,其首创的COT音乐模型彻底颠覆传统生成逻辑,构建了"生成-批判-优化"的思维链机制。这一创新让AI创作告别机械堆砌,在128组双盲测试中收获73%的专业音乐人认可度,较主流模型提升28%——这意味着每四个生成作品中就有三个达到准专业水准。

其次,全民音色库的建立打破了声音创作的技术壁垒,通过98.7%的频谱还原度,用户只需10秒语音样本即可将方言俚语、宠物鸣叫等个性化声纹转化为专属AI歌手,这项技术在方言保护项目中已成功留存23种濒危语言声纹特征。

第三,首创的BGM版权解决方案通过深度学习的原创性保障机制,使"咖啡馆爵士乐"等场景化指令生成的音乐100%规避版权争议,目前已支撑14.3%的生成内容直接进入全球数字音乐市场流通。

MusiCoT的核心创新在于首次将思维链(Chain-of-Thought, CoT)方法引入音乐生成领域,开创性地改变了传统自回归模型的生成范式。与传统模型逐步生成音频的方式不同,MusiCoT在细粒度音频token预测之前,率先预生成整体音乐结构框架。这一技术革新显著提升了生成音乐在结构连贯性、乐器编排精准度以及艺术表现力等方面的表现。此外,MusiCoT基于CLAP架构,实现了无需人工标注的高效扩展能力,同时大幅提升了生成音乐的可解释性与创作质量。

图 | Mureka自研基于MusiCoT的自回归模型音乐生成技术(MusiCoT.github.io)

四、终局:中国AI的全球化野望

当全球科技观察家们还在为硅谷的AI新贵们撰写头条时,中国的人工智能军团已悄然编织出一张覆盖技术、生态与文化的全球网络。行业预言家们洞察到一个引人深思的趋势:未来三年内,90%的TikTok神曲或将由AI生成,而像Mureka这样的中国技术平台很可能成为这场音乐革命的“隐形指挥家”。

对于普通用户而言,这场变革的门槛低得令人难以置信。只需轻点“生成你的第一首AI单曲”,任何人都能化身为数字时代的创意大师——今天的随手创作,或许就是明天病毒式传播的爆款前奏。而对于开发者来说,Mureka则提供了一场更为硬核的挑战:通过申请API密钥,他们将天马行空的创意与中国技术底座的强大算力相结合,或许下一个现象级应用就诞生于某个深夜的咖啡因灵感中。这种“技术民主化”的进程,正是中国AI生态中“开放创新+垂直应用”模式的生动体现。

站在全球化的十字路口,中国AI的雄心壮志中带着一丝微妙的幽默感。硅谷或许曾垄断了从ChatGPT到Sora的技术话语权,但如今,中国公司正以实际成果证明:技术本无国界。

中国AI不仅以技术实力重新定义了全球创新的版图,更以其开放包容的姿态,为全球创作者提供了无限可能。从音乐生成到文化传播,从技术突破到生态构建,中国AI正在用行动证明:创新的未来,属于每一个敢于探索的灵魂。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新