日前,昆仑万维正式发布了全球范围内迄今为止规模最大的开源 MoE 模型 “天工 3.0”。同时基于天工 3.0 大模型打造的中国首个音乐 AIGC SOTA(State of the art,最高技术水平)模型 “天工 SkyMusic” 也正式对全社会免费开放。
据介绍,这一采用 4 000 亿级参数的 MoE 混合专家模型,是目前全球模型参数最大、性能最强的 MoE 模型之一,相较上一代在模型语义理解、逻辑推理等多个性能维度均有明显提升。
根据深圳《晓得科技》分析,天工 SkyMusic 在自然语言处理和音乐生成技术做出最新突破,在 2 000 万首音乐的深度学习下,该工具在中文效果、人声自然度、情感、唱法等方面都表现出色,能通过歌词控制情绪变化,实现颤音、歌剧、吟唱等多种歌唱技巧。
分析称,天工 SkyMusic 还支持创作饶舌、民谣、古风、电子等多种音乐风格,用户可以根据个人喜好选择音乐风格,体现音乐创作的个性化。还能模仿粤语、四川话等中文方言,实现音乐创作的多元化。
在与此前的海外 AI 音乐 SOTA 模型 Suno V3 的横向测评中,天工SkyMusic 在人声 &B GM 音质、人声自然度、发音可懂度等领域显著领先对手,并以 6.65 分的综合得分超越 Suno V3,成为最新的全球 AI 音乐 SOTA 模型。
天工SkyMusic 大幅降低了音乐创作门槛,虽然仍处于起步阶段,但其已经在音乐生成领域取得了不错的效果。4 月初开启邀测后,天工 SkyMusic 后台提交测试申请的人次超百万。
资料来源:综合报道;图片来源:昆仑万维官方微博视频截图