Mozart AI:23 岁前网球选手做的 AI 音乐工作站,拿了 Balderton $6M 融资
2026-02-19 | ProductHunt | 官网
30 秒快速判断
这 App 干嘛的:一个 AI 加持的“生成式音频工作站”(GAW),让你用文字描述就能生成分轨(Stem)、旋律、鼓点、混音,还能顺便出 MV。说白了就是把 Suno 的“一键出歌”和 Logic Pro 的“精细控制”缝合在了一起。
值不值得关注:值得。原因有三:刚拿了 Balderton Capital 领投的 600 万美元种子轮融资;两个月积累 10 万用户并创作了 100 万首歌;团队背景在 AI 音乐赛道里非常独特(创始人是签过华纳的音乐人)。但目前移动端体验吐槽较多,订阅模式比较激进,离 Suno/Udio 的成熟度还有差距。
与我有关三问
跟我有关系吗?
目标用户是谁:
- 想做音乐但不会用 DAW 的业余创作者
- 想加速工作流的独立音乐制作人
- 需要配乐 + MV 一条龙的内容创作者(短视频博主等)
- 想把灵感快速变成 Demo 的专业音乐人
我是吗:如果你经常在手机上刷到好听的歌并心想“我也想做一首”,或者你是独立音乐人苦于 DAW 操作太复杂,你就是目标用户。如果你只是纯听歌的消费者,这个跟你关系不大。
什么场景会用到:
- 脑子里有段旋律 → 用 Mozart AI 快速出完整编曲 Demo
- 写了歌词想配曲 → 丢进去自动生成
- 拍了照片想配背景音乐 → 使用“照片转音乐”功能(这个竞品目前没有)
- 做短视频需要原创配乐 + MV → 一站式搞定
对我有用吗?
| 维度 | 收益 | 代价 |
|---|---|---|
| 时间 | 从零到一首完整歌曲:分钟级 vs 传统 DAW 几小时 | 学习新工具需 30 分钟,且移动端体验需要耐心 |
| 金钱 | 免费版可以试用,商用版权包含在订阅中 | 每月 8-10 美元订阅费,免费版限制较多 |
| 精力 | 不需要懂 EQ、压缩、MIDI 这些专业概念 | 生成结果需要筛选和调整,并非一次就完美 |
ROI 判断:如果你是内容创作者,需要大量原创音乐,月付 10 美元换来不限量的原创 BGM + MV,绝对划算。如果你只是偶尔玩玩,免费版够用但体验一般。专业音乐人建议等它完善 VST 支持后再考虑。
爽点在哪里?
核心爽点:
- 照片转音乐:拍张照片就能出一首歌,这个 Suno/Udio 都没有
- 一站式 MV:做完歌直接出视频,不用再开剪映
- DAW 级控制:比 Suno 多了分轨编辑和 Stem 级调整
“哇”的瞬间:
“我写了 25 年的歌,把歌词丢进去后,时间把握、音乐编排、人声和渐强都完美无缺。这是一个出色的创意工具。” —— App Store 用户
用户真实评价:
正面:“从小老师说我不会写作、画画、唱歌或创作音乐。现在我可以把想法变成完整的歌曲,不再害怕,这种创造的自由是我从未想象过的。” —— ProductHunt 用户
吐槽:“小心这个 App!花了 9.99 美元开了 7 天会员,结果根本搞不懂怎么做歌,App 还一直想让你掏更多钱。” —— App Store 用户 (2026年1月)
吐槽:“广告说可以录你的声音然后应用到歌曲,实际打开后是让你描述音乐,而且 App 只能识别你描述里的一两个关键词。” —— App Store 用户 (2025年12月)
给独立开发者
技术栈
- 前端:浏览器端 Web App(GAW)+ iOS/Android 原生 App
- 后端:未公开,公司法人名为 Arthos / Artos Inc.
- AI/模型:不自研模型,使用第三方商业授权生成模型。核心合作伙伴是 ElevenLabs,通过 Eleven Music API 实现音乐生成
- 音频处理:支持 WAV、MP3、MIDI 格式导出,支持 Stem 分轨导出
- 基础设施:云端,VST 插件支持计划中
核心功能实现
Mozart AI 自称“生成式音频工作站”,核心思路是把 AI 能力作为 DAW 的一等公民组件集成,而非外挂插件。用户输入自然语言指令(如“做一个欢快的 8 小节和弦进行,把低频 EQ 掉”),系统调用 ElevenLabs 的音乐生成 API 产出音频分轨,再在内建的混音器和效果器链中处理。
两种创作模式:
- 辅助创作:逐步生成,生成分轨 → 编辑 MIDI → 录音 → 混音
- 代理创作:纯提示词驱动,一句话出完整编曲
他们在 NeurIPS 2025 发表了论文,将这套架构进行了学术化表述。
开源情况
- 不开源。GitHub 组织 只有数据集和 gitignore 模板,没有核心代码
- 类似开源项目:Omnizart(音乐转录)、Meta MusicGen(开源音乐生成模型)
- 自己做难度:高。核心壁垒不在代码,而在 ElevenLabs 等模型 API 的接入成本和音乐版权合规。如果你只做前端壳 + 调用 Suno/ElevenLabs API,技术上 1-2 人月可以搞定一个 MVP,但商业授权和版权清理是大坑。
商业模式
- 变现方式:订阅制 + 企业定制
- 定价:免费版(功能受限)→ 付费版约 8-10 美元/月 → 企业版(按需)
- 用户量:10 万+ 注册用户(Beta 上线两个月),已创作 100 万首歌曲
- GMV 线索:部分用户在 Spotify 发布的歌曲已超过 1000 万播放
巨头风险
高。这个赛道巨头已经下场:
- Google:拥有 MusicLM / MusicFX
- Meta:开源了 MusicGen
- Nvidia:推出 Fugatto
- ElevenLabs(Mozart 的上游):自己也可以直接做面向消费者的产品
但 Mozart AI 的差异点在于“DAW + AI”的融合定位,而非纯粹的“一键出歌”。巨头更可能做通用音乐生成 API,不太会去做细致的 DAW 产品体验。
给产品经理
痛点分析
- 解决什么问题:把灵感变成可发布的音乐作品,中间不需要学习 Logic/Ableton/FL Studio 等专业工具
- 痛点有多痛:高频 + 刚需。全球有大量“想做音乐但不会用 DAW”的创作者,门槛一直是最大阻碍。有用户在 PH 上说“从小被老师说不会创作,现在终于可以了” —— 这种情绪价值非常真实
用户画像
- 卧室制作人:有想法但不会专业工具的音乐爱好者
- 短视频创作者:需要大量原创背景音乐的 TikTok/YouTube 博主
- 专业制作人:用来快速出 Demo,再在传统 DAW 里精修
- 非音乐人:想给照片、视频配乐的普通人
功能拆解
| 功能 | 类型 | 说明 |
|---|---|---|
| Prompt 生成音乐 | 核心 | 文字描述 → 完整编曲 |
| Stem 分轨生成 | 核心 | 生成独立的人声/鼓/贝斯/旋律轨 |
| MIDI 生成 + 编辑 | 核心 | AI 建议和弦进行、旋律线 |
| MV 视频制作 | 特色 | 音乐做完直接生成配套视频 |
| 照片转音乐 | 特色 | 上传照片自动生成配乐 |
| 人声去除器 | 锦上添花 | 分离人声和伴奏 |
| 声音克隆/翻唱 | 锦上添花 | 用特定音色演唱 |
| 社交平台分享 | 锦上添花 | 直接发布到社交媒体 |
竞品差异
| 维度 | Mozart AI | Suno | Udio |
|---|---|---|---|
| 核心定位 | AI DAW(生成+编辑一体) | 一键出歌 | 专业级生成+混音 |
| 出歌速度 | 中等 | 最快(<60秒) | 较快(~90秒) |
| 精细控制 | 高(分轨级编辑) | 低 | 高(局部重绘) |
| MV 功能 | 有 | 无 | 无 |
| 图片转歌曲 | 有 | 无 | 无 |
| 免费版 | 有(限制多) | 50 次/天 | 10 次/天 |
| 付费价格 | 约 $10/月 | $10-30/月 | $10-30/月 |
| 商用版权 | 包含 | 付费才有 | 付费才有 |
| 模型自研 | 否(用 ElevenLabs) | 是 | 是 |
| 用户规模 | 10 万+ | 千万级 | 百万级 |
| 融资 | $7M | $2.5 亿($24.5 亿估值) | 未公开 |
可借鉴的点
- 照片转音乐:通过图片理解生成音乐情绪,这种交互方式非常适合短视频场景,可以借鉴到其他创作工具中。
- DAW + AI 融合:不是取代 DAW,而是在 DAW 里嵌入 AI,保留用户的控制感 —— 这种“AI 增强而非替代”的产品哲学值得学习。
- NeurIPS 论文:用学术论文做公关,在 AI 产品里算是非常聪明的打法。
- 版权合规前置:在这个版权纠纷频发的赛道里,“只用授权模型”是一个很好的市场定位。
给科技博主
创始人故事
这个创始人的故事本身就是一篇爆款文章:
- Sundar Arvind,23 岁,印度裔英国人
- 12 岁成为职业网球选手,印度排名第 3,世界前 1000,曾与 Carlos Alcaraz、Jack Draper 对阵
- 因反复受伤被迫退役,转行做音乐制作人
- 14 岁签约华纳音乐(Warner Bros Music)/ Spinnin' Records,在 Spotify 上拥有百万播放量
- 在伦敦国王学院(KCL)读书期间,与 COO Arjun Khanna 一起创办了第一家公司 Blitzo(AI 即时配送),做到 150 万欧元年度经常性收入(ARR)
- 2025 年创办 Mozart AI,这是他的第二家公司
- CTO Pascual Merita Torres:爱丁堡大学 AI 硕士,10 年以上音乐制作经验
- COO Arjun Khanna:曾代表印度参加联合国辩论的专业辩手
一个前职业运动员 → 少年唱片签约艺人 → 连续创业者的故事,在科技圈非常罕见。
争议点/讨论角度
- 两个“Mozart AI”的混淆:市面上还有另一个叫 Mozart AI 的 App(由 NineG 开发),与 Sundar Arvind 的这家不是同一家公司,但 App Store 搜索结果混在一起,用户评价可能存在交叉干扰。
- AI 音乐版权之战:Suno/Udio 被主要唱片公司起诉后已经和解,Mozart AI 走“只用授权模型”路线能不能避开雷区?
- 不自研模型的风险:核心音乐生成依赖 ElevenLabs API,如果 ElevenLabs 自己做面向消费者的产品或涨价怎么办?
- “联合制作人” vs “替代者”:Mozart AI 宣称自己永远不生成完整歌曲,只做辅助创作 —— 这个定位能坚持多久?用户真的只想要“半成品”吗?
热度数据
- PH:189 票,曾两次获得 Product of the Day #2
- 用户增长:Beta 上线两个月 10 万+ 用户,创作了 100 万首歌
- 融资热度:Balderton Capital 领投 600 万美元种子轮,超额认购
- 学术认可:NeurIPS 2025 收录论文
内容建议
- 适合写的角度:“23 岁前网球冠军如何用 AI 改造音乐产业” —— 人物故事 + 产品分析
- 蹭热点机会:AI 音乐版权战正热(Suno/Udio vs 唱片公司),Mozart AI 的“合规派”定位是一个很好的对比角度
- 对比测试:同一首歌用 Mozart AI / Suno / Udio 分别生成,横评内容自带流量
给早期采用者
定价分析
| 层级 | 价格 | 包含功能 | 够用吗? |
|---|---|---|---|
| 免费 | $0 | 每日限量生成,基础功能 | 尝鲜够用,日常不够 |
| 订阅 | 约 $8-10/月 | 更多生成次数、WAV 导出、高级功能 | 日常创作基本够用 |
| 企业版 | 按需 | 全功能、团队协作 | 工作室/品牌使用 |
和竞品比:Suno/Udio 同样是 10 美元/月起步。Mozart 的免费版限制更严,但包含商用版权这一点比 Suno 免费版(无商用权)有优势。
上手指南
- 上手时间:5-10 分钟(手机端),15-30 分钟(Web DAW 端)
- 学习曲线:手机端低,Web DAW 端中等
- 步骤:
- 访问 mozartai.com 或下载 iOS App
- 注册账号(支持社交登录)
- 选择创作方式:Prompt 文字描述 / 上传照片 / 录入歌词
- 等待生成(几十秒),试听并调整
- 满意后导出 WAV/MP3 或直接分享
避坑指南
- 移动端用户体验混乱:多位用户反映注册后不知道怎么开始做歌,引导流程几乎没有。
- 订阅陷阱:免费做完一首歌后立刻弹出付费墙,9.99 美元/7 天的试用让部分用户感觉被误导。
- 广告与实际不符:Instagram 广告展示的功能与 App 实际体验有差距。
- 歌曲时长短:生成的歌曲偏短,想要更长需要手动扩展。
- 品牌混乱:搜“Mozart AI”会看到多个不同产品,容易下错 App。
安全和隐私
- 数据存储:云端(作品存储在 Mozart AI 服务器上)
- 版权归属:用户拥有作品的完整商业版权
- 模型训练:承诺不使用版权音乐训练,基于商业授权的第三方模型
- 安全审计:未公开
替代方案
| 替代品 | 优势 | 劣势 |
|---|---|---|
| Suno | 出歌最快、最成熟、免费额度多 | 没有 DAW 控制、没有 MV |
| Udio | 音质最好、精细编辑功能强 | 免费额度少、无移动端 |
| AIVA | 偏古典/影视配乐、有乐谱输出 | 不适合流行音乐 |
| Soundverse | AI 音乐编辑工具集 | 知名度较低 |
| Beatoven.ai | 专注背景音乐/配乐 | 功能较为单一 |
给投资人
市场分析
- 赛道规模:全球生成式 AI 音乐市场 2023 年约 4.4 亿美元,预计 2030 年达 27.9 亿美元,CAGR 为 30.4%(Grand View Research)
- 更广义市场:AI 音乐整体市场预计 2033 年达 387 亿美元(Market.us)
- 驱动因素:短视频平台对原创音乐的海量需求、音乐制作民主化趋势、版权合规方案日趋成熟
- 参考标杆:Suno 完成 2.5 亿美元 C 轮融资,估值 24.5 亿美元 —— 验证了赛道天花板
竞争格局
| 层级 | 玩家 | 定位 |
|---|---|---|
| 头部 | Suno ($24.5B 估值) | 消费级一键出歌 |
| 头部 | Udio | 专业级生成+混音 |
| 腰部 | AIVA、Beatoven.ai | 垂直场景配乐 |
| 新进入者 | Mozart AI | AI DAW(生成+编辑融合) |
| 巨头 | Google, Meta, Nvidia, ElevenLabs | 模型层/API 层 |
Timing 分析
-
为什么是现在:
- 底层模型成熟 —— ElevenLabs 等 API 已可商用
- 版权环境明朗化 —— Suno/Udio 与唱片公司和解,行业规则初定
- 创作者经济爆发 —— 短视频、播客对原创音乐需求井喷
- DAW 市场未被 AI 化 —— Logic/Ableton 还没有深度集成 AI,窗口期存在
-
技术成熟度:可用但仍显粗糙,2-3 年内将显著提升
-
市场准备度:高。10 万用户两个月的增速说明需求真实存在
团队背景
- CEO Sundar Arvind:23 岁,前职业网球选手 + 华纳签约音乐人 + 连续创业者(上一家 Blitzo 做到 150 万欧元 ARR)
- CTO Pascual Merita Torres:爱丁堡大学 AI 硕士,10 年以上音乐制作经验
- COO Arjun Khanna:专业辩手,与 CEO 在伦敦国王学院共同创办 Blitzo
- 核心团队:规模较小,主要来自伦敦国王学院
- 过往成绩:Blitzo 做到 150 万欧元 ARR 后转向,NeurIPS 2025 论文发表
融资情况
- 种子轮:600 万美元(2026 年 2 月),Balderton Capital 领投,超额认购
- Pre-seed:110 万美元
- 总融资额:700 万美元+
- 天使投资人:Kevin Hartz(Eventbrite 创始人)、Charles Ferguson(奥斯卡导演)、Emery Wells(Frame.io 创始人)
- 估值:未公开
结论
Mozart AI 是 AI 音乐赛道里定位最独特的新玩家 —— 不做“一键出歌”,做“AI 加持的 DAW”。创始人故事精彩,增长数据亮眼,但产品打磨还有明显差距,尤其移动端体验被用户吐槽不少。
| 用户类型 | 建议 |
|---|---|
| 开发者 | 关注但不急着抄。核心壁垒在模型 API 接入和版权合规,不在前端代码。可以研究 ElevenLabs Music API 的接入方式 |
| 产品经理 | 值得深入研究。“DAW + AI”的融合思路和照片转音乐的交互创新都有借鉴价值,竞品对比数据丰富 |
| 博主 | 好素材。创始人故事 + AI 音乐版权之战 + 横评测试,至少能出 2-3 篇内容 |
| 早期采用者 | 可以试试 Web 端,移动端暂时别花钱。免费版体验下照片转音乐和分轨生成就行 |
| 投资人 | 赛道确认(Suno $24.5B 估值),差异化定位清晰,但需要关注对 ElevenLabs 的依赖风险和与 Suno/Udio 的用户争夺 |
资源链接
| 资源 | 链接 |
|---|---|
| 官网 | mozartai.com |
| ProductHunt | producthunt.com/products/mozart-ai |
| iOS App | App Store |
| ElevenLabs 合作 | elevenlabs.io/blog/mozart-ai |
| NeurIPS 论文 | openreview.net |
| Balderton 投资公告 | balderton.com |
| Music Ally 报道 | musically.com |
| 创始人报道 | businesscloud.co.uk |
2026-02-19 | Trend-Tracker v7.3