Mosaic:视频编辑领域的 Zapier,但能不能跑起来?
2026-03-03 | ProductHunt | 官网 | YC Profile
30秒快速判断
这App干嘛的:一个基于节点(node-based)的画布工具,让你用拖拽方式创建视频编辑的自动化工作流(Agent)。上传素材,Agent 自动帮你剪辑、加字幕、配音、A/B 测试,搞定 80-90% 的活儿,剩下的你手动微调。可以导出到 Premiere Pro / FCP / DaVinci。
值不值得关注:
- 内容创作者/营销团队 → 非常值得。如果你每周要出 10 条以上短视频,这东西能帮你把重复劳动干掉。
- 独立开发者 → 值得研究。“视频编辑自动化”是个真需求,YC 两个批次连续投了两家(W25 Mosaic + W26 Cardboard)。
- 专业电影人 → 先观望。精细到逐帧的艺术控制还做不到。
和谁比:OpusClip(长转短)、Descript(文本驱动编辑)、Runway(生成式 AI)。Mosaic 的不同在于:它不是在现有编辑器上贴个 AI 聊天框,而是从零设计了一套节点式工作流画布,让 AI Agent 自动执行整个编辑流水线。
与我有关三问
与我有关吗?
目标用户:
- 每周要产出大量短视频的社交媒体运营(把播客/访谈/网络研讨会切成 Reels/Shorts)。
- 营销团队里没有专职剪辑师,但需要快速出视频素材的人。
- YouTuber、教育类内容创作者,编辑工作重复性高的那种。
你是目标用户吗? 问自己:
- 你每周花多少小时在“机械性”的剪辑上?(剪掉废片、加字幕、裁尺寸)
- 你有没有一套固定的编辑流程,每次都重复同样的步骤?
- 你需不需要同一个视频出多个版本(不同平台、不同语言、A/B 测试)?
如果以上任何一条 >3 小时/周,Mosaic 就是给你准备的。
什么场景会用到:
- 录了 1 小时播客 → 让 Curator Agent 自动切成 20 条短视频。
- 英文产品 demo → Linguist Agent 自动配音 + 唇形同步翻译成 30+ 种语言。
- 同一条广告 → A/B 测试不同开头、不同 CTA,一次生成多个变体。
- 只是偶尔剪个 vlog → 不需要这个,用剪映(CapCut)就够了。
对我有用吗?
| 维度 | 收益 | 代价 |
|---|---|---|
| 时间 | 官方说“把小时级编辑压缩到秒级”,实际大概能帮你做 80-90% | 学习画布操作需要适应期,要学会跟 AI 表达你的需求 |
| 金钱 | 不用请专职剪辑师(月薪 vs SaaS 订阅费) | 具体定价未公开,有免费试用 |
| 精力 | 创建一次工作流,之后可以复用/API 触发 | 精细的艺术控制还需要手动微调 |
ROI 判断:如果你每周在重复性剪辑上花 5 小时以上,哪怕 Mosaic 只帮你省一半,一个月也省了 10+ 小时。对营销团队来说,ROI 很明显。对偶尔剪视频的人来说,学习成本可能大于收益。
喜闻乐见吗?
爽点在哪:
- 工作流复用:做好一个 Agent,以后同类视频一键跑,不用重复操作。
- A/B 测试:同样的素材,不同的开头/CTA/风格,一次生成多个版本,选数据最好的。
- 导出到传统工具:不是要你抛弃 Premiere,而是 80% 交给 AI,20% 在你熟悉的工具里精修。
“哇”的瞬间:
“这不仅仅是另一个滤镜包或花哨的插件。它是对我们应该如何编辑视频的彻底重新思考。” — DeClom 评论
用户真实评价:
正面:“对于大部分用户来说,我认为它可以取代 Premiere/FCP。它不是要取代每一个功能,而是要取代你花费的时间。” — DeClom 评论
吐槽:“我买了。但它运行起来相当缓慢且卡顿。” — TheresAnAIForThat 用户
给独立开发者
技术栈
- 前端:Web 应用(edit.mosaic.so),基于节点的画布可视化界面。
- 后端:REST API 架构,支持 Agent 创建 + Run 执行模型。
- AI/模型:多模态视觉智能系统 —— 分析视频的概念、情绪、动作、语音、光线、镜头类型。原型基于 Google Gemini 1.5 长上下文(在 Kaggle 从 6400 人中拿了第一名,获得 2.5 万美元奖金)。
- 基础设施:云端 SaaS,支持 XML 导出到 DaVinci Resolve / FCP / Premiere Pro。
- 集成:Google Drive、Dropbox、YouTube。
核心功能实现
Mosaic 的核心设计理念是把视频剪辑拆成一个个“Tile”(节点),每个 Tile 代表一个操作(裁剪、加字幕、配音、加 B-roll 等),用户在画布上连接这些 Tile 形成一个 Agent 工作流。
关键创新在于:不是在传统时间轴编辑器上贴一个 AI 聊天框(他们第一个月试过了,发现对话式交互对视频不好用),而是设计了一套全新的“画布 + 智能体”(Canvas + Agent)范式。画布上的 Agent 自动执行编辑,可以并行生成多个版本,完成后用户再进入时间轴编辑器做精修。
API 层面,一个 REST 调用就能触发预设的 Agent 执行编辑任务,适合程序化批量处理。
开源情况
- 开源吗:否,GitHub 搜索无结果。
- 类似开源项目:FFmpeg(底层)、Remotion(React 编程化视频)、Auto-Editor(自动剪辑静音段)。
- 自己做难度:高。节点式画布 + 多模态 AI 视觉理解 + 实时渲染 + XML 导出,这不是一个人能搞定的。4 人团队 + YC 加持花了 6 个多月。
商业模式
- 变现方式:SaaS 订阅制 + API 调用。
- 定价:免费试用可用,分层定价具体未公开。
- 竞品参考:OpusClip $15/月起,Descript $12/月起,Runway $15/月起。
巨头风险
中等风险。原因:
- Adobe 已经在 Premiere Pro 里加了不少 AI 功能(自动字幕、场景检测),但 Adobe 的基因是“在现有工具上加 AI”,不会推翻自己的时间轴范式。
- Google(Veo)和 OpenAI(Sora)做的是生成式视频,不是编辑自动化,赛道不同。
- 真正的风险是同类创业公司:YC W26 的 Cardboard 做的几乎是一模一样的事情。
- 短期内巨头不会做“视频编辑自动化工作流平台”这种细分,但长期 Adobe 可能会收购类似产品。
能不能自己做一个?
能,但建议差异化:
- 只做某个垂直场景(比如只做“播客转短视频”或“电商视频批量生成”)。
- 做本地化版本(中文市场,对接剪映/必剪导出格式)。
- 做开源版本 —— Mosaic 不开源是个机会。
给产品经理
痛点分析
解决什么问题:视频编辑太慢、太重复。创始人的原话:“功能隐藏在菜单、按钮和图标后面,我们经常发现自己需要谷歌搜索或询问 ChatGPT 如何进行某些编辑。”
痛点有多痛:
- 频次:内容营销团队每天都要剪视频,高频。
- 刚需程度:对批量产出视频的团队是刚需;对偶尔剪视频的人是锦上添花。
- 创始人的关键洞察:对话式助手(Chat Copilot)不适合视频 —— 视频编辑是非线性的,但对话是线性的“提示-响应”。他们试了一个月发现不行,才转向画布模式。
用户画像
- 社媒运营/营销团队 —— 每周产出大量短视频,需要多平台适配。
- 播客/访谈类 YouTuber —— 长视频转短视频是核心需求。
- 企业营销 —— 产品 demo、广告、内部培训视频的批量制作。
功能拆解
| 功能 | 类型 | 说明 |
|---|---|---|
| 节点式画布 | 核心 | 拖拽连接 Tile 构建编辑工作流 |
| AI Agent 自动执行 | 核心 | 80-90% 的编辑自动完成 |
| A/B 测试变体 | 核心 | 同素材多版本并行生成 |
| 时间轴编辑器 | 核心 | 精修 + XML 导出到传统 NLE |
| Curator Agent(长转短) | 专项 | 自动从长视频切出高互动短视频 |
| Linguist Agent(翻译配音) | 专项 | 30+ 语言配音 + 唇形同步 |
| Attention Agent(增强留存) | 专项 | 自动加 B-roll、背景音乐、动态字幕 |
| API 触发 | 扩展 | 程序化批量处理,适合企业集成 |
竞品差异
| 对比项 | Mosaic | OpusClip | Descript | Runway | Cardboard |
|---|---|---|---|---|---|
| 核心范式 | 节点画布 + Agent | 一键裁剪 | 文本即视频 | 文本→视频 | 浏览器 NLE + AI |
| 自动化程度 | 全流程自动化 | 自动裁剪 | 半自动 | 生成式 | 全流程自动化 |
| 最擅长 | 可复用工作流 | 长转短 | 播客/对话 | 创意特效 | 营销视频 |
| 导出传统 NLE | 支持 XML | 不支持 | 有限 | 不支持 | 有限 |
| API | 有 | 有 | 有 | 有 | 待确认 |
| 价格 | 未公开(有免费试用) | $15/月起 | $12/月起 | $15/月起 | 未公开 |
可借鉴的点
- “对话不好用就换范式”的勇气 —— 第一个月做了 Chat,发现不对,第二个月推翻重来做 Canvas。这种快速验证快速转向的执行力值得学习。
- “80-90% 自动 + 手动精修”的定位 —— 不号称 100% 自动化,而是明确告诉用户你还要手动微调,反而更可信。
- XML 导出到传统 NLE —— 不跟 Adobe/Apple 正面竞争,而是做上游工具,这个卡位很聪明。
- Kaggle 竞赛 → YC → 产品 —— 用竞赛验证技术可行性,再转化成产品,是一条好路径。
给科技博主
创始人故事
创始人:Adish Jain (CEO) + Kyle Wade (联合创始人)
背景:都是前 Tesla 工程师。Adish 拥有 UC Berkeley 计算机与统计学双学位,先后在 AWS(4 个月代码帮公司省了 2700 万美元/年资本支出)、Together(YC 创业公司,6 人产品团队)、Tesla(开发 Toolbox 车辆诊断平台)工作。前同事评价他是“梦幻队友”。
为什么做这个:在 Tesla 时想拍一个“数 Cybertruck 买股票”的 YouTube 视频 —— 每看到一辆 Cybertruck 就买一股 Tesla 股票。录了几小时素材回来,发现用 DaVinci Resolve / Premiere Pro 剪辑太痛苦。灵感来了:多模态 AI + 视频编辑器 = Mosaic。从“副业”变成了全职创业。
成就:
- Google Gemini Kaggle 竞赛:6400 人中第一名,获得 2.5 万美元奖金。
- SaaStr AI Pitch 竞赛冠军。
- YC W25 同批次最佳 Demo。
争议点/讨论角度
-
“对话式助手不是视频编辑的未来”
- 这是 Mosaic 团队最大的洞察。所有人都在往编辑器里塞聊天框,他们做了一个月发现行不通。这个反思本身就值得写一篇文章。
- 可以讨论:什么场景下对话式交互好用?什么场景不好用?
-
YC 连续两批投“智能体视频编辑器”
- W25 投了 Mosaic,W26 又投了 Cardboard。说明 YC 认为这个赛道足够大。
- 两家做法不同:Mosaic 是画布模式,Cardboard 是浏览器 NLE。
- 可以写:“YC 为什么一年内投了两家做同一件事的公司?”
-
“视频界的 Cursor”这个类比
- Mosaic 最早自称“视频剪辑界的 Cursor”,后来改成“视频剪辑界的 Zapier”。
- 从 Cursor(AI 辅助编码)到 Zapier(工作流自动化),定位在变化。这个类比值得拆解。
-
Tesla 工程师 → YouTube 视频 → 创业
- 一个很接地气的创业故事:不是为了创业而创业,是自己有真实需求。
热度数据
- PH: 17 票(偏低)。
- HN: Launch HN 帖子有相关讨论。
- Twitter/X: 画布公告 2.1 万浏览、106 转发;Garry Tan 播客剪辑推文 2.4 万浏览。
- 搜索趋势: “agentic video editing” 是 2025-2026 年的新概念,Mosaic 是这个品类的定义者之一。
内容建议
- 适合写的角度:“为什么对话不是视频编辑的答案?一家 YC 创业公司的转型故事”。
- 蹭热点机会:Agentic AI 概念火热 + 视频内容创作爆发 + YC 连续投注。
给早期采用者
定价分析
| 层级 | 价格 | 包含功能 | 够用吗? |
|---|---|---|---|
| 免费试用 | $0 | 体验基础功能 | 试水够了 |
| 付费 | 未公开 | 全功能 + API | 看具体价格 |
注意:具体分层定价需要到 mosaic.so/pricing 查看。竞品参考:OpusClip $15/月,Descript $12/月。
上手指南
上手时间:30 分钟(画布概念需要适应)。
学习曲线:中等。画布本身直观,但要学会“怎么跟 AI 描述你的需求”。
步骤:
- 访问 edit.mosaic.so,注册账号(无候补名单)。
- 上传你的视频素材。
- 选择一个预置 Agent(Curator / Linguist / Attention)或自建工作流。
- 在画布上连接节点,配置参数。
- 点击运行,Agent 自动执行编辑。
- 进入时间轴编辑器做精修。
- 导出成品,或 XML 导出到 Premiere/FCP/DaVinci。
坑和吐槽
- “慢和卡” —— 有用户反映运行慢、界面卡顿。视频越长处理越慢,这是目前最大的体验问题。
- 精细控制有限 —— 如果你要做高度创意性的剪辑(特定的 J-cut、精准的情感节拍),AI 可能帮倒忙。官方也承认这不是“设置好就不用管”的工具。
- 学习信任 AI —— “学会信任 AI 并有效地表达你的指令需要一些练习。”
- Beta 阶段 —— 产品还在公测中,功能和稳定性都在迭代。
安全和隐私
- 数据存储:云端(需要上传视频到他们的服务器处理)。
- 隐私政策:未详细审查,建议敏感内容谨慎使用。
- 集成:支持 Google Drive、Dropbox,走的是标准 OAuth 授权。
替代方案
| 替代品 | 适合谁 | 优势 | 劣势 |
|---|---|---|---|
| OpusClip | 只需要长视频转短视频的人 | 简单快速,$15/月,90%+ 准确率 | 只做裁剪,不是全流程 |
| Descript | 播客/对话类内容为主的人 | 文本编辑体验出色,Overdub 声音克隆 | 不擅长非对话类视频 |
| Runway | 要做创意特效/生成式视频的人 | Gen-4/Aleph 效果惊艳 | 不是编辑工具,学习曲线高 |
| Cardboard | 营销团队快速出视频 | 浏览器直接用,协作方便 | 还在更新阶段(YC W26,比 Mosaic 更早期) |
| CapCut | 个人创作者,简单剪辑 | 免费,手机+桌面都有 | 没有自动化工作流能力 |
给投资人
市场分析
- 视频编辑市场:2026 年 37.5 亿美元,CAGR 5.88%,2031 年达 49.9 亿美元。
- AI 视频编辑细分:2033 年达 44 亿美元,CAGR 17.2% —— 增速是大盘的 3 倍。
- 云端视频编辑:CAGR 8.23%(2026-2031),跑赢本地部署。
- 驱动因素:70% 视频编辑者认为 AI 显著提升工作流;62% 北美企业已使用 AI 辅助视频编辑;短视频内容爆发(TikTok/Reels/Shorts)持续推动需求。
竞争格局
| 层级 | 玩家 | 定位 |
|---|---|---|
| 头部巨头 | Adobe (Premiere Pro)、Apple (FCP)、Blackmagic (DaVinci) | 传统 NLE,增加 AI 功能 |
| AI 新贵 | Descript ($100M+ 融资)、Runway ($230M 融资) | 各自细分赛道领先 |
| 自动化新秀 | Mosaic (YC W25)、Cardboard (YC W26)、OpusClip | “Agentic” 视频编辑 |
| 消费级 | CapCut (字节跳动)、InShot | 免费/低价,海量用户 |
Timing 分析
为什么是现在:
- 多模态 AI 成熟 —— Gemini 1.5 / GPT-4o / Claude 能理解视频内容,不再只是文本,这是 Mosaic 的技术基础。
- 短视频内容爆发 —— TikTok/Reels/Shorts 让每个品牌都需要大量视频内容,编辑瓶颈凸显。
- “Agentic AI” 概念兴起 —— 不只是辅助,而是自主执行任务的 AI,从编码(Cursor/Devin)延伸到视频编辑。
- WebGPU/WebCodecs —— 浏览器端视频处理能力提升,让 Web-first 的视频编辑器成为可能。
技术成熟度:多模态视觉理解基本可用,但精度和速度还有提升空间(用户反映慢和卡)。
市场准备度:高。内容创作者已经习惯了 AI 工具,付费意愿存在。
团队背景
- Adish Jain (CEO):UC Berkeley 计算机与统计学,前 Tesla / AWS / Together 工程师。
- Kyle Wade (联合创始人):前 Tesla 工程师。
- 团队规模:3-5 人。
- 亮点:Kaggle 第一名(6400 人竞赛)、SaaStr AI Pitch 冠军、YC W25 最佳 Demo。
融资情况
- 已融资:50 万美元。
- 投资人:Digital Currency Group、Pioneer Fund、Transpose Platform Management、Twenty Two Ventures 等 7 家。
- 估值:未公开。
- 阶段:Pre-Seed / Seed,正在招聘 3 个岗位(营销、工程、产品)。
投资判断
| 维度 | 评价 |
|---|---|
| 赛道 | 好赛道。AI 视频编辑 CAGR 17.2%,短视频需求持续爆发 |
| 产品 | 有差异化。画布 + Agent 范式新颖,技术已通过 Kaggle 验证 |
| 团队 | 背景扎实。Tesla + AWS + Berkeley,技术能力强 |
| 竞争 | 激烈。YC 一年投了两家做同一件事的,巨头也在加 AI 功能 |
| Timing | 好。多模态 AI + 短视频爆发 + Agentic AI 概念 |
风险:
- 竞争对手多且强(Cardboard、Descript、Adobe AI)。
- 产品还在 Beta 阶段,性能问题需要解决。
- 50 万美元融资在 AI 赛道偏少,需要快速跑出数据拿下一轮。
- 视频处理成本高(GPU/存储/带宽),商业模式的单位经济效益(unit economics)待验证。
结论
一句话判断:Mosaic 是“视频编辑工作流自动化”赛道的先行者,基于节点的画布 + Agent 的范式确实有新意,但产品还在早期,性能和精细度都需要提升。赛道确定性高,但竞争也在加剧。
| 用户类型 | 建议 |
|---|---|
| 开发者 | 值得研究。画布 + Agent + API 的架构设计值得学习。想做视频自动化?垂直场景或中文市场有机会。 |
| 产品经理 | 值得借鉴。“对话不好用就换画布”的快速转型、“80-90% 自动 + 手动精修”的定位策略都是教科书级别的产品决策。 |
| 博主 | 值得写。“YC 一年投两家 Agentic Video Editor”、“对话不是视频编辑的未来”都是好角度。 |
| 早期采用者 | 可以试。免费试用无门槛,适合每周产出大量视频的团队。但做好心理准备——Beta 阶段,可能会遇到慢和卡。 |
| 投资人 | 关注。赛道好、团队好、时机好。但 500k 融资偏少,需要看产品数据和增长指标再做判断。 |
资源链接
Sources:
- ProductHunt - Mosaic
- Mosaic 官网
- YC Company Profile
- Launch HN: Mosaic (YC W25)
- VP Land - Mosaic Launches AI Video Editor Beta
- DeClom - Mosaic AI Video Editor Review
- Adish Jain LinkedIn
- AIPressRoom - Adish Jain Interview
- HireTOP - Mosaic AI Video Editing
- Phill.ai - Mosaic AI
- TheresAnAIForThat - Mosaic
- Mordor Intelligence - Video Editing Market
- Market.us - AI in Video Editing
- PitchBook - Mosaic
- Cardboard (YC W26) HN Launch
2026-03-03 | Trend-Tracker v7.3