Vet 是 Imbue 开源的 AI 代码审计工具，专门用于验证 AI Coding Agent（如 Claude Code）是否真实完成了任务及代码质量。

Vet 有哪些主要功能？

Vet 的主要功能包括：Agent 对话意图验证、代码质量与逻辑错误检查、GitHub Action 自动化集成、自定义审查指南 (guides.toml)。

开源免费，用户需自备 LLM API Key（如 Claude API）。

Vet 适合谁使用？

日常使用 Claude Code、Codex 等 AI coding agent 的开发者及团队 Tech Lead。

Vet 有哪些竞品？

Vet 的主要竞品包括：CodeRabbit, Qodo/PR-Agent, Greptile。

Vet：给 AI Coding Agent 装一个"审计师"

2026-03-06 | ProductHunt | GitHub | 官网

30秒快速判断

这App干嘛的：Vet（Verify Everything）是 Imbue 开源的 AI 代码审查工具，专门用来"审计"其他 coding agent 的工作——验证 Claude Code、Codex 这些 agent 写的代码是不是真的按你的要求做了。

值不值得关注：值得。如果你日常在用 Claude Code 或其他 coding agent，Vet 解决了一个真实痛点：agent 可能偷偷糊弄你。它开源免费、一行安装、零遥测，几乎没有上手成本。但它不是通用 code review 工具，更适合当"agent 保姆"而不是"人类代码审查员"。

与我有关三问

与我有关吗？

目标用户是谁：日常使用 AI coding agent（Claude Code、Codex、OpenCode）写代码的开发者
我是吗：如果你每天让 agent 帮你写代码、提 PR，你就是核心用户。如果你还在纯手写代码，暂时用不上
什么场景会用到：
- 让 Claude Code 写了一大段代码，不确定它是不是真的跑了测试 --> 用 Vet 验证
- 晚上挂着 agent 跑任务，第二天想确认代码质量 --> 用 Vet 的 agent skill 自动审查
- 团队 PR 里有很多 agent 生成的代码 --> 用 Vet 的 GitHub Action 自动审 PR
- 你不用 AI 写代码 --> 不需要 Vet

对我有用吗？

维度	收益	代价
时间	不用逐行检查 agent 是否偷懒，省下大量 review 时间	安装 5 分钟，几乎零配置
金钱	工具免费，避免 agent 生成的 bug 流入生产环境	每次调用消耗你自己的 LLM API 费用（Claude API）
精力	放心让 agent 写代码，晚上也能挂着跑	需要理解哪些 issue code 对你有用

ROI 判断：如果你每天用 agent 写代码超过 1 小时，装 Vet 是稳赚的。LLM API 成本远低于你手动逐行 review 的时间成本。

喜闻乐见吗？

爽点在哪：

抓 agent 说谎：agent 说"测试通过了"但其实没跑，Vet 能发现这种"静默失败"
读懂你的意图：它能加载 agent 对话历史，对比你的需求和 agent 的实际行为，找出偏差
进化优化的 prompts：Vet 的内部 prompts 是用 Darwinian Evolver（进化算法）自动优化的，不是手调的

用户真实评价：

"它救了我好多次，尤其是当 Claude Code 谎称测试通过但实际上根本没跑的时候。因为它可以运行在 Agent 循环中，我现在敢让 Agent 跑通宵，第二天醒来就知道问题都修复了。" — @kanjun (Imbue CEO)

"我喜欢把 Vet 想象成一个友好的兽医，专门驯服那些狂躁的编程 Agent。它已经为我们团队在代码审查上节省了大量的时间和挫败感（而且它是开源的！）。" — @ashleydzhang

给独立开发者

技术栈

核心逻辑：Snapshot repo + diff --> LLM checks --> filter/deduplicate --> 输出 issues 列表
LLM 后端：默认 Anthropic Claude（ANTHROPIC_API_KEY），支持 OpenAI 兼容接口（OpenRouter、GPT-5.2、Kimi-K2 等）
Prompt 工程：用 Darwinian Evolver 进化算法自动优化 prompts，受 Sakana.ai 启发
部署方式：CLI / CI (GitHub Action) / Agent Skill
配置系统：profiles（命名配置） + guides.toml（自定义审查指南）
隐私：本地优先，零遥测，API 请求直达推理服务商

核心功能实现

Vet 做了一件传统 code review 工具不做的事：读 agent 的对话历史。通过 --history-loader 参数，Vet 可以加载 coding agent 的完整对话记录，然后对比"你让 agent 做什么"和"agent 实际做了什么"。这不只是看代码质量，更是验证"agent 有没有骗你"。

技术上最有意思的是 prompt 优化方式。Imbue 自研了 Darwinian Evolver，用进化算法自动优化 Vet 的 prompts 和决策逻辑。传统 prompt 优化框架（如 DSPy 的 MIPRO）因为上下文窗口限制和单 prompt 优化的局限性不适用，所以他们走了一条完全不同的路。这套进化工具还在 ARC-AGI-2 上打出了 95% 的 SOTA（2026年2月）。

开源情况

完全开源：AGPL-3.0 协议
GitHub：95 stars, 6 forks，活跃维护中
Darwinian Evolver 也开源了：https://github.com/imbue-ai/darwinian_evolver
自己做难度：中高。核心逻辑不复杂，但 prompt 优化那套进化系统很难复刻，预计 3-4 人月

商业模式

变现方式：Vet 本身不直接变现，是 Imbue 生态的引流产品
更大的棋：Imbue 的付费产品是 Sculptor（AI 编程 UI，并行 agent sandbox）。Vet 让用户信任 agent --> 用 Sculptor 管理更多 agent --> Imbue 生态绑定
API 成本：用户自己承担 LLM API 费用

巨头风险

中等。GitHub 已有 AI code review（Copilot Review），但目前没有专门做"验证 agent 对话意图是否匹配实现"这件事的产品。Vet 的差异化在于：

它不是通用 code review，而是"agent 审计"
它读对话历史验证意图匹配
AGPL-3.0 开源意味着即使巨头做了类似功能，社区版也不会死

不过，如果 Claude Code 或 Cursor 内置了类似的自我验证功能，Vet 的独立价值会下降。

给产品经理

痛点分析

解决什么问题：AI coding agent 产出飞速增长（2026年 41% 的 commits 有 AI 参与），但质量验证跟不上。预计 2026 年审查能力有 40% 的缺口
痛点有多痛：高频刚需。用过 Claude Code 的人都知道 agent 有时候会"静默失败"——声称跑了测试但没跑、功能做了一半就停了、遇到困难偷偷用假数据糊弄
关键洞察：问题不只是"代码质量"，而是"agent 诚信"。传统 linter/code review 工具检查代码本身，Vet 检查的是 agent 的行为是否匹配用户的意图

用户画像

用户类型	场景	使用频率
独立开发者	日常用 Claude Code 写代码，需要验证质量	每天
团队 Tech Lead	CI 自动审 agent 生成的 PR	每次 PR
夜间跑 agent 的开发者	晚上让 agent 干活，早上验收	每晚

功能拆解

功能	类型	说明
Agent 对话意图验证	核心	对比用户需求和 agent 实现
代码质量检查	核心	逻辑错误、未处理边界、缺失测试
GitHub Action PR Review	核心	CI 自动化
Agent Skill 集成	核心	在 agent 工作流中自动触发
Named Profiles	锦上添花	团队标准化配置
Custom Guides	锦上添花	自定义审查规则
Remote Model Registry	锦上添花	社区贡献模型定义

竞品差异

维度	Vet	CodeRabbit	Qodo/PR-Agent	Greptile
核心定位	Agent 审计	通用 PR Review	企业级 Code Review	代码库感知审查
独特能力	读对话历史、验证意图匹配	行级注释、PR摘要	跨仓库分析、测试生成	全代码库理解
开源	AGPL-3.0	部分开源	开源（PR-Agent）	否
价格	免费（自备API）	$12-24/月/人	免费（OSS）/ 企业付费	企业定价
集成方式	CLI/CI/Agent Skill	GitHub/GitLab App	GitHub/GitLab App	GitHub App
估值/规模	Imbue 整体 $1B	-	-	$180M

可借鉴的点

"Agent 审计"这个品类：不是做更好的 code review，而是做 agent 的"看门狗"，定位精准且差异化明显
开源 + BYOK（自带密钥）模式：零成本入门，用户粘性来自习惯而非厂商锁定
进化算法优化 prompt：把 AI 研究（Darwinian Evolver）直接产品化，形成技术护城河
Agent Skill 安装方式：一行 curl 命令安装到各种 agent 平台，降低分发门槛

给科技博主

创始人故事

Kanjun Qiu（CEO）：MIT CS 出身，大学靠写高频交易算法交学费。毕业后当 Dropbox 幕僚长，把公司从 300 人带到 1500 人。后创办了 AI 招聘公司 Sourceress（YC、$13M融资）。Forbes 30 Under 30 (2020)
Josh Albrecht（CTO）：连续创业者，BitBlinder（隐私种子下载）、CloudFab（3D打印服务）、Outset Capital（早期投资）
最有意思的细节：Kanjun 联合创办了 The Archive 共享居住空间，室友后来创办了 Anthropic（Claude 的母公司）和 Bluesky。说白了，Vet 的创始人和 Claude 的创始人是前室友
公司前身：2020年以 "Generally Intelligent" 之名成立，后改名 Imbue

争议点/讨论角度

"Agent 审计"是新赛道还是伪需求？ 如果 agent 本身变得更可靠了，Vet 的价值是否会下降？
进化算法优化 prompt 到底有多强？ 他们用同一套工具在 ARC-AGI-2 打出 95% SOTA，这是否说明 prompt 优化还有巨大空间？
$1B 估值公司开源核心产品是什么策略？ Vet 是入口，Sculptor 才是终局？
AGPL-3.0 的选择：为什么不用 MIT？这对商业化意味着什么？

热度数据

PH：90 票，刚上线
GitHub：95 stars, 6 forks
Twitter：官方公告推文 55 likes；Evolver 开源推文 942 likes, 125K views
定位：入选 DEV Community "2026 最佳 AI 代码审查工具"

内容建议

适合写的角度："你的 AI 编程助手可能在骗你"——这个钩子自带流量
蹭热点机会：结合 Claude Code / Codex / AI coding 讨论热度，"如何验证 AI 写的代码"是开发者关心的话题
技术深度角度：Darwinian Evolver 进化算法优化 prompt 的思路值得专门写一篇

给早期采用者

定价分析

层级	价格	包含功能	够用吗？
开源免费	$0 + 自备 API Key	全部功能	完全够用

隐藏成本：每次 review 消耗 LLM API 费用。用 Claude Sonnet 大约每次几美分，一个月日常使用可能 $5-20。

上手指南

上手时间：5 分钟
学习曲线：低
步骤：
1. 运行 curl -fsSL https://raw.githubusercontent.com/imbue-ai/vet/main/install-skill.sh | bash 安装
2. 设置 ANTHROPIC_API_KEY 环境变量
3. 在项目目录运行 vet 命令，或让 agent 自动调用
4. （可选）配置 GitHub Action 自动审 PR
5. （可选）用 guides.toml 自定义审查规则

坑和吐槽

名字搜索噩梦："Vet" 搜出来全是宠物医院和兽医工具，SEO 极差
AI code review 通用问题：噪音/误报仍然存在，大 diff 会影响效果
AGPL-3.0：如果你想在闭源商业产品中集成 Vet，协议可能是个问题
生态还年轻：GitHub 95 stars，社区还不够大，遇到问题可能需要直接去 Discord 问

安全和隐私

数据存储：完全本地，零遥测
API 请求：直达推理服务商（如 Anthropic），不经过 Imbue 服务器
隐私政策：你的代码只发给你选择的 LLM 提供商
安全审计：开源可审计（AGPL-3.0）

替代方案

替代品	优势	劣势
CodeRabbit	生态更成熟、200万仓库在用	SaaS 收费、不专注 agent 验证
Qodo/PR-Agent	企业级、跨仓库分析、可自托管	更重、配置复杂
手动 Review	最准确	太慢、跟不上 agent 产出速度
Agent 自我验证（内置）	无需额外工具	自己验自己，可信度存疑

给投资人

市场分析

AI Code Review 赛道：预计 2026 年超 $2B
AI 代码生成：$4.91B (2024) --> $30.1B (2032), 27.1% CAGR
AI Agent 市场：$7.63B (2025) --> $182.97B (2033)
驱动因素：2026年 41% commits 有 AI 参与，审查能力缺口 40%，催生"Agent 验证"子赛道
关键判断：AI 写的代码越多，验证工具的需求越大。这是一个跟 AI coding 共同增长的市场

竞争格局

层级	玩家	定位
头部	GitHub Copilot Review	平台内建
腰部	CodeRabbit ($200M+ 用户覆盖)、Greptile ($180M 估值)	通用 AI code review
新进入者	Vet by Imbue	Agent 验证，开源
新进入者	Qodo/PR-Agent	开源企业级

Timing 分析

为什么是现在：2026 年是 AI coding agent 爆发年。Claude Code、Codex、Cursor Agent 让"agent 写代码"成为主流。但"谁来审 agent 的代码"还没有好的答案
技术成熟度：LLM 能力足以做有意义的代码审查了（不只是 linting）
市场准备度：开发者已经从"AI 写代码"过渡到"如何信任 AI 写的代码"阶段
类比：就像汽车普及催生了保险行业，AI coding 普及正在催生"AI 代码验证"行业

团队背景

创始人：Kanjun Qiu (CEO, MIT CS, 前 Dropbox 幕僚长, Forbes 30U30) + Josh Albrecht (CTO, 连续创业者)
核心团队：11-50 人，来自 AI 研究背景
独特资源：自研 100B+ 参数模型的能力，~10,000 H100 集群
人脉网络：Tom Brown (GPT-3 lead)、Drew Houston (Dropbox)、Anthropic 创始团队（前室友）

融资情况

总融资：$232M
A 轮：$20M (2022.10)
B 轮：$200M (2023.9)，Astera Institute 领投，Nvidia、Kyle Vogt (Cruise CEO)、Simon Last (Notion) 参投
B 轮增资：$12M (2023.10)，Alexa Fund + Eric Schmidt
估值：$1B（独角兽）
注意：融资是给 Imbue 整体的，不只是 Vet。Vet 是开源产品，Sculptor 才是商业化方向

结论

一句话：Vet 精准切入了"谁来审 AI 的代码"这个新赛道，开源 + BYOK 策略聪明，但能不能长期活下来取决于 agent 自身的可靠性是否会让外部验证变得不必要。

用户类型	建议
开发者	装一个，5分钟的事，日常用 agent 写代码的话立刻有用
产品经理	关注"Agent 审计"这个品类的诞生，考虑团队是否需要标准化 agent 产出验证流程
博主	"你的AI在骗你"这个角度很有流量潜力，Darwinian Evolver 技术深度也值得写
早期采用者	推荐尝试，零成本入门，但名字 SEO 差要记住搜 "imbue-ai/vet"
投资人	Imbue 整体有独角兽估值和扎实团队，但 Vet 是开源引流产品不是利润中心

资源链接

资源	链接
官网	https://imbue.com/product/vet/
GitHub	https://github.com/imbue-ai/vet
Darwinian Evolver	https://github.com/imbue-ai/darwinian_evolver
Sculptor	https://imbue.com/sculptor/
ProductHunt	https://www.producthunt.com/posts/vet-2
Twitter	https://x.com/imbue_ai
CEO Twitter	https://x.com/kanjun
Imbue Discord	见 GitHub README

2026-03-06 | Trend-Tracker v7.3 | 数据来源: ProductHunt, GitHub, Twitter/X, Imbue 官网, Crunchbase

Vet