Anything API (Notte):把任何网站变成 API,浏览器 Agent 的"全家桶"
2026-03-05 | ProductHunt | 官网 | GitHub

界面解读:Notte 的 Studio 界面 —— 一个可视化的浏览器 Agent 编排平台,左侧是任务描述输入,右侧是浏览器实时预览和操作日志。开发者可以在这里“看着 Agent 干活”,然后一键转为生产代码。
30秒快速判断
这 App 干嘛的:你告诉它“帮我在某个网站上做什么”,它派一个 AI Agent 打开浏览器去做,做完后把整个流程打包成一个可调用的 API。说白了,任何没有 API 的网站,Notte 帮你“造”一个出来。
值不值得关注:值得。YC S25 孵化,$2.5M Pre-seed 轮融资,GitHub 1.8k stars,解决的是“网站没 API 怎么办”这个困扰了开发者十几年的痛点。混合架构(脚本+AI)比纯 AI Agent 靠谱得多,定价也友好(100 小时免费)。如果你经常需要从各种网站抓数据或自动化操作,这个工具能帮你省掉大量写爬虫和维护脚本的时间。
与我有关三问
与我有关吗?
目标用户是谁:主要是开发者和有技术背景的产品团队。具体来说:
- 需要从没有 API 的网站抓取数据的人
- 维护了一堆 Selenium/Playwright 脚本、疲于应对网站改版的人
- 想让 AI Agent 在网页上“干活”的人(填表、下单、监控价格)
我是吗:如果你每周花超过 2 小时写或维护浏览器自动化脚本,你就是目标用户。如果你只是偶尔手动复制粘贴数据,可能还不需要。
什么场景会用到:
- 竞品价格监控 —— 每 6 小时自动抓取竞品价格变化
- 招聘信息聚合 —— 从 LinkedIn 等平台批量提取职位信息
- 遗留系统对接 —— 老系统只有网页界面没有 API,用 Notte 桥接
- 不需要这个 —— 你操作的网站本身就有成熟的 REST API
对我有用吗?
| 维度 | 收益 | 代价 |
|---|---|---|
| 时间 | 一个爬虫从零写到可用通常要 2-5 天,Notte 用自然语言描述 5 分钟出结果 | 学习 SDK 和调试约 1-2 小时 |
| 金钱 | 免费 100 小时够用很久,之后 $0.05/h 比自己租服务器便宜 | 重度使用 + 代理流量可能每月 $50+ |
| 精力 | 不用再操心 CAPTCHA、代理池、反爬检测、会话管理 | 需要信任第三方处理你的凭据 |
ROI 判断:如果你每月花 10+ 小时维护浏览器自动化脚本,用 Notte 能省下 80% 的时间,免费额度够个人开发者折腾好几个月。值得一试。
爽点在哪?
核心爽点:
- Agent Mode → Script 一键转换:先用自然语言让 Agent 探索,看它怎么操作,满意后一键转为确定性脚本。这个流程太丝滑了。
- Session Profiles:登录一次,之后所有运行自动跳过认证。对于需要登录态的自动化场景来说简直是救星。
- 混合架构:确定性部分用脚本、不确定性部分用 AI,既可靠又灵活。比纯 AI Agent 的“薛定谔成功率”好太多。
“哇”的瞬间:
“从 Playwright + LLM 链式调用切换到了 Notte。跑了 500 多次电商价格检查,一次验证码拦截或封禁都没遇到。” —— @ai_engineer42 (Twitter)
用户真实评价:
正面:“Notte 的浏览器 Agent 处理了一个非常棘手的多标签页认证流程,我用其他框架都没搞定。成功率从 40% 飙升到了 95%。” —— @dev_ml_guy (Twitter) 正面:“快速演示一下用 Notte Agent 抓取 LinkedIn 职位……在动态网站上的可靠性超过 92%。” —— @lucasgiordano (Twitter, CTO 自己发的,可能略有偏差) 中性:“哇,我正在测试这个,对它抱有很高期望。” —— Slashdot 社区用户
给独立开发者
技术栈
- 语言/SDK:Python(PyPI 上的 notte-sdk),支持 TypeScript/Node.js
- 浏览器引擎:兼容 Playwright, Puppeteer, Selenium,通过 CDP 连接
- AI/模型:模型无关,支持 OpenAI, Anthropic, Gemini,Token 无加价
- 基础设施:边缘网络部署,计算资源与浏览器同地运行,零延迟
- 安全:SOC 2 Type II 认证,加密凭据存储
核心功能实现
Notte 的核心创新是感知层(Perception Layer)。传统浏览器自动化直接操作 DOM,LLM 要读懂混乱的 HTML 非常吃力。Notte 在中间加了一层:把网页转化为结构化的、自然语言描述的“地图”,LLM 读起来像在看说明书而不是源代码。
这意味着 LLM 的认知负担大幅降低,推理更准确,同时 Token 消耗也更少。Notte 声称这个设计在所有基准测试上都优于其他浏览器 Agent 方案。
API 提供三个核心端点:/observe(获取页面状态和可用操作)、/step(在页面上执行操作)、/scrape(结构化数据提取)。还支持 Pydantic 模型作为结构化输出格式。
开源情况
- 开源吗:核心开源,GitHub 1.8k stars, 166 forks
- 许可证:SSPL-1.0(注意:不是 MIT/Apache,对商用有一定限制,类似 MongoDB 的做法)
- 类似开源项目:Browser Use(纯 AI 方案,MIT 许可),Steel(纯基础设施方案)
- 自己做难度:高。感知层 + 混合架构 + Stealth 浏览器 + 凭据管理,全套做下来预计 6-8 人月。但用开源版 + 自己的 LLM Key 就能跑起来。
商业模式
- 变现方式:用量计费(浏览器小时 + 代理流量)+ 订阅(速率限制)
- 定价:免费 100 小时 → $20/月起 → 按量 $0.05/h
- 开源核心 + 付费云服务的经典模式(Stealth、Personas、Vault 等高级功能在云服务版)
巨头风险
中等偏高。Google 已在 Chrome 里加了 Auto Browse,ChatGPT 有 Atlas Agent 模式,Perplexity 有 Comet。但这些都是面向消费者的“浏览器助手”,而 Notte 定位是面向开发者的基础设施。短期内巨头不太会做“把网站变 API”这种开发者工具。真正的竞争来自 Browserbase(刚融了大额)和 Browser Use(开源社区活跃)。
给产品经理
痛点分析
- 解决什么问题:互联网上绝大多数网站没有公开 API,想程序化地操作它们只能写浏览器自动化脚本。这些脚本写起来痛苦、维护成本高、容易被反爬。
- 痛点有多痛:高频刚需。任何做数据聚合、竞品监控、系统对接的团队都会遇到。传统方案每次网站改版都要重写脚本,运维成本可以吞掉开发成本。
用户画像
- 开发者/工程团队:需要批量数据采集或自动化操作
- 增长黑客:需要监控竞品、抓取用户反馈
- 企业 IT:需要对接没有 API 的遗留系统
功能拆解
| 功能 | 类型 | 说明 |
|---|---|---|
| Anything API(自然语言→API) | 核心 | 描述任务,自动生成可调用 API |
| 感知层(Perception Layer) | 核心 | 网页→结构化自然语言地图 |
| 混合架构(脚本+AI) | 核心 | 确定性部分脚本化,降低成本和提升可靠性 |
| Stealth Sessions | 核心 | CAPTCHA 解决、代理、反检测 |
| Session Profiles | 核心 | 跨会话持久化认证状态 |
| Secrets Vault | 核心 | 企业级凭据管理 |
| Digital Personas | 锦上添花 | 为 Agent 创建独立数字身份(邮箱、手机号、2FA) |
| Agent Mode → Script 转换 | 锦上添花 | 先用 AI 探索,再转为确定性代码 |
竞品差异
| 对比维度 | Notte | Browser Use | Browserbase |
|---|---|---|---|
| 核心差异 | 全栈:AI + 基础设施 | 纯 AI Agent 库 | 纯浏览器基础设施 |
| AI 能力 | 内置感知层 + Agent | 原生 AI | 需自带 |
| 基础设施 | 托管边缘部署 | 需自托管 | 托管云 |
| 价格 | $0.05/h, 100h 免费 | 免费(自托管成本) | $20/月 100h |
| 认证管理 | 完整(Vault+Personas+2FA) | 无 | 基础 |
| 许可证 | SSPL | MIT | 闭源 |
可借鉴的点
- “先 Agent 后 Script”的渐进式体验:让用户先用自然语言看到效果,再转为可靠的确定性代码。降低上手门槛的同时保证生产可靠性。
- 感知层的中间抽象:不让 LLM 直接读 HTML,而是加一层“翻译”。这个思路可以迁移到其他需要 LLM 理解复杂输入的场景。
- 混合架构思路:不追求“纯 AI 解决一切”,而是让 AI 和脚本各司其职。对任何 AI 产品都有参考价值。
给科技博主
创始人故事
- Andrea Pinto(CEO):MIT AI/ML 研究员,Fulbright 学者,ETH Zurich + EPFL 双校背景,曾在 IBM Research、Amazon 工作过。16-18 岁还开过服装店。典型的“学术大佬下场创业”路线。
- Lucas Giordano(CTO):EPFL 通信系统硕士,MLO 实验室出身,4 年 ERP+AI 交叉经验。
- 两人 2019 年在 EPFL 相识,合作至今 6 年。共同的核心认知:互联网是为人类构建的,不是为 AI Agent 构建的,需要一个“感知层”来桥接。
- 瑞士+旧金山的组合:瑞士做研发,旧金山做市场。YC S25 批次,5 人小团队。
争议点/讨论角度
- SSPL 许可证的选择:跟 MongoDB 一样用 SSPL 而不是 MIT,说明他们防的是“被云厂商白嫖”。但这也可能限制社区贡献和商业用户。值得讨论的开源战略话题。
- “把任何网站变 API”的伦理边界:这本质上是一个高级爬虫平台。网站 TOS(服务条款)怎么说?法律灰色地带怎么处理?
- AI Agent 安全隐患:让 AI 操作浏览器,如果遇到恶意网页的 Prompt Injection,可能被劫持执行危险操作。Malwarebytes 已经发过相关警告。
- “混合架构”vs“纯 AI Agent”的路线之争:到底是 AI 能力会追上来让混合架构变得多余,还是生产环境永远需要确定性脚本?
热度数据
- PH 排名:293 票(中上水平)
- GitHub:1.8k stars(对于 2025 年创立的项目来说增速不错)
- Twitter 讨论:CTO 的 Demo 推文 312 个赞,算活跃但还不算爆款
- 搜索趋势:出现在多个“Best AI Browser Agents 2026”榜单中(Firecrawl, KDnuggets, Zapier 等)
内容建议
- 适合写的角度:"为什么 2026 年我们还需要爬虫?—— Notte 的混合架构思路"
- 蹭热点机会:蹭“AI Agent”和“MCP”(Notte 已有 MCP Server 集成)的大趋势
给早期采用者
定价分析
| 层级 | 价格 | 包含功能 | 够用吗? |
|---|---|---|---|
| 免费 | $0 | 100 浏览器小时 | 个人项目绝对够了,100 小时能跑非常多任务 |
| 付费入门 | $20/月 | 更高速率限制 | 小团队日常使用足够 |
| 按量计费 | $0.05/h + $10/GB | 灵活付费 | 重度使用者需要计算成本 |
隐藏成本:如果用自己的 LLM Key,模型调用费用另算(但 Notte 声称 Token 无加价)。代理流量 $10/GB 如果大量抓取可能会比较贵。
上手指南
- 上手时间:15-30 分钟
- 学习曲线:低(对于有 Python 基础的开发者)
- 步骤:
pip install notte-sdk- 设置 API Key(注册 notte.cc 获取)
- 写三行代码:初始化 Client → 描述任务 → 调用 Run
- 或者用 Anything API 的 Web 界面直接描述任务,不写代码
from notte import NotteClient
client = NotteClient(api_key="...")
result = client.agents.run(task="Monitor price of RTX 5090 on amazon.com every 6h", schedule="6h")
坑和吐槽
- 浏览器自动化的天然脆弱性:网站改版、动态加载、A/B 测试都可能让自动化失败。Notte 的混合架构缓解了这个问题,但没有根本解决。
- SSPL 许可证:如果你想在自己的 SaaS 产品里嵌入 Notte 核心代码,需要仔细读许可条款。不像 MIT/Apache 那么自由。
- 新产品的稳定性未知:2025 年才成立的公司,长期稳定性还需时间验证。如果你的业务关键流程依赖它,要有 Plan B。
安全和隐私
- SOC 2 Type II 认证:企业级安全合规
- 凭据管理:加密存储,Agent 运行时获取,不硬编码
- 数据存储:浏览器会话数据在云端处理
- 风险点:你的网站密码和 Cookie 会经过 Notte 的服务器,需要信任第三方
替代方案
| 替代品 | 优势 | 劣势 |
|---|---|---|
| Browser Use(开源) | 完全免费,MIT 许可,社区活跃 | 无托管基础设施,需要自己搞反爬和代理 |
| Browserbase | 成熟的浏览器基础设施,有 Stagehand 做自然语言控制 | 需自建 AI Agent,$20/月只有 100h |
| Steel(开源) | 完全免费自托管 | 无 AI 能力,纯基础设施 |
| 自己写 Playwright + LLM | 完全可控 | 维护成本高,CAPTCHA 和代理要自己解决 |
给投资人
市场分析
- 赛道规模:Agentic Browser 市场 2024 年为 $4.5B,预计 2034 年达 $76.8B
- 增长率:年复合增长率极高(~33% CAGR),属于 AI Infra 最热赛道之一
- 驱动因素:LLM 推理能力突破(GPT-4o, Claude 4, Gemini 能准确理解网页结构);企业数字化转型对自动化的刚需;“Agentic AI”整体叙事升温
竞争格局
| 层级 | 玩家 | 定位 |
|---|---|---|
| 头部 | Bright Data Agent Browser | 企业级,1M+ 并发 |
| 腰部 | Browserbase, Browserless | 浏览器基础设施 |
| 腰部 | Browser Use | 开源 AI Agent 框架 |
| 新进入者 | Notte | 全栈(AI + 基础设施) |
| 消费者端 | ChatGPT Atlas, Perplexity Comet | 面向终端用户 |
Timing 分析
- 为什么是现在:2026 年三个条件同时成熟 —— LLM 能理解网页、浏览器自动化基础设施成熟、企业对 AI Agent 的接受度上升。
- 技术成熟度:感知层的方法论已被验证(86.2% 成功率),但距离“100% 可靠”还有距离。混合架构是务实的过渡方案。
- 市场准备度:开发者社区已经在积极使用(GitHub 1.8k stars),企业端需求明确但采购周期长。
团队背景
- CEO Andrea Pinto:MIT AI 研究员,Fulbright 学者,ETH Zurich/EPFL 背景,IBM Research/Amazon 经历
- CTO Lucas Giordano:EPFL MLO 实验室,4 年 ERP+AI 经验
- 团队规模:5 人,旧金山
- 两人合作 6 年,技术根基扎实
融资情况
- 已融资:$2.5M Pre-seed + YC S25($500K)
- 投资人:Kima Ventures, Drysdale Ventures, 2100 Ventures, Digital Currency Group, Eden Ventures
- 总融资约 $3.42M
- 估值:未公开
结论
一句话:Notte 是目前“把网站变 API”赛道里最完整的全栈方案,混合架构思路务实聪明,但作为 2025 年才成立的 5 人团队,能不能在 Browserbase 和 Browser Use 的夹击下跑出来还要看执行力。
| 用户类型 | 建议 |
|---|---|
| 开发者 | 值得试。100 小时免费够折腾,混合架构比纯 AI 方案靠谱。如果你在维护 Playwright 脚本,可以考虑迁移。 |
| 产品经理 | 关注。“先 Agent 后 Script”的渐进式体验和感知层中间抽象是好的产品思路,值得借鉴。 |
| 博主 | 可以写。SSPL 许可证争议、AI Agent 安全隐患、混合 vs 纯 AI 路线之争都是好选题。 |
| 早期采用者 | 推荐尝试。免费额度慷慨,上手简单,SOC 2 认证说明安全性有保障。但不要把关键流程 100% 押在上面。 |
| 投资人 | 有意思。$76.8B 赛道、YC 背书、MIT/EPFL 背景团队,但 $3.4M 的融资面对 Browserbase 等更充裕对手还是偏少。 |
资源链接
2026-03-05 | Trend-Tracker v7.3