Notte:让浏览器自动化脚本不再"一碰就碎"
2026-01-28 | ProductHunt | 官网 | GitHub
30秒快速判断
这App干嘛的:把传统的浏览器自动化脚本(Playwright/Selenium)和AI结合起来——脚本处理确定性操作,AI处理网页变化时的"救火"工作。
值不值得关注:值得。如果你写过爬虫或RPA脚本,一定经历过"网站改个按钮class名,脚本就挂了"的痛苦。Notte的Hybrid方案直击这个痛点,而且100%开源、YC S25背书、免费100小时/月。
与我有关三问
与我有关吗?
目标用户是谁:
- 写浏览器自动化脚本的开发者
- 做RPA/数据采集的团队
- 构建AI Agent需要"上网"能力的产品
我是吗? 如果你符合以下任一场景,你就是目标用户:
- 维护过Playwright/Puppeteer脚本,被网站UI变化折磨过
- 想让AI Agent能自动填表单、下单、登录
- 需要批量处理网页但又不想一个个处理CAPTCHA和反爬
什么场景会用到:
- 每周爬取竞品价格 → 用Notte,脚本失效时AI自动补救
- 自动化填写政府/企业表单 → Hybrid Workflow处理复杂流程
- AI Agent需要浏览器能力 → 一行代码接入
对我有用吗?
| 维度 | 收益 | 代价 |
|---|---|---|
| 时间 | 脚本维护减少50%+(官方数据) | 5分钟上手,Playwright用户秒懂 |
| 金钱 | 免费100小时/月够个人项目用 | 需要自带LLM API Key(Gemini/OpenAI) |
| 精力 | 不用再"脚本挂了→排查→修selector→部署" | 学习Hybrid Workflow概念 |
ROI判断:如果你每月花超过2小时维护爬虫脚本,试一下Notte的AgentFallback功能。零成本验证。
喜闻乐见吗?
爽点在哪:
- AgentFallback:脚本选择器失效时,AI自动接管那一步,其他流程照常走。不用重写整个脚本。
- Perception Layer:把乱七八糟的DOM转成结构化语义图,LLM不会"看花眼"。
"哇"的瞬间:
"最酷的一点是你不需要重做任何事。只需用 AgentFallback 包装脚本,如果选择器断了,Agent 会动态处理该步骤,其余流程继续运行。" — Sam Morris (ProductHunt)
用户真实评价:
正面:"虽然我有偏见,但这对我来说真的超级好用且直观,几乎可以自动化我能想到的任何事情" — Sam Morris
创始人坦诚:"跑分 90,但大规模实战时还是挺拉胯的" — Andrea Pinto(所以他们做了Hybrid方案)
给独立开发者
技术栈
- 语言:Python
- 浏览器驱动:Playwright + Patchright (Chromium)
- 核心架构:Perception Layer + Hybrid Agent Workflows
- AI/模型:BYOK(自带API Key),支持Gemini、GPT-4等
核心功能实现
Notte的核心是两层:
-
Perception Layer:把网页DOM转成语义图。不是喂给LLM原始HTML(容易幻觉),也不是截图(贵且慢),而是裁剪出"这里有个登录按钮、那里有个输入框"的结构化描述。
-
Hybrid Workflow:用Playwright写确定性步骤(打开页面、点击已知按钮),只在"这一步可能变"的地方调用AI。成本降50%,可靠性提升。
开源情况
- 开源吗:是,100%开源
- 协议:SSPL-1.0(注意:不是MIT,商业使用有限制)
- GitHub:1.8k stars, 166 forks
- 自己做难度:中等。Perception Layer是核心差异化,自己实现需要大量调优。
商业模式
- 变现方式:使用量付费(浏览器时长 + Agent执行 + 数据传输)
- 定价:免费100小时/月,付费$10起
- 企业:SOC-2合规、SSO、On-prem选项
巨头风险
OpenAI在2025年1月发布了Operator(基于浏览器的Agent)。但Notte的差异化在于:
- 开源+可自托管
- Hybrid方案(不是纯AI,成本更低)
- 企业级功能(凭证管理、反检测)
短期内被"做掉"的风险不高,因为定位不同——OpenAI做的是消费级Agent,Notte做的是开发者工具。
给产品经理
痛点分析
- 解决什么问题:浏览器自动化脚本因网站UI变化而失效
- 痛点有多痛:高频刚需。任何做过爬虫/RPA的人都经历过"脚本挂了"
用户画像
| 类型 | 场景 | 痛点 |
|---|---|---|
| 爬虫开发者 | 定期采集数据 | 网站改版脚本就挂 |
| RPA团队 | 自动化业务流程 | 表单结构变化导致流程中断 |
| AI Agent开发者 | Agent需要浏览器能力 | 自己搞基础设施太麻烦 |
功能拆解
| 功能 | 类型 | 说明 |
|---|---|---|
| Perception Layer | 核心 | DOM→语义图,降低LLM幻觉 |
| Hybrid Workflows | 核心 | 脚本+AI混合,省钱又可靠 |
| AgentFallback | 核心 | 选择器失效时AI自动接管 |
| Stealth Sessions | 核心 | CAPTCHA、代理、反检测 |
| Secrets Vault | 核心 | 企业级凭证管理 |
| Digital Personas | 锦上添花 | 自动生成邮箱/手机号/2FA |
竞品差异
| vs | Notte | Browserbase | Skyvern | Browser Use |
|---|---|---|---|---|
| 核心差异 | Hybrid(脚本+AI) | 纯基础设施 | 视觉驱动 | 纯AI |
| 价格 | 免费100h/月 | $99/500h | 有免费层 | 开源 |
| 优势 | 成本低+可控 | 规模化稳定 | 视觉识别强 | 社区活跃 |
| 劣势 | 新产品 | 不带AI逻辑 | 截图成本高 | 需自建基础设施 |
可借鉴的点
- Hybrid思路:不是"AI或脚本"的二选一,而是混合——值得其他自动化产品参考
- AgentFallback设计:优雅的降级方案,脚本失效时AI补位
- 创始人坦诚:"跑分 90 但生产拉胯"——承认问题再给解决方案,比吹牛更有说服力
给科技博主
创始人故事
- 创始人:Andrea Pinto (CEO) + Lucas Giordano (CTO)
- 背景:2019年在EPFL认识,合作6年。MIT、Oracle、IBM Research的ML/LLM研究经验
- 为什么做这个:"Web是为人类设计的,而不是AI Agent"——他们先做了感知层希望提升Agent表现,发现不够,于是做了混合方案
争议点/讨论角度
- SSPL协议争议:100%开源但用SSPL而非MIT,商业使用有限制
- 创始人诚实的自我批评:"跑分 90 但实战拉胯"——可以写"创始人如何用坦诚赢得信任"
- AI Agent的可靠性困境:行业共识是"demo很酷,生产很难",Notte的Hybrid方案是否是答案?
热度数据
- PH排名:#16 Weekly Top,300票
- GitHub:1.8k stars
- YC:S25批次
内容建议
- 适合写的角度:"为什么AI浏览器自动化总是'不可靠'?这家YC公司的解法"
- 蹭热点机会:OpenAI Operator发布后,可以对比Notte的不同路线
给早期采用者
定价分析
| 层级 | 价格 | 包含 | 够用吗? |
|---|---|---|---|
| 免费 | $0 | 100 浏览器小时/月 | 个人项目/验证想法绝对够 |
| 付费 | $10起 | 更多用量 | 小团队日常够用 |
| 企业 | 定制 | SOC-2、SSO、私有化部署 | 企业合规需求 |
上手指南
- 上手时间:5分钟
- 学习曲线:低(如果你用过Playwright,更快)
- 步骤:
pip install nottepatchright install --with-deps chromium- 写几行Python,跑第一个Agent
import notte
from dotenv import load_dotenv
load_dotenv()
with notte.Session(headless=False) as session:
agent = notte.Agent(session=session, reasoning_model='gemini/gemini-2.5-flash', max_steps=30)
response = agent.run(task="在Google图片搜索猫咪表情包")
坑和吐槽
- 需要自带LLM Key:Notte不提供模型,你要准备Gemini/OpenAI的API Key
- SSPL协议:如果你想在商业SaaS里直接用,要注意协议限制
- 新产品:2025年才成立,长期稳定性和支持质量有待验证
安全和隐私
- 数据存储:浏览器会话在隔离容器运行
- 加密:凭证静态+传输加密
- 合规:SOC 2 Type II
替代方案
| 替代品 | 优势 | 劣势 |
|---|---|---|
| Browser Use | 纯开源(MIT)、社区活跃 | 需自建基础设施 |
| Skyvern | 视觉识别强、不依赖DOM | 截图处理成本高 |
| Browserbase | 规模化稳定 | 不带AI逻辑,贵 |
| 自己写Playwright | 完全可控 | 维护成本高 |
给投资人
市场分析
- 赛道规模:AI Agent市场2024年$5.9B → 2034年$105.6B (CAGR 38.5%)
- 增长率:Agentic AI市场CAGR 43.84%
- 驱动因素:企业自动化需求、LLM能力提升、浏览器成为AI控制层
竞争格局
| 层级 | 玩家 | 定位 |
|---|---|---|
| 头部基础设施 | Browserbase | 云浏览器平台 |
| Vision-based | Skyvern | 截图+视觉AI |
| 开源框架 | Browser Use, Notte | 开发者工具 |
| 巨头入场 | OpenAI Operator | 消费级Agent |
Timing分析
- 为什么是现在:
- LLM能力到达"可用于生产"的临界点
- Gartner预测40%企业应用将嵌入AI Agent by 2026 (现在<5%)
- OpenAI Operator验证赛道,但开发者工具市场仍有空白
- 技术成熟度:Hybrid方案是对"纯AI不够可靠"的务实回应
- 市场准备度:早期采用者阶段,企业规模化采用预计2026-2027
团队背景
- 创始人:Andrea Pinto (CEO) + Lucas Giordano (CTO)
- 核心团队:5人,MIT/EPFL教育背景
- 过往成绩:MIT、Oracle、IBM Research的ML/LLM研究经验
- 合作时长:6年
融资情况
- 已融资:Y Combinator S25 (~$500K)
- 投资人:Y Combinator
- 估值:未披露
结论
Notte是浏览器自动化的"实用主义解法"——不追求纯AI的酷炫,而是脚本+AI混合的可靠。
| 用户类型 | 建议 |
|---|---|
| 开发者 | ✅ 强烈推荐试用。免费100小时够验证,AgentFallback解决了脚本维护的痛 |
| 产品经理 | ✅ 值得关注。Hybrid思路和AgentFallback设计值得借鉴 |
| 博主 | ✅ 有写的价值。创始人坦诚、技术方案有差异化、YC背书 |
| 早期采用者 | ✅ 可以上手。5分钟上手,免费层够用,但注意SSPL协议 |
| 投资人 | ⚠️ 观察。赛道好、团队强,但OpenAI入场后竞争加剧 |
资源链接
Sources
- Notte - Web Automation Platform
- GitHub - nottelabs/notte
- Nottelabs | Y Combinator
- Top 10 Browser Use Agents 2026
- AI Agents Market Size
- 2026 Outlook: AI-Driven Browser Automation
- Best Browserbase Alternatives 2026
2026-01-28 | Trend-Tracker v7.3