Willow Voice for Teams:你的键盘可能真的要退休了
2026-03-06 | Product Hunt | 官网

截图解读:这是 Willow Voice 的官网首页。标题直接打出“每天不打字省一小时”,下面展示了一封用语音听写生成的邮件——格式工整、语气自然。整体设计非常 Apple 风,紫色主调,极简干净。一个“Download for Mac”按钮就是全部。
30 秒快速上手
这 App 是干嘛的:按一个快捷键,对着电脑说话,它就帮你把语音变成格式工整的文字——自动去掉“嗯”、“啊”、“就是说”这些口癖,自动加标点、分段、修正错误。在任何 App 里都能用。Teams 版新增了团队共享词典和企业合规功能。
值不值得关注:值得。这不是又一个语音转文字工具——Willow 用了 Groq 的 LPU 硬件加速 + 自己微调的 Llama 模型,200 毫秒出结果,准确率比系统内置听写高 3 倍。斯坦福退学的 YC 创业团队,拿到 Alexis Ohanian(Reddit 联创)和 Dharmesh Shah(HubSpot 联创)的投资,Uber 等企业已经在用。不过要注意:$15/月的订阅不算便宜,iOS 端还有些明显的 Bug。
核心三问
与我有关吗?
- 目标用户是谁:每天要打大量文字的知识工作者——写邮件的、发 Slack 的、做笔记的、写文档的、用 AI 工具(Cursor、Claude Code)的开发者。
- 我是吗:如果你每天花超过 1 小时打字,而且觉得“脑子想得比手快”——你就是目标用户。
- 什么场景会用到:
- 写邮件、回 Slack 消息 -> 说一句话就搞定,Willow 自动帮你调整语气和格式。
- 用 Cursor/Claude Code 写 Prompt -> 官方推的“Vibe Coding”,说话比打字快 4 倍。
- 团队里有专有名词(公司名、产品名、缩写)总被拼错 -> Teams 版的共享词典解决这个问题。
- 你是非英语母语者但要写英文 -> 语音输入比打字自然得多。
- 你需要在安静环境工作 -> Quiet Mode(小声说话模式)可以使用。
对我有用吗?
| 维度 | 收益 | 代价 |
|---|---|---|
| 时间 | 官方称省 1 小时/天,用户反馈 90% 打字被替代 | 几乎零学习成本——按键说话就行 |
| 金钱 | 打字效率提升 | 个人 $15/月,团队 $10/人/月 |
| 精力 | 不用在脑子和键盘之间做“翻译”,想到就说 | 需要习惯对着电脑说话(开放办公室可能尴尬) |
ROI 判断:如果你每天写超过 2000 字(邮件+消息+文档),每周免费的 2000 词肯定不够用,$15/月几乎是必须的。但考虑到一个月省下来的时间,这钱花得值。建议先用免费额度试一周,看自己实际用量再决定。
大家觉得怎么样?
爽点在哪:
- 200ms 响应:说完话几乎瞬间出文字,不像系统自带听写那样要等。
- 自动去口癖:你说“嗯...就是说...那个...我觉得这个方案不错”,它输出“我觉得这个方案不错”。
- 上下文感知:在写邮件时它知道要用正式语气,在 Slack 里它知道要随意一点。
“哇”的瞬间:

截图解读:左边是你说的话原文(充满“uh”、“I mean”、重复),右边是 Willow 处理后的结果——干净、简洁、得体。这个对比直接让人理解产品价值。旁边浮动的 Slack、Gmail、ChatGPT 图标说明它在哪里都能用。
用户真实评价:
"Willow 捕捉语音,清理废话,并将其转化为可用的文本。SOP、Slack 消息、内容草稿。全部通过语音完成,甚至可以边走边说。" — @SamMollaeiEsq (Twitter)
"选择 Willow Voice 感觉是不需要思考的事情,因为我能够立即上手,完全没有学习曲线。它就是好用,太棒了。" — 用户评价
吐槽:
iOS 键盘实现有问题:键盘比正常高 100 像素,切换 App 时会莫名其妙跳回 Messages,iPadOS 版甚至无法激活。— MacRumors 论坛用户
给独立开发者
技术栈
- 核心 LLM:基于 Llama-3.1-8b 的 LoRA 微调模型
- 推理层:GroqCloud 专用实例,LPU (Language Processing Unit) 加速 + 投机解码
- 处理管线:多模型管线——语音转文字 (STT) + 文本格式化/个性化 (text-to-text)
- 响应延迟:~200ms(切换到 Groq 后比之前快了 300-500ms)
- 平台:Mac (原生), iOS (键盘), Windows (2026 年 1 月上线)
- 离线模式:有,Mac 和 iOS 支持本地离线听写
核心功能怎么实现的
整体是一个 STT + LLM 格式化 的管线架构:
- 语音输入 -> STT 引擎转成原始文本
- 原始文本 -> 微调的 Llama 模型做格式化、去口癖、加标点、分段
- 上下文感知:检测当前活动的 App,动态调整输出风格(邮件正式、Slack 随意)
- 自定义词典:用户/团队添加的专有名词在推理时注入 Prompt
技术门槛在三个地方:(1)延迟——200ms 是硬指标,Groq 的 LPU 是关键;(2)准确率——自己微调的 LoRA 比通用模型好很多;(3)跨平台——Mac 原生 App + iOS 键盘 + Windows,每个平台的音频采集和文本注入逻辑都不同。
开源情况
- 不开源:GitHub 上没有 Willow Voice 的官方仓库
- 类似开源项目:
- free-whisper-flow — 用 Deepgram 的免费 API 实现类似功能,开源免费
- 本质上就是 Whisper/Deepgram STT + LLM 格式化,自己搭一个 MVP 不难
- 自己做难度:中。核心功能(语音转文字+格式化)用 Whisper + Claude API 可以 1-2 周做出原型。但要做到 200ms 延迟和跨平台、上下文感知,难度上升到 3-6 人月。
商业模式
- 变现方式:SaaS 订阅
- 个人版:$15/月 或 $144/年,免费层每周 2000 词
- 团队版:$10/用户/月(含共享词典、管理员控制、SOC2/HIPAA 合规)
- 收入:2025 年 9 月已达 $550K,5 人团队
- 用户增长:50% MoM(月环比增长)
- 企业客户:Uber, Heidi Health, Zeg;GitHub/Canva/Webflow 员工也在用
巨头风险
中等风险,但比想象中安全一些:
- Apple Dictation 在 M1+ 上已经免费内置,但准确率和格式化能力远不如 Willow
- 微软有 Windows Speech Recognition,但体验差且没有 AI 格式化
- 真正的威胁是 Wispr Flow——同赛道,已融资 $56M(Willow 的 11 倍),覆盖 Mac/Windows/iOS
- Willow 的护城河:(1)Groq 带来的 200ms 极低延迟;(2)Teams 版的企业级功能(共享词典、SOC2、HIPAA);(3)开发者场景(Cursor/IDE 集成)是差异化方向
给产品经理
痛点分析
- 解决什么问题:知识工作者每天花大量时间打字,尤其是邮件、消息、文档这些“脑子想好了但手跟不上”的场景。
- 痛点有多痛:高频(每天多次)、中度刚需。不用不会死,但用了真的能省时间。Teams 版解决的是团队专有名词一致性问题——这在大公司里是真痛点。
用户画像
- 核心用户:每天写大量文字的知识工作者(PM 写 PRD、销售发邮件、开发者写 Prompt)
- 扩展用户:有无障碍需求的用户(手部受伤、RSI 重复性劳损)
- 新增用户(Teams 版):需要团队术语一致性的企业团队
功能拆解
| 功能 | 类型 | 说明 |
|---|---|---|
| 语音转文字+自动格式化 | 核心 | 说话变文字,自动加标点分段 |
| 去口癖/去重复 | 核心 | 自动删掉“嗯”、“那个”、重复的话 |
| 上下文感知 | 核心 | 检测当前 App 自动调整输出风格 |
| 自定义词典 | 核心 | 添加专有名词确保拼写正确 |
| 共享团队词典(Teams) | 差异化 | 团队统一术语 |
| AI Mode | 锦上添花 | 说简短提示,输出完整消息 |
| Quiet Mode | 锦上添花 | 小声说话也能识别 |
| 离线模式 | 锦上添花 | 完全本地处理,不联网 |
| SOC2/HIPAA 合规(Teams) | 企业级 | 零数据留存+合规认证 |
竞品差异
| 维度 | Willow Voice | Wispr Flow | Voibe | Apple Dictation |
|---|---|---|---|---|
| 核心差异 | 200ms 延迟+上下文感知 | 跨平台最全 | 完全本地离线 | 免费内置 |
| 准确率 | 比内置高 3x | 95%+ | 依赖 Whisper | 一般 |
| 价格 | $15/月 | $12/月 | $99 一次性 | 免费 |
| 团队功能 | 共享词典+SOC2+HIPAA | 无 | 无 | 无 |
| 融资 | $5M | $56M | 未知 | N/A (Apple) |
| 劣势 | iOS Bug 多,订阅贵 | 没有团队版 | 仅 Mac | 不够智能 |
可借鉴的点
- “每天省 1 小时”的价值定位:不说“最好的语音转文字”,而是直接量化收益,让用户算得过来账。
- Teams 版的共享词典:任何 B2B SaaS 都可以学——让团队共享“知识”而不只是“工具”。
- 上下文感知:检测当前 App 调整输出——这个思路可以应用到任何 AI 工具。
- 开发者版的精准定位:单独为 Cursor/IDE 用户做了“Vibe Coding”版本,引用 Karpathy 名言做营销,精准打中目标人群。
给科技博主
创始人故事
- 创始人:Allan Guo (CEO) + Lawrence Liu (CTO)
- 背景:斯坦福大一退学创业。最初带着另一组联创(后来离开了)进了 YC X25 batch。
- 为什么做这个:他们最初做的是医疗方向(辅助生活设施管理软件),失败了。Lawrence Liu 在 X 上直言:“我们在斯坦福大一退学后创办了 Willow,最初是做医疗创业,但失败了。”在和医生交流中发现语音 AI 记录工具特别有用,于是转型做通用语音听写。
- 投资人评价: “Allan 的愿景不仅是创建一个出色的听写应用,从长远来看,他的目标是创建一个可以控制计算机的界面,这让我印象深刻。”
争议点/讨论角度
- 订阅 vs 一次性买断:Voibe $99 终身 vs Willow $15/月,5 年下来 Willow 要花 $900。这在社区里引发了“停止付费就完全不能用”的讨论。
- 隐私:默认云端处理(虽然有离线模式),iOS 版后台持续录音的设计被 MacRumors 论坛用户质疑。
- $5M vs $56M:Wispr Flow 融了 Willow 的 11 倍,但 Willow 在开发者和企业市场找到了差异化。
- “杀死键盘”是真的吗?:官方说替代 90% 打字,但代码、特殊格式、非英语内容还是得打字。
热度数据
- PH 投票:147 票(中等)
- Twitter/X: “Willow for Developers”发布推文获 487 赞、20 万+ 浏览,在开发者圈有一定关注。
- 媒体覆盖:TechCrunch、TechBuzz 均有报道。
- 总评:热度稳健上升,不是爆款但有实力。
内容建议
- 适合写的角度: “斯坦福退学生的第二次创业:从医疗失败到 AI 语音的 $5M 融资之路”——创始人故事有料。
- 实测对比: “Willow vs Wispr Flow vs Apple Dictation:我用语音写了一周邮件”——实操内容有流量。
- 开发者向: “Karpathy 说英语是最火的编程语言——这个工具让你真的用嘴写代码”——蹭 Vibe Coding 热度。
给早期采用者
定价分析
| 层级 | 价格 | 包含功能 | 够用吗? |
|---|---|---|---|
| 免费 | $0/周 2000 词 | 所有功能,只限词数 | 轻度使用够了,但写几封邮件就用完 |
| Pro | $15/月 或 $144/年 | 无限词数+全部功能 | 够用 |
| Teams | $10/用户/月 | 共享词典+管理+SOC2/HIPAA | 企业用 |
上手指南
- 上手时间:5 分钟
- 学习曲线:极低——下载、安装、按快捷键说话。
- 步骤:
- 去 willowvoice.com 下载(Mac/Windows/iOS 都有)。
- 安装后,任何 App 里按
Fn键(或自定义快捷键)。 - 开始说话,松开键就出文字。
- (可选)添加自定义词典,让它认识你的专有名词。
- (可选)开启离线模式,完全本地处理。
避坑指南
- iOS 键盘体验粗糙:键盘高度异常、切换 App 时跳回 Messages、iPadOS 版直接不能用。桌面版好很多。
- 非英语语言支持弱:虽然号称支持 100+ 语言,但用户反馈非英语转录质量不稳定。
- 免费额度太少:每周 2000 词,写两封长邮件就没了。基本是“试用”而不是“免费层”。
- 停订即停用:不像 Voibe 买断制,Willow 停止付费就完全不能用。
安全和隐私
- 数据存储:默认云端处理,可选离线模式(Mac/iOS)。
- 隐私政策:声称不存储或收集语音和转录数据(除非用户主动选择加入以帮助改善模型)。
- 合规认证:SOC 2 Type II + HIPAA(Teams 版可强制零数据留存)。
- 离线模式:有,完全本地,不联网。
替代方案
| 替代品 | 优势 | 劣势 |
|---|---|---|
| Wispr Flow ($12/月) | 跨平台最全,融资雄厚 | 没有团队版,没有离线模式 |
| Voibe ($99 一次性) | 买断制,完全本地 | 仅 Mac,功能不如 Willow 丰富 |
| Resonant (免费) | 完全免费+本地处理 | 仅 Mac,功能基础 |
| Apple Dictation (免费) | M1+ 内置,零成本 | 准确率低,无 AI 格式化 |
| Superwhisper ($249 一次性) | 买断制,本地处理 | 价格高,仅 Mac |
给投资人
市场分析
- 语音识别市场:2026 年 $28.3B,CAGR 19.8%。
- AI 语音生成市场:2025 年 $4.16B → 2031 年 $20.71B,CAGR 30.7%。
- 语音助手市场:2024 年 $7.35B → 2030 年 $33.74B。
- 驱动因素:ChatGPT 让对话式 AI 成为主流认知;远程/混合办公增加了文字沟通量;开发者“Vibe Coding”趋势。
竞争格局
| 层级 | 玩家 | 定位 |
|---|---|---|
| 平台内置 | Apple Dictation, Windows STT | 免费但笨 |
| 头部创业 | Wispr Flow ($56M 融资) | 跨平台全覆盖 |
| 腰部创业 | Willow Voice ($5M), Superwhisper, Voibe | 各有差异化 |
| 开源/免费 | Resonant, free-whisper-flow | 本地+免费 |
入场时机分析
- 为什么是现在:(1)Groq 等推理芯片让 200ms 实时处理成为可能;(2)Karpathy 的“英语是最热编程语言”让语音输入在开发者圈获得正当性;(3)远程办公使键盘输入量激增。
- 技术成熟度:STT 准确率已达可用水平,LLM 格式化能力成熟,推理成本持续下降。
- 市场准备度:用户已习惯和 AI 对话(ChatGPT 月活 2 亿+),从“和 AI 对话”到“对 AI 说话写字”是自然延伸。
团队背景
- 创始人:Allan Guo (CEO, 斯坦福 CS 退学), Lawrence Liu (CTO, 斯坦福退学)。
- 团队规模:5 人。
- YC batch:X25。
- 过往:医疗创业失败后转型,显示了团队的韧性和快速迭代能力。
融资情况
- 总融资:$5M(两轮种子)。
- 最新轮:$4.5M 种子轮(2025 年 11 月),BoxGroup 领投。
- 天使投资人:Alexis Ohanian (Reddit 联创), Dharmesh Shah (HubSpot 联创), Tomer London (Gusto 联创)。
- 对比:主要竞品 Wispr Flow 已融 $56M,资金差距明显。
- 营收:2025 年 9 月达 $550K,说明有真实付费需求。
结论
一句话总结:Willow Voice 是语音听写赛道里技术体验最好的产品之一(200ms 延迟+AI 格式化),Teams 版的企业功能让它有了和 Wispr Flow 不同的增长路径。但 iOS 端体验粗糙、融资远少于竞品,需要在开发者和企业市场快速建立护城河。
| 用户类型 | 建议 |
|---|---|
| 独立开发者 | 技术架构值得学习(Groq+LoRA 微调的低延迟方案),但自己做 MVP 难度不大——核心壁垒在工程打磨和跨平台覆盖。 |
| 产品经理 | “共享词典”和“上下文感知”两个设计值得借鉴,量化价值定位(“省 1 小时/天”)的营销方式也可以学。 |
| 科技博主 | 创始人故事(斯坦福退学、医疗失败转型)有料,开发者版蹭 Vibe Coding 热度适合写,目前第三方内容少竞争低。 |
| 早期采用者 | Mac/Windows 桌面版值得试,iOS 版先别急。免费 2000 词/周先体验,觉得离不开了再付费。 |
| 投资人 | 方向对、团队有韧性、有营收验证($550K)。但 $5M vs Wispr Flow 的 $56M 是硬伤,需要在 Teams/企业赛道快速建立差异化。 |
资源链接
信息来源
- Willow Voice 官网
- Product Hunt - Willow Voice
- Y Combinator - Willow
- TechCrunch - Willow's voice keyboard
- Groq Customer Story
- Crunchbase - Willow Voice
- MacRumors Forums
- Getvoibe - Willow Alternatives
- Wispr Flow vs Willow
- Getlatka - Willow Revenue
- Traded.co - Willow Funding
- GlobeNewsWire - Speech Recognition Market
- MarketsandMarkets - AI Voice Generator
- Twitter/X 搜索结果 (2026-02-04 至 2026-03-06)
2026-03-06 | Trend-Tracker v7.3