返回探索

Willow Voice For Teams

💡 Willow Voice 是一款专为追求效率的团队和开发者打造的 AI 语音听写工具。它凭借 Groq 硬件加速实现了 200ms 的极速响应,不仅能精准转录,还能自动去除口癖、智能排版,并根据不同 App(如 Slack 或邮件)自动切换语气。通过团队共享词典和企业级安全合规,它让语音输入变得比打字更高效、更专业,是知识工作者的“打字外挂”。

"它就像是你大脑与屏幕之间的“高速同传”,不仅能秒懂你的碎碎念,还能顺手帮你修饰成得体的公文。"

30秒快速判断
这App干嘛的:按快捷键说话即可将语音实时转化为格式工整、去口癖的文字,支持全应用使用。
值不值得关注:值得关注。响应极快(200ms),准确率高,由斯坦福退学 YC 团队开发,获 Reddit 联创等名投支持,Uber 等企业已采用。
8/10

热度

9/10

实用

147

投票

产品画像
完整分析报告

Willow Voice for Teams:你的键盘可能真的要退休了

2026-03-06 | Product Hunt | 官网

Willow Voice 产品界面

截图解读:这是 Willow Voice 的官网首页。标题直接打出“每天不打字省一小时”,下面展示了一封用语音听写生成的邮件——格式工整、语气自然。整体设计非常 Apple 风,紫色主调,极简干净。一个“Download for Mac”按钮就是全部。


30 秒快速上手

这 App 是干嘛的:按一个快捷键,对着电脑说话,它就帮你把语音变成格式工整的文字——自动去掉“嗯”、“啊”、“就是说”这些口癖,自动加标点、分段、修正错误。在任何 App 里都能用。Teams 版新增了团队共享词典和企业合规功能。

值不值得关注:值得。这不是又一个语音转文字工具——Willow 用了 Groq 的 LPU 硬件加速 + 自己微调的 Llama 模型,200 毫秒出结果,准确率比系统内置听写高 3 倍。斯坦福退学的 YC 创业团队,拿到 Alexis Ohanian(Reddit 联创)和 Dharmesh Shah(HubSpot 联创)的投资,Uber 等企业已经在用。不过要注意:$15/月的订阅不算便宜,iOS 端还有些明显的 Bug。


核心三问

与我有关吗?

  • 目标用户是谁:每天要打大量文字的知识工作者——写邮件的、发 Slack 的、做笔记的、写文档的、用 AI 工具(Cursor、Claude Code)的开发者。
  • 我是吗:如果你每天花超过 1 小时打字,而且觉得“脑子想得比手快”——你就是目标用户。
  • 什么场景会用到
    • 写邮件、回 Slack 消息 -> 说一句话就搞定,Willow 自动帮你调整语气和格式。
    • 用 Cursor/Claude Code 写 Prompt -> 官方推的“Vibe Coding”,说话比打字快 4 倍。
    • 团队里有专有名词(公司名、产品名、缩写)总被拼错 -> Teams 版的共享词典解决这个问题。
    • 你是非英语母语者但要写英文 -> 语音输入比打字自然得多。
    • 你需要在安静环境工作 -> Quiet Mode(小声说话模式)可以使用。

对我有用吗?

维度收益代价
时间官方称省 1 小时/天,用户反馈 90% 打字被替代几乎零学习成本——按键说话就行
金钱打字效率提升个人 $15/月,团队 $10/人/月
精力不用在脑子和键盘之间做“翻译”,想到就说需要习惯对着电脑说话(开放办公室可能尴尬)

ROI 判断:如果你每天写超过 2000 字(邮件+消息+文档),每周免费的 2000 词肯定不够用,$15/月几乎是必须的。但考虑到一个月省下来的时间,这钱花得值。建议先用免费额度试一周,看自己实际用量再决定。

大家觉得怎么样?

爽点在哪

  • 200ms 响应:说完话几乎瞬间出文字,不像系统自带听写那样要等。
  • 自动去口癖:你说“嗯...就是说...那个...我觉得这个方案不错”,它输出“我觉得这个方案不错”。
  • 上下文感知:在写邮件时它知道要用正式语气,在 Slack 里它知道要随意一点。

“哇”的瞬间

Willow 语音转文字对比

截图解读:左边是你说的话原文(充满“uh”、“I mean”、重复),右边是 Willow 处理后的结果——干净、简洁、得体。这个对比直接让人理解产品价值。旁边浮动的 Slack、Gmail、ChatGPT 图标说明它在哪里都能用。

用户真实评价

"Willow 捕捉语音,清理废话,并将其转化为可用的文本。SOP、Slack 消息、内容草稿。全部通过语音完成,甚至可以边走边说。" — @SamMollaeiEsq (Twitter)

"选择 Willow Voice 感觉是不需要思考的事情,因为我能够立即上手,完全没有学习曲线。它就是好用,太棒了。" — 用户评价

吐槽

iOS 键盘实现有问题:键盘比正常高 100 像素,切换 App 时会莫名其妙跳回 Messages,iPadOS 版甚至无法激活。— MacRumors 论坛用户


给独立开发者

技术栈

  • 核心 LLM:基于 Llama-3.1-8b 的 LoRA 微调模型
  • 推理层:GroqCloud 专用实例,LPU (Language Processing Unit) 加速 + 投机解码
  • 处理管线:多模型管线——语音转文字 (STT) + 文本格式化/个性化 (text-to-text)
  • 响应延迟:~200ms(切换到 Groq 后比之前快了 300-500ms)
  • 平台:Mac (原生), iOS (键盘), Windows (2026 年 1 月上线)
  • 离线模式:有,Mac 和 iOS 支持本地离线听写

核心功能怎么实现的

整体是一个 STT + LLM 格式化 的管线架构:

  1. 语音输入 -> STT 引擎转成原始文本
  2. 原始文本 -> 微调的 Llama 模型做格式化、去口癖、加标点、分段
  3. 上下文感知:检测当前活动的 App,动态调整输出风格(邮件正式、Slack 随意)
  4. 自定义词典:用户/团队添加的专有名词在推理时注入 Prompt

技术门槛在三个地方:(1)延迟——200ms 是硬指标,Groq 的 LPU 是关键;(2)准确率——自己微调的 LoRA 比通用模型好很多;(3)跨平台——Mac 原生 App + iOS 键盘 + Windows,每个平台的音频采集和文本注入逻辑都不同。

开源情况

  • 不开源:GitHub 上没有 Willow Voice 的官方仓库
  • 类似开源项目
    • free-whisper-flow — 用 Deepgram 的免费 API 实现类似功能,开源免费
    • 本质上就是 Whisper/Deepgram STT + LLM 格式化,自己搭一个 MVP 不难
  • 自己做难度:中。核心功能(语音转文字+格式化)用 Whisper + Claude API 可以 1-2 周做出原型。但要做到 200ms 延迟和跨平台、上下文感知,难度上升到 3-6 人月。

商业模式

  • 变现方式:SaaS 订阅
  • 个人版:$15/月 或 $144/年,免费层每周 2000 词
  • 团队版:$10/用户/月(含共享词典、管理员控制、SOC2/HIPAA 合规)
  • 收入:2025 年 9 月已达 $550K,5 人团队
  • 用户增长:50% MoM(月环比增长)
  • 企业客户:Uber, Heidi Health, Zeg;GitHub/Canva/Webflow 员工也在用

巨头风险

中等风险,但比想象中安全一些:

  • Apple Dictation 在 M1+ 上已经免费内置,但准确率和格式化能力远不如 Willow
  • 微软有 Windows Speech Recognition,但体验差且没有 AI 格式化
  • 真正的威胁是 Wispr Flow——同赛道,已融资 $56M(Willow 的 11 倍),覆盖 Mac/Windows/iOS
  • Willow 的护城河:(1)Groq 带来的 200ms 极低延迟;(2)Teams 版的企业级功能(共享词典、SOC2、HIPAA);(3)开发者场景(Cursor/IDE 集成)是差异化方向

给产品经理

痛点分析

  • 解决什么问题:知识工作者每天花大量时间打字,尤其是邮件、消息、文档这些“脑子想好了但手跟不上”的场景。
  • 痛点有多痛:高频(每天多次)、中度刚需。不用不会死,但用了真的能省时间。Teams 版解决的是团队专有名词一致性问题——这在大公司里是真痛点。

用户画像

  • 核心用户:每天写大量文字的知识工作者(PM 写 PRD、销售发邮件、开发者写 Prompt)
  • 扩展用户:有无障碍需求的用户(手部受伤、RSI 重复性劳损)
  • 新增用户(Teams 版):需要团队术语一致性的企业团队

功能拆解

功能类型说明
语音转文字+自动格式化核心说话变文字,自动加标点分段
去口癖/去重复核心自动删掉“嗯”、“那个”、重复的话
上下文感知核心检测当前 App 自动调整输出风格
自定义词典核心添加专有名词确保拼写正确
共享团队词典(Teams)差异化团队统一术语
AI Mode锦上添花说简短提示,输出完整消息
Quiet Mode锦上添花小声说话也能识别
离线模式锦上添花完全本地处理,不联网
SOC2/HIPAA 合规(Teams)企业级零数据留存+合规认证

竞品差异

维度Willow VoiceWispr FlowVoibeApple Dictation
核心差异200ms 延迟+上下文感知跨平台最全完全本地离线免费内置
准确率比内置高 3x95%+依赖 Whisper一般
价格$15/月$12/月$99 一次性免费
团队功能共享词典+SOC2+HIPAA
融资$5M$56M未知N/A (Apple)
劣势iOS Bug 多,订阅贵没有团队版仅 Mac不够智能

可借鉴的点

  1. “每天省 1 小时”的价值定位:不说“最好的语音转文字”,而是直接量化收益,让用户算得过来账。
  2. Teams 版的共享词典:任何 B2B SaaS 都可以学——让团队共享“知识”而不只是“工具”。
  3. 上下文感知:检测当前 App 调整输出——这个思路可以应用到任何 AI 工具。
  4. 开发者版的精准定位:单独为 Cursor/IDE 用户做了“Vibe Coding”版本,引用 Karpathy 名言做营销,精准打中目标人群。

给科技博主

创始人故事

  • 创始人:Allan Guo (CEO) + Lawrence Liu (CTO)
  • 背景:斯坦福大一退学创业。最初带着另一组联创(后来离开了)进了 YC X25 batch。
  • 为什么做这个:他们最初做的是医疗方向(辅助生活设施管理软件),失败了。Lawrence Liu 在 X 上直言:“我们在斯坦福大一退学后创办了 Willow,最初是做医疗创业,但失败了。”在和医生交流中发现语音 AI 记录工具特别有用,于是转型做通用语音听写。
  • 投资人评价: “Allan 的愿景不仅是创建一个出色的听写应用,从长远来看,他的目标是创建一个可以控制计算机的界面,这让我印象深刻。”

争议点/讨论角度

  • 订阅 vs 一次性买断:Voibe $99 终身 vs Willow $15/月,5 年下来 Willow 要花 $900。这在社区里引发了“停止付费就完全不能用”的讨论。
  • 隐私:默认云端处理(虽然有离线模式),iOS 版后台持续录音的设计被 MacRumors 论坛用户质疑。
  • $5M vs $56M:Wispr Flow 融了 Willow 的 11 倍,但 Willow 在开发者和企业市场找到了差异化。
  • “杀死键盘”是真的吗?:官方说替代 90% 打字,但代码、特殊格式、非英语内容还是得打字。

热度数据

  • PH 投票:147 票(中等)
  • Twitter/X: “Willow for Developers”发布推文获 487 赞、20 万+ 浏览,在开发者圈有一定关注。
  • 媒体覆盖:TechCrunch、TechBuzz 均有报道。
  • 总评:热度稳健上升,不是爆款但有实力。

内容建议

  • 适合写的角度: “斯坦福退学生的第二次创业:从医疗失败到 AI 语音的 $5M 融资之路”——创始人故事有料。
  • 实测对比: “Willow vs Wispr Flow vs Apple Dictation:我用语音写了一周邮件”——实操内容有流量。
  • 开发者向: “Karpathy 说英语是最火的编程语言——这个工具让你真的用嘴写代码”——蹭 Vibe Coding 热度。

给早期采用者

定价分析

层级价格包含功能够用吗?
免费$0/周 2000 词所有功能,只限词数轻度使用够了,但写几封邮件就用完
Pro$15/月 或 $144/年无限词数+全部功能够用
Teams$10/用户/月共享词典+管理+SOC2/HIPAA企业用

上手指南

  • 上手时间:5 分钟
  • 学习曲线:极低——下载、安装、按快捷键说话。
  • 步骤
    1. 去 willowvoice.com 下载(Mac/Windows/iOS 都有)。
    2. 安装后,任何 App 里按 Fn 键(或自定义快捷键)。
    3. 开始说话,松开键就出文字。
    4. (可选)添加自定义词典,让它认识你的专有名词。
    5. (可选)开启离线模式,完全本地处理。

避坑指南

  1. iOS 键盘体验粗糙:键盘高度异常、切换 App 时跳回 Messages、iPadOS 版直接不能用。桌面版好很多。
  2. 非英语语言支持弱:虽然号称支持 100+ 语言,但用户反馈非英语转录质量不稳定。
  3. 免费额度太少:每周 2000 词,写两封长邮件就没了。基本是“试用”而不是“免费层”。
  4. 停订即停用:不像 Voibe 买断制,Willow 停止付费就完全不能用。

安全和隐私

  • 数据存储:默认云端处理,可选离线模式(Mac/iOS)。
  • 隐私政策:声称不存储或收集语音和转录数据(除非用户主动选择加入以帮助改善模型)。
  • 合规认证:SOC 2 Type II + HIPAA(Teams 版可强制零数据留存)。
  • 离线模式:有,完全本地,不联网。

替代方案

替代品优势劣势
Wispr Flow ($12/月)跨平台最全,融资雄厚没有团队版,没有离线模式
Voibe ($99 一次性)买断制,完全本地仅 Mac,功能不如 Willow 丰富
Resonant (免费)完全免费+本地处理仅 Mac,功能基础
Apple Dictation (免费)M1+ 内置,零成本准确率低,无 AI 格式化
Superwhisper ($249 一次性)买断制,本地处理价格高,仅 Mac

给投资人

市场分析

  • 语音识别市场:2026 年 $28.3B,CAGR 19.8%。
  • AI 语音生成市场:2025 年 $4.16B → 2031 年 $20.71B,CAGR 30.7%。
  • 语音助手市场:2024 年 $7.35B → 2030 年 $33.74B。
  • 驱动因素:ChatGPT 让对话式 AI 成为主流认知;远程/混合办公增加了文字沟通量;开发者“Vibe Coding”趋势。

竞争格局

层级玩家定位
平台内置Apple Dictation, Windows STT免费但笨
头部创业Wispr Flow ($56M 融资)跨平台全覆盖
腰部创业Willow Voice ($5M), Superwhisper, Voibe各有差异化
开源/免费Resonant, free-whisper-flow本地+免费

入场时机分析

  • 为什么是现在:(1)Groq 等推理芯片让 200ms 实时处理成为可能;(2)Karpathy 的“英语是最热编程语言”让语音输入在开发者圈获得正当性;(3)远程办公使键盘输入量激增。
  • 技术成熟度:STT 准确率已达可用水平,LLM 格式化能力成熟,推理成本持续下降。
  • 市场准备度:用户已习惯和 AI 对话(ChatGPT 月活 2 亿+),从“和 AI 对话”到“对 AI 说话写字”是自然延伸。

团队背景

  • 创始人:Allan Guo (CEO, 斯坦福 CS 退学), Lawrence Liu (CTO, 斯坦福退学)。
  • 团队规模:5 人。
  • YC batch:X25。
  • 过往:医疗创业失败后转型,显示了团队的韧性和快速迭代能力。

融资情况

  • 总融资:$5M(两轮种子)。
  • 最新轮:$4.5M 种子轮(2025 年 11 月),BoxGroup 领投。
  • 天使投资人:Alexis Ohanian (Reddit 联创), Dharmesh Shah (HubSpot 联创), Tomer London (Gusto 联创)。
  • 对比:主要竞品 Wispr Flow 已融 $56M,资金差距明显。
  • 营收:2025 年 9 月达 $550K,说明有真实付费需求。

结论

一句话总结:Willow Voice 是语音听写赛道里技术体验最好的产品之一(200ms 延迟+AI 格式化),Teams 版的企业功能让它有了和 Wispr Flow 不同的增长路径。但 iOS 端体验粗糙、融资远少于竞品,需要在开发者和企业市场快速建立护城河。

用户类型建议
独立开发者技术架构值得学习(Groq+LoRA 微调的低延迟方案),但自己做 MVP 难度不大——核心壁垒在工程打磨和跨平台覆盖。
产品经理“共享词典”和“上下文感知”两个设计值得借鉴,量化价值定位(“省 1 小时/天”)的营销方式也可以学。
科技博主创始人故事(斯坦福退学、医疗失败转型)有料,开发者版蹭 Vibe Coding 热度适合写,目前第三方内容少竞争低。
早期采用者Mac/Windows 桌面版值得试,iOS 版先别急。免费 2000 词/周先体验,觉得离不开了再付费。
投资人方向对、团队有韧性、有营收验证($550K)。但 $5M vs Wispr Flow 的 $56M 是硬伤,需要在 Teams/企业赛道快速建立差异化。

资源链接

资源链接
官网https://willowvoice.com/
Product Hunthttps://www.producthunt.com/products/willow-voice
YC 页面https://www.ycombinator.com/companies/willow
TechCrunch 报道https://techcrunch.com/2025/11/12/willows-voice-keyboard-lets-you-type-across-all-your-ios-apps-and-actually-edit-what-you-said/
Groq 技术合作https://groq.com/customer-stories/how-willow-achieved-zero-downtime-and-500ms-faster-ai-responses-with-groq
定价页https://willowvoice.com/pricing
Teams 页https://willowvoice.com/teams
Crunchbasehttps://www.crunchbase.com/organization/willow-voice
GitHub(开源替代)https://github.com/moritzWa/free-whisper-flow

信息来源


2026-03-06 | Trend-Tracker v7.3

一句话判断

Willow Voice 是目前响应最快、体验最丝滑的语音听写工具之一,通过企业级功能和开发者定位建立了差异化。尽管面临强力竞品和移动端 Bug,其营收表现证明了强劲的市场需求。

常见问题

关于 Willow Voice For Teams 的常见问题

按快捷键说话即可将语音实时转化为格式工整、去口癖的文字,支持全应用使用。

Willow Voice For Teams 的主要功能包括:语音转文字+自动格式化、上下文感知风格调整、团队共享词典、离线模式、SOC2/HIPAA 合规。

免费(2000 词/周),Pro($15/月),Teams($10/用户/月)。

每天需处理大量文字的知识工作者,如写邮件的销售、发 Slack 的 PM、写 Prompt 的开发者。

Willow Voice For Teams 的主要竞品包括:Wispr Flow, Voibe, Apple Dictation, Superwhisper。

数据来源: ProductHunt2026年3月6日
最后更新: