Willow on Windows:Windows 用户终于等来的 AI 语音输入神器
2026-01-29 | ProductHunt | 123 票
30 秒快速判断
这 App 是干嘛的:用语音代替打字,AI 自动帮你格式化、纠错、去掉“嗯啊那个”等废话,输出可以直接发送的文字。
值不值得关注:值得。如果你每天花大量时间写邮件、文档、消息,这工具能帮你提速 3-4 倍。Windows 版本刚发布,是尝鲜的好时机。
和谁比:主要竞品是 Wispr Flow(功能相似,都是 $12/月),Windows 自带语音输入太烂。
灵魂三问:它跟我有什么关系?
与我有关吗?
目标用户是谁:
- 每天写大量邮件/文档的职场人士
- 程序员(用语音给 AI Copilot 下提示词)
- 内容创作者
- 手部不便或打字困难的人
我是吗? 如果你每天打字超过 1 小时,或者经常需要在多个应用间切换写东西,你就是目标用户。
什么场景会用到:
- 写邮件回复 → 说话比打字快 3 倍
- 给 ChatGPT/Cursor 写长提示词 → 语音输入更自然
- 写会议记录、文档 → 边想边说
- 临时手不方便 → 语音救急
对我有用吗?
| 维度 | 收益 | 代价 |
|---|---|---|
| 时间 | 写作速度提升 3-4 倍 | 5 分钟学习成本 |
| 金钱 | 提高工作效率 | $0-15/月 |
| 精力 | 减少打字疲劳 | 需要能说话的环境 |
ROI 判断:如果你每天打字超过 30 分钟,免费版 2000 词/周先试试。感觉好再付费,$15/月对重度用户来说值回票价。
用起来爽吗?
爽点在哪:
- 零编辑输出:说完就能发,不用改错别字
- 上下文理解:知道你在写邮件还是发消息,自动调格式
- 专业术语准确:技术名词、公司名都能对上
用户怎么说:
"Willow Voice 每天为我节省了大量时间。简直是游戏规则的改变者。" — Alexis Ohanian (Reddit 联合创始人)
"我在期末周前摔断了胳膊。Willow 救了我的学期。" — 学生用户
"现在我甚至完全不需要复核它的准确性了。" — Mac 用户
给独立开发者
技术栈
| 层级 | 技术 | 说明 |
|---|---|---|
| 语音识别 | 自研模型 | 支持 100+ 语言 |
| LLM 格式化 | Meta Llama-3.1-8b (LoRA 微调) | 负责格式化、纠错、去填充词 |
| 推理加速 | Groq LPU | 延迟 < 500ms |
| 客户端 | 原生桌面应用 | Mac/Windows/iOS |
核心功能实现
- 语音转文字:本地收音 → 云端识别
- LLM 后处理:文本 → Llama 微调模型 → 格式化输出
- 上下文感知:检测当前应用,调整输出风格
- 个性化学习:从用户编辑中学习写作偏好
关键技术挑战是低延迟。Willow 用 Groq 专用实例跑推理,把延迟压到 500ms 以内,才能实现“说完就出”的体验。
开源情况
- Willow Voice 本身:闭源商业产品
- 同名开源项目:HeyWillow/willow 是 Amazon Echo 替代品,跟这个无关
- 类似开源项目:OpenAI Whisper(语音识别)+ LLM 可以搭建类似方案
自己做难度
难度:高,预计 6-12 人月
- 语音识别:可以用 Whisper,但准确度需要调优
- LLM 格式化:需要大量数据微调
- 低延迟推理:需要 Groq/专用硬件或做好缓存
- 跨平台客户端:Mac/Windows/iOS 三端开发
商业模式
| 层级 | 价格 | 目标用户 |
|---|---|---|
| 免费版 | $0 | 轻度用户,每周 2000 词 |
| 个人版 | $12-15/月 | 重度个人用户 |
| 团队版 | 按席位 | 企业团队 |
| 企业版 | 定制 | 大客户,需要安全合规 |
巨头风险
中等。苹果/微软都有内置语音输入,但准确度和智能格式化是短板。短期内不太可能做到 Willow 的水平。长期看,如果巨头重点投入这个方向,会有压力。
给产品经理
痛点分析
解决什么问题:
- 打字太慢,尤其是长文本
- 现有语音转文字不准,需要大量手动编辑
- 格式混乱,标点、分段都要自己加
痛点有多痛:
- 频率:高。每天都要打字
- 程度:中等偏高。不是刚需,但能显著提效
用户画像
| 用户类型 | 特征 | 使用场景 |
|---|---|---|
| 商务人士 | 每天写 20+ 邮件 | 邮件回复、报告 |
| 程序员 | 用 AI 工具编程 | 给 Cursor/ChatGPT 写提示词 |
| 内容创作者 | 写稿、写脚本 | 博客、视频脚本 |
| 行动不便者 | 打字困难 | 日常文字输入 |
功能拆解
| 功能 | 类型 | 说明 |
|---|---|---|
| 语音转文字 | 核心 | 基础能力 |
| 自动格式化 | 核心 | 加标点、分段 |
| 去填充词 | 核心 | 删掉“嗯啊那个” |
| 上下文感知 | 核心 | 根据应用调整风格 |
| 自定义词典 | 锦上添花 | 专业术语、公司名 |
| 离线模式 | 锦上添花 | 断网可用 |
| 团队词典 | 锦上添花 | 团队共享术语 |
竞品差异
| 维度 | Willow | Wispr Flow | Windows 内置 |
|---|---|---|---|
| 准确度 | 高 | 高 | 低 |
| 延迟 | ~200ms | ~500ms | - |
| 智能格式化 | 有 | 有 | 无 |
| 价格 | $12-15/月 | $12/月 | 免费 |
| 平台 | Mac/Win/iOS | Mac/Win/iOS | Win |
| 特色 | 个性化学习 | HIPAA 合规 | 内置 |
可借鉴的点
- 个性化学习:从用户编辑中学习,越用越准
- 零摩擦体验:按住热键说话,松开自动输入,无需切换窗口
- 上下文感知:邮件和微信消息的语气应该不同
- 渐进式定价:免费版能用,付费解锁无限
给科技博主
创始人故事
Allan Guo (CEO) 和 Lawrence Liu (CTO),斯坦福大学计算机系的大一学生,辍学创业。
故事线:
- 2024 年:加入 YC X25,做辅助生活设施管理软件
- 项目失败,转型超过 10 次
- 一年后找到语音输入方向
- 2025 年 7 月:完成 420 万美元融资
- 2025 年 11 月:iOS 版上线
- 2026 年 1 月:Windows 版发布
有意思的点:
- Allan 曾在斯坦福医学院做机器学习 + 神经科学研究
- 投资人包括 Reddit 联合创始人 Alexis Ohanian
- 企业客户包括 Uber、Heidi Health
争议点/讨论角度
- AI 输入 vs AI 输出:大家都在做 AI 生成内容,Willow 反其道而行做 AI 辅助输入
- 隐私问题:语音数据上云,虽然声称不存储,但总有顾虑
- 订阅疲劳:又一个 $15/月的工具,值不值得?
热度数据
- ProductHunt:123 票(Windows 版首发),整体 4.9/5 评分
- 用户增长:月环比增长 50%
- 企业客户:Uber、Heidi Health、Zego
内容建议
- 斯坦福辍学生的 10 次失败:创业故事永远有人看
- AI 输入革命:从 AI 写作到 AI 帮你写,一字之差
- Windows 用户的救赎:Mac 上好用的工具终于来 Windows 了
- 语音输入实测:对比 Windows 内置、Wispr Flow,看谁更准
给早期采用者
定价分析
| 层级 | 价格 | 包含功能 | 够用吗? |
|---|---|---|---|
| 免费版 | $0 | 每周 2000 词 | 轻度用户够,写几封邮件就用完了 |
| 个人版 | $12-15/月 | 无限词数 | 重度用户必需 |
| 团队版 | 按席位 | 共享词典 | 团队协作用 |
建议:先用免费版试一周,如果每天都用完额度,说明值得付费。
上手指南
上手时间:5 分钟
步骤:
- 前往 willowvoice.com 下载 Windows 版
- 安装,无需注册即可试用
- 打开任意应用,点击要输入的地方
- 按住 Fn 键(默认热键),开始说话
- 松开 Fn 键,文字自动输入
进阶:
- 双击 Fn 键进入“免提模式”,长篇内容不用一直按着
- 自定义词典添加专业术语
- 调整热键为你习惯的按键
坑和吐槽
- Windows 版是新发布的:可能有早期 Bug,遇到问题多反馈
- 需要网络:离线模式功能受限,没网的时候别指望
- 安静环境更准:嘈杂环境准确率会下降
- 专业术语:默认词典可能不认识行业黑话,需要自己加
安全和隐私
- 数据存储:声称云端处理但不存储语音数据
- 加密:端到端加密
- 合规:企业版支持高级安全合规
- 对比:Wispr Flow 有 SOC2 TypeII 和 HIPAA 认证,Willow 暂时没看到
替代方案
| 替代品 | 优势 | 劣势 |
|---|---|---|
| Wispr Flow | HIPAA 合规,SOC2 认证 | 据说内存占用高 (800MB) |
| Speechify | 平台最广 (含 Android) | 智能程度不如 Willow |
| Windows 内置 | 免费,无需安装 | 准确度差,无格式化 |
| Otter.ai | 会议转写强 | 不是实时输入工具 |
给投资人
市场分析
| 指标 | 数据 | 来源 |
|---|---|---|
| 语音识别市场 (2026) | $22.49B | Mordor Intelligence |
| 语音识别市场 (2031) | $61.71B | Mordor Intelligence |
| 年复合增长率 (CAGR) | 22.38% | Mordor Intelligence |
| 语音转文字 API 市场 (2030) | $8.6B | Fortune Business Insights |
驱动因素:
- 智能手机/智能音箱普及
- 远程办公增加文字沟通需求
- AI Copilot 时代,语音是高效交互方式
- 无障碍需求增长
竞争格局
| 层级 | 玩家 | 定位 |
|---|---|---|
| 头部巨头 | Microsoft/Apple/Google | 内置基础功能,免费 |
| 专业转写 | Otter.ai, Rev | 会议/采访转写 |
| AI 智能输入 | Willow, Wispr Flow, Aqua | 实时输入 + 智能格式化 |
| 开发者工具 | OpenAI Whisper | API/开源 |
Willow 定位在“AI 智能输入”细分赛道,直接竞品是 Wispr Flow。
时机分析
为什么是现在:
- LLM 成熟:Llama 3.1 让智能格式化成为可能
- 推理加速:Groq 等新硬件把延迟压到可用水平
- 需求增长:远程办公、AI Copilot 普及带来更多文字输入需求
- 用户习惯:Siri/Alexa 培养了语音交互习惯
团队背景
| 角色 | 姓名 | 背景 |
|---|---|---|
| CEO | Allan Guo | 斯坦福计算机/医学研究,大一辍学 |
| CTO | Lawrence Liu | 斯坦福计算机,大一辍学 |
过往成绩:从医疗领域转型过来,经历 10 次以上方向调整,说明团队韧性强。
融资情况
| 指标 | 数据 |
|---|---|
| 已融资 | $4.2M (天使轮, 2025.7) |
| 领投 | BoxGroup |
| 跟投 | Goodwater Capital, Burst Capital, Liquid 2 Ventures, YC |
| 天使投资人 | Dharmesh Shah (HubSpot), Alexis Ohanian (Reddit), Tomer London (Gusto), Max Mullen (Instacart) |
| 企业客户 | Uber, Heidi Health, Zego |
| 用户增长 | 月环比增长 50% |
投资人阵容亮眼,有多位知名创始人背书。
风险分析
| 风险 | 程度 | 说明 |
|---|---|---|
| 巨头竞争 | 中 | 苹果/微软可能增强内置功能 |
| 直接竞品 | 高 | Wispr Flow 功能相似,竞争激烈 |
| 技术壁垒 | 中 | 核心是调优,而非独家垄断技术 |
| 付费意愿 | 中 | $15/月在工具类产品中不算便宜 |
结论
Willow on Windows 是一个值得关注的 AI 语音输入工具。
对 Windows 用户来说,这是第一个真正好用的 AI 语音输入方案。Mac 用户早就有了,现在 Windows 用户终于能用上了。
| 用户类型 | 建议 |
|---|---|
| 开发者 | 值得研究技术实现,Llama + Groq 的方案有参考价值 |
| 产品经理 | 个性化学习和上下文感知的设计值得借鉴 |
| 博主 | 创始人故事 + AI 输入话题有丰富内容可写 |
| 早期采用者 | 免费试试,如果用得上就付费 |
| 投资人 | 赛道不错,团队有韧性,但竞争激烈需持续观察 |
资源链接
2026-01-30 | Trend-Tracker v7.3