返回探索

Spoke

macOS 专属私密语音转文字。按住按键,开口说话,搞定。

💡 Spoke 是一款为 macOS 打造的原生语音输入工具,主打“按住即说”的极简交互。它利用 Whisper 模型实现高精度的本地转录,在保护隐私的同时,彻底解决了系统自带听写功能断断续续、识别率低的痛点。最亮眼的是它的 Edit Mode(编辑模式),让你能通过语音指令直接改写、润色或翻译选中的文本。无论是快速回复消息、撰写长文档还是编写代码注释,Spoke 都能让你的输入效率提升数倍。

"Spoke 就像是给你的 Mac 装上了一个“读心术”挂件:你只需按住它倾诉,它就能把你的思绪精准地“瞬移”到屏幕上,甚至还能听懂你的指令帮你就地改稿。"

30秒快速判断
这App干嘛的:一款主打“按住就说”的原生 macOS 语音输入应用,支持本地处理与 AI 编辑模式。
值不值得关注:值得关注,特别是对于受够了 macOS 自带听写工具(易断断续续、识别差)的用户,但需注意该赛道已是红海。
4/10

热度

8/10

实用

93

投票

产品画像
完整分析报告

Spoke:macOS 上"按住就说"的语音输入,但赛道已经卷成红海

2026-03-06 | Product Hunt | 官网

Spoke 产品界面

Gemini 解读:这是 Spoke 的设置面板和菜单栏界面。深色模式、原生 macOS 设计,左侧导航包含 History/Audio/Transcription/Skills/License 五个板块。支持自定义快捷键(fn/Right Cmd),内置语法修复和翻译等 AI 技能。版本号 1.0.0。


30秒快速判断

这App干嘛的:按住一个键说话,松手后文字自动出现在光标处。原生 macOS 应用,主打隐私和本地处理。

值不值得关注:如果你天天被 macOS 自带听写的 30 秒超时和漏词折磨,值得试试。但说实话,2026 年这个赛道已经有 20+ 竞品,Spoke 的差异化并不算碾压级。


与我有关三问

与我有关吗?

  • 目标用户是谁:每天要大量文字输入的 Mac 用户 —— 写文档、回邮件、发消息、写代码注释
  • 我是吗:如果你打字速度跟不上脑速(大多数人如此 —— 打字 800 词/30 分钟 vs 说话 3000 词/30 分钟),你就是目标用户
  • 什么场景会用到
    • 在 Slack/微信中快速回复长消息 --> 按住说完松手
    • 写周报/文档时想到什么说什么 --> 比打字快 3-4 倍
    • 写代码注释/commit message --> Spoke 声称能识别变量名大小写
    • 不需要这个:纯代码编写(还是键盘更精准)

对我有用吗?

维度收益代价
时间文字输入速度提升 3-4 倍5 分钟上手
金钱省去订阅制工具的持续支出具体定价待确认
精力减少"想说的"到"打出来"的翻译损耗需要适应"说出来"的习惯

ROI 判断:如果你每天文字输入超过 1 小时,任何一款靠谱的语音输入工具都值得花 10 分钟去试。但 Spoke 不是唯一选择,甚至不一定是最佳选择 —— 免费的 Handy、开源的 VoiceInk 都能做到差不多的事。

喜闻乐见吗?

爽点在哪

  • 按住就说:不用点按钮、不用等加载,按住 fn 键开口就行
  • Edit Mode:选中一段文字,说"让语气更友好",AI 直接改 —— 这个功能确实有想象力
  • 技术上下文:写代码时说"camelCase 变量名"它真能识别 —— 如果真的好用的话

用户怎么说

"mac 听写功能已经坏了好几年了 —— 它会在句子中间漏词,标点符号也乱跳" —— @DnuLkjkjh (526 次观看)

"Mac 上的语音听写太烂了,我再也受不了了。60% 的情况下它完全没用。" —— @burkeholland (264 个赞, 2.17 万次观看)

这些不是 Spoke 的直接评价,但恰恰说明了痛点有多真实 —— Apple 自带听写烂到让人想砸键盘,所以才催生了这一堆替代品。


给独立开发者

技术栈

  • 前端:原生 macOS 应用(Swift,Menu Bar App 风格)
  • 语音引擎:大概率基于 Whisper 系列(WhisperKit 或 whisper.cpp),利用 Apple Silicon Metal GPU 加速
  • AI 处理:Edit Mode、语法修复、翻译等走云端 LLM
  • 架构:混合模式 —— 基础转录本地 + AI 增强功能云端

核心功能实现

macOS 语音转文字应用的技术栈在 2026 年已经非常成熟。核心链路:AVAudioEngine 采集麦克风 --> 16kHz mono Float32 归一化 --> WhisperKit/whisper.cpp 推理 --> macOS 键盘事件模拟输入到光标处。在 M1 上,base 模型能做到实时或更快,几乎无延迟。Spoke 的 Edit Mode 是差异化所在 —— 选中文字后调用云端 LLM 做语义理解和改写。

开源情况

  • 开源吗:不开源
  • 类似开源项目
    • VoiceInk —— 开源,whisper.cpp,$25-39
    • Handy —— 完全免费开源,号称"最可 fork 的"
    • Ammon Taylor 的项目 —— 刚发布的开源方案,Homebrew 一键安装
  • 自己做难度:中偏低。基础转录 1-2 周能做出来(感谢 WhisperKit),Edit Mode 这种 AI 功能再加 1-2 周。预计 1-2 人月。

商业模式

  • 变现方式:具体定价未在公开搜索中找到,需访问官网确认
  • 竞品定价参考:一次性 $19-$249,订阅 $7.99-$12/月
  • 用户量:PH 93 票,属于小众新品

巨头风险

Apple 是最大威胁。macOS 内置 Dictation 在 Apple Silicon 上已经支持离线,只是体验还很烂(30 秒超时、不学词汇、幻觉标点)。如果 Apple 在下一版 macOS 认真优化一下听写功能,这个赛道的独立开发者会集体遭殃。不过考虑到 Apple 这几年在听写上的投入程度(几乎为零),短期内问题不大。


给产品经理

痛点分析

  • 解决什么问题:macOS 自带听写太烂,30-60 秒就停,不学习用户词汇,技术术语识别差
  • 痛点有多痛:高频刚需。Twitter 上大量吐槽(264 个赞的帖子说"60% 的情况下它完全没用"),有人因此自己做了开源替代

用户画像

  • 目标用户 A:重度文字工作者(作家、博主、PM 写 PRD)—— 每天输入数千字
  • 目标用户 B:开发者 —— 写注释、commit message、文档,需要代码上下文识别
  • 目标用户 C:隐私敏感用户 —— 不想音频上传到云端

功能拆解

功能类型说明
按住说话转文字核心基础转录,光标处插入
本地转录核心隐私卖点
Edit Mode核心差异化选中文字后语音编辑,调用 AI 改写
语法修复锦上添花内置 AI 技能
翻译锦上添花内置 AI 技能
自定义拼写锦上添花品牌名/项目名记忆
代码上下文差异化变量名 camelCase 识别

竞品差异

vsSpokeVoiceInkSuperwhisperWispr Flow
核心差异Edit Mode + 代码上下文开源透明自定义模式最强上下文感知最好
价格待确认$25-39 一次性$85/年或 $249 永久$144/年
隐私混合(基础本地+AI 云端)纯本地本地+云端可选纯云端
优势代码友好、Edit Mode便宜、开源功能最全面最易上手

可借鉴的点

  1. Edit Mode 交互设计:选中文字 + 语音指令 = 自然语言编辑。这个交互模式值得所有文本编辑工具学习
  2. 代码上下文识别:为开发者场景专门优化,比通用方案更懂技术人群
  3. "按住就说"的极简交互:比点击按钮、等待加载的流程少了 2 步

给科技博主

创始人故事

  • 创始人:Sandheep(姓氏未公开)
  • 背景:独立开发者
  • 为什么做这个:"听写功能已经坏了好几年了,我想尽我的一份力来修复它"
  • 信仰:引用 Steve Jobs —— "通过创造美好的事物来表达对人性的赞赏"
  • 一个有情怀的独立开发者,但在产品营销和公开信息方面做得很少

争议点/讨论角度

  • 隐私矛盾:usespoke.app 说"设备端转录",spoke.so 说"语音数据在云端处理" —— 到底听哪个?这个矛盾本身就是一个好角度
  • 赛道过热:2026 年 macOS 语音输入已有 Spokenly、VoiceInk、Superwhisper、Wispr Flow、SpeakMac、SpokenKey、Handy 等 20+ 竞品。Whisper 开源后门槛太低了
  • 免费 vs 付费之争:有开发者写文章说"2026 年语音听写不应该收钱"然后发布了免费开源替代

热度数据

  • PH 排名:93 票,不算爆款
  • Twitter 讨论:Spoke 本身讨论量极低,但"macOS dictation sucks"是热门话题
  • 赛道热度:macOS 语音输入在 PH 上获得了专门的 Orbit Awards 分类奖

内容建议

  • 适合写的角度:《2026 年 macOS 语音输入大混战:20 款 App 对比,到底该选哪个?》
  • 蹭热点机会:每次 Apple 发布新 macOS 不改进 Dictation,就是一波流量

给早期采用者

定价分析

层级价格包含功能够用吗?
未公开需访问官网确认转录+AI 技能待确认
免费替代$0Handy(纯转录)基础够用
性价比之选$19-39SpeakMac/VoiceInk多数人够用

上手指南

  • 上手时间:5 分钟
  • 学习曲线:极低
  • 步骤
    1. 下载安装(原生 macOS App)
    2. 设置快捷键(默认 fn 或 Right Cmd)
    3. 在任意应用中按住快捷键说话,松手出文字

坑和吐槽

  1. 隐私说法不一致:两个官网域名(usespoke.app 和 spoke.so)对隐私的描述矛盾,需要注意
  2. 竞品太多:可能用了两天发现另一个更好的
  3. AI 功能走云端:Edit Mode 等高级功能需要网络,不是完全离线

安全和隐私

  • 数据存储:基础转录可能本地,AI 功能走云端
  • 隐私政策:官方说法矛盾("设备端" vs "云端处理并删除")
  • 建议:如果隐私是你的第一优先级,VoiceInk(纯本地+开源)或 Handy(免费+开源)更让人放心

替代方案

替代品优势劣势
VoiceInk ($25-39)开源、纯本地、一次性付费AI 功能有限
Handy (免费)完全免费开源,Homebrew 安装功能最基础
Superwhisper ($85/年)功能最全、自定义模式贵,界面复杂
Spokenly (本地免费)免费本地模式、100+ 语言上下文感知弱
SpeakMac ($19)最便宜、完全离线功能单一

给投资人

市场分析

  • 赛道规模:语音识别市场约 $20.8B (2026),到 2030 年预计 $23-54B
  • 增长率:14.6%-19.1% CAGR(取决于统计口径)
  • 驱动因素:AI 技术成熟(Whisper 开源)、Apple Silicon 本地推理、远程办公普及

竞争格局

层级玩家定位
头部Apple Dictation、Google Voice Typing平台内置
腰部Wispr Flow、Superwhisper成熟独立产品
新进入者Spoke、VoiceInk、Spokenly、SpeakMac 等细分场景

Timing 分析

  • 为什么是现在:Whisper 开源(2022)+ Apple Silicon 成熟(M1-M4)= 本地语音转文字首次可以做到实时+准确+免费
  • 技术成熟度:底层技术已经非常成熟,门槛低到"一个周末就能做出来"
  • 市场准备度:用户痛点真实(Apple Dictation 体验差),但供给过剩(20+ 竞品),价格战已经开始

团队背景

  • 创始人:Sandheep,独立开发者
  • 核心团队:可能是单人项目
  • 过往成绩:公开信息极少

融资情况

  • 已融资:无公开融资信息
  • 判断:大概率是自筹资金的独立项目,不是融资驱动的创业公司
  • 投资价值:单一产品 + 高度竞争赛道 + 低门槛 = 不太适合风投,更适合作为独立开发者的收入来源

结论

Spoke 做对了一件事:用 Edit Mode 让语音输入从"转录"升级到"编辑"。但在一个有 20+ 竞品、技术门槛已经低到免费开源的赛道里,93 票的 PH 表现说明它还没有找到足够响亮的声音。

用户类型建议
开发者值得研究 Edit Mode 的实现思路,但技术栈本身没有新东西
产品经理Edit Mode 是值得借鉴的交互创新,竞品调研的好素材
博主单独写 Spoke 流量有限,但"macOS 语音输入赛道混战"是好选题
早期采用者可以试试,但 VoiceInk(开源 $25)或 Handy(免费)性价比更高
投资人赛道大但门槛太低,竞争格局不利,不建议关注

资源链接

资源链接
官网https://usespoke.app/
品牌页https://www.spoke.so/
Product Hunthttps://www.producthunt.com/products/spoke-hold-speak-done
竞品 VoiceInk (开源)https://github.com/Beingpax/VoiceInk
竞品 Handy (免费开源)https://github.com/cjpais/Handy
竞品 Superwhisperhttps://superwhisper.com/
AI 听写对比文https://afadingthought.substack.com/p/best-ai-dictation-tools-for-mac

2026-03-06 | Trend-Tracker v7.3

一句话判断

Spoke 是一款交互优雅的工具,其 Edit Mode 具有创新性,但在 20+ 竞品环伺的红海赛道中,作为独立产品突围难度较大,建议作为交互参考而非长期投资标的。

常见问题

关于 Spoke 的常见问题

一款主打“按住就说”的原生 macOS 语音输入应用,支持本地处理与 AI 编辑模式。

Spoke 的主要功能包括:按住说话即时转录、Edit Mode 语音编辑、代码上下文感知、本地隐私转录。

未公开,需访问官网确认。

重度文字输入的 Mac 用户、开发者、博主及对隐私敏感的用户。

Spoke 的主要竞品包括:VoiceInk, Superwhisper, Wispr Flow, Handy, Spokenly。

数据来源: ProductHunt2026年3月6日
最后更新: