返回探索

Cube

Business intelligence software

自动构建数据模型并回答问题的 AI 智能体

💡 传统的 AI 分析工具之所以会产生“幻觉”,是因为它们在不理解业务逻辑的情况下直接查询原始数据表。Cube 彻底解决了这个问题:它的 AI Agent 会自动构建语义层,并以此为基础回答问题和生成报告,确保结果零幻觉。只需连接你的数据,几秒钟内即可获得准确结果。该产品基于拥有 1.9 万+ GitHub Star 的 Cube 开源语义层构建,提供免费版本。

"Cube 就像是给 AI 请了一位“金牌翻译官”兼“专业审计师”:它不仅能把复杂的业务逻辑翻译给 AI 听,还能在 AI 乱写 SQL 时一把拉住它,确保输出的每一行数据都准确无误。"

30秒快速判断
这App干嘛的:Cube 是一个基于开源语义层的 Agentic Analytics 平台,在 AI 和数据仓库之间充当“翻译官”和“护栏”,有效防止 AI 幻觉。
值不值得关注:非常值得关注。拥有 19.5K GitHub Stars 和 4800 万美元融资,被评为 2025 语义层领军者,是 AI Agent 时代的核心基础设施。
7/10

热度

9/10

实用

3

投票

产品画像
完整分析报告
~19 分钟

Cube:给 AI 装上"数据护栏"的语义层老炮

2026-02-13 | ProductHunt | 官网 | GitHub


30秒快速判断

这App干嘛的:Cube 是一个基于开源语义层的 Agentic Analytics 平台。说白了,它在你的数据仓库和 AI/BI 工具之间加了一层"翻译官"——语义层,让 AI Agent 不再直接怼数据库写 SQL,而是通过治理好的语义模型来查询,避免 AI 胡说八道(幻觉)。

值不值得关注:值得。虽然这次 PH 只拿了 3 票(因为它是 2018 年就开源的老项目,不是新面孔),但它有 19.5K GitHub Stars、$48M 融资(Databricks 和 Salesforce 都投了)、90,000 台服务器装机量。GigaOm 2025 评它是语义层品类的 Leader。在 AI 时代,"语义层"从数据工程的冷门概念变成了 AI Agent 的刚需基础设施——这才是它真正有意思的地方。


与我有关三问

与我有关吗?

目标用户是谁

  • 需要给产品嵌入数据分析功能的开发团队(SaaS 厂商)
  • 被数据不一致搞疯了的数据工程师/分析师
  • 想让业务人员自己查数据、不再排队等报表的企业
  • 正在接入 AI Agent 做数据分析的团队

我是吗:如果你在做 B2B SaaS 并且需要给客户看数据(嵌入式分析),或者你团队里经常有人问"这个指标怎么和昨天的不一样",那你就是目标用户。如果你是 C 端产品或者数据量很小用 Excel 就够了,那跟你关系不大。

什么场景会用到

  • 你在做 SaaS,客户要看自己的数据 dashboard -> 用 Cube 嵌入式分析
  • 你团队用了 3 个 BI 工具,指标定义到处不一致 -> 用 Cube 统一语义层
  • 你想让 AI Agent 帮业务查数据但怕它瞎编 -> 用 Cube 当 AI 的"护栏"
  • 你数据查询慢得要死 -> 用 Cube Store 的预聚合缓存

对我有用吗?

维度收益代价
时间分析师每季度省数十小时(Drata 案例),报表查询从10秒级降到亚秒级初始建模需要1-2周,学习曲线中等偏高
金钱开源版完全免费,替代 Tableau/Looker 可省大钱Cloud 版"有点贵但低于大竞品",Enterprise 需联系销售
精力指标定义一次到处用,不再到处灭火需要理解语义层概念,预聚合配置有坑

ROI 判断:如果你团队 5 人以上且有嵌入式分析或数据一致性需求,花 2 周上手 Cube 的投入回报比很高。如果你是独立开发者做小项目,直接查数据库够了,不需要这么重的方案。

喜闻乐见吗?

爽点在哪

  • 防幻觉架构:AI Agent 不直接碰数据库,所有查询必须过语义层的"编译器"验证,查错了直接拦截。这个设计真的很聪明。
  • 一次定义,到处可用:一个指标定义好,REST/GraphQL/SQL/BI 工具/AI Agent 全部共享同一个定义,再也不吵"你的数字为什么和我的不一样"。
  • 嵌入式分析提速 85%:Relata 的案例,用了 Cube 之后原来的 BI 方案根本"不是问题了"。

用户真实评价

"Cube 成为我们指标定义的唯一真相来源,CSM 每季度省下数十小时。" — Anthony Cronander, Drata 高级分析工程师

"用 Git 分支测试数据模型的变更,这功能真的很强大。" — AWS Marketplace 用户

"尚可,但不够出色。不如其他工具直觉和友好。" — Gartner Peer Insights 用户


给独立开发者

技术栈

  • 前端:TypeScript/React(Query Builder SDK + Agentic Analytics UI)
  • 后端:TypeScript/Node.js(API 服务、数据库驱动)+ Rust(约 60% 代码库)
  • 数据引擎:Cube Store(Rust,基于 Apache DataFusion/Arrow-rs,Parquet 列存储)
  • SQL 引擎:CubeSQL(Rust,兼容 PostgreSQL 协议)
  • AI:支持 Anthropic Claude + 自带 LLM,提供 AI API、MCP 和 A2A 协议
  • API:REST / GraphQL / SQL 三合一

这套架构很有意思:Node.js 负责灵活性(数据库驱动、API 路由),Rust 负责性能(查询引擎、缓存、预聚合)。两个世界通过 Neon/N-API 桥接。

核心功能实现

Cube 的核心思路是在数据仓库和消费端之间插入一个"语义层运行时"。你用 YAML/JS 定义数据模型(维度、指标、关系),Cube 的编译器把业务请求翻译成针对特定数据库优化的 SQL,再通过 Cube Store 做预聚合缓存。AI Agent 也走这条路:自然语言 -> Semantic SQL -> 语义层编译器 -> 数据库 SQL -> 结果。全程有"护栏",AI 不能随便写 SQL。

开源情况

  • 开源:是,Cube Core 采用 Apache 2.0 许可
  • GitHub:19.5K Stars / ~2K Forks / ~350 贡献者
  • 社区:13,000+ Slack 成员
  • 类似开源项目:dbt(侧重转换不是语义层)、MetriQL(已停维护)
  • 自己做难度:高,预计 10+ 人年。Rust 高性能引擎 + 多数据源驱动 + AI Agent 系统,这不是周末 hack 能搞定的。

商业模式

  • 变现方式:开源核心 + 云服务订阅(Cube Cloud)
  • 计费:CCU(Cube Compute Unit)按量付费,无月最低消费
  • 增长:2024 财年客户数 4x,bookings 3x,平均交易额 3x
  • 用户量:90,000+ 服务器部署,200+ 企业客户

巨头风险

Databricks 和 Snowflake 都在做自己的原生语义层,这是最大的威胁。但 Cube 的防线是:(1)跨数据源,不绑定单一仓库;(2)开源社区粘性强;(3)Databricks 自己也投了 Cube,说明暂时选择合作而非竞争。不过长期看,如果企业全部 All-in 某个数据仓库,原生语义层会更方便。


给产品经理

痛点分析

  • 解决什么问题:企业数据分析的"指标不一致"和"AI 幻觉"两大痛点
  • 痛点有多痛:高频刚需。用过 BI 工具的人都经历过"为什么你的数和我的不一样"的灵魂拷问。分析师为同一个指标写 20 个不同的 SQL 查询,每个 BI 工具一套逻辑——这在大公司是日常噩梦。

用户画像

  • 画像 1:SaaS 产品的数据工程师,需要给客户嵌入分析功能
  • 画像 2:企业数据团队 lead,被指标不一致和报表排队搞崩溃了
  • 画像 3:正在评估 AI 数据分析方案的技术决策者

功能拆解

功能类型说明
语义层(数据建模)核心统一指标定义,code-first
Cube Store(预聚合缓存)核心亚秒级查询响应
多 API 接入(REST/GraphQL/SQL)核心一层语义,多种消费方式
AI Agent(数据分析师/数据工程师)核心自然语言查数据,防幻觉
Analytics Chat锦上添花聊天式数据探索
Workbook/Dashboard锦上添花可视化分析前端
MCP/A2A 协议前瞻性接入 Claude Desktop 等外部 AI

竞品差异

vsCubedbtLookerTableau
核心差异语义层+AI Agent+缓存数据转换+指标层BI+LookML语义层传统BI可视化
开源Apache 2.0核心开源闭源 (Google)闭源 (Salesforce)
AI Agent原生支持有限Tableau AI
嵌入式分析强项不做支持支持
供应商锁定高 (Google Cloud)高 (Salesforce)

可借鉴的点

  1. "防幻觉"的产品叙事:把"语义层"这个技术概念包装成"给 AI 装护栏",非常好懂
  2. MCP + A2A 协议:紧跟 AI Agent 互操作标准,抢占生态位
  3. 开源核心 + 云服务:经典的 open-core 双轮驱动
  4. 从 Headless 到 Agentic:品牌转型很果断,踩准了 AI 浪潮

给科技博主

创始人故事

  • 创始人:Artyom Keydunov (CEO) + Pavel Tiunov (CTO)
  • 背景:2016 年做了一个叫 Statsbot 的 Slack BI 聊天机器人,发现一个核心问题——chatbot 给出的数字经常跟报表对不上。为了解决这个问题,他们做了一个"语义层"来统一指标定义。
  • 关键转折:2018 年把这个语义层开源为 Cube.js。项目慢慢积累到 19K stars。然后 2023 年 AI Agent 火了,他们突然意识到:语义层不就是 AI 需要的"防幻觉"基础设施吗?方向完美 pivot。
  • 一句话故事:一个 Slack 聊天机器人的"数据不一致 bug fix",7 年后变成了 AI 时代的基础设施。

争议点/讨论角度

  • 角度 1 - 手动建模能跟上吗?:MotherDuck(DuckDB 云服务)公开质疑:Cube、dbt、Looker 这些都要人手动定义每个指标和维度,面对无穷无尽的业务问题,人永远建不完。AI 自动发现查询路径才是未来。这个辩论很有深度。
  • 角度 2 - 从"无头"到"有头":Cube 之前一直主打 Headless BI(只提供 API,没有前端),现在加了 Dashboard 和 Chat 界面。有人觉得这是正确的进化,有人觉得这是背离初心。
  • 角度 3 - Databricks 既投又做:Databricks 投了 Cube $25M,同时自己也在做原生语义层。这关系微妙。

热度数据

  • PH 投票:3 票(这次是产品更新,不是新品首发,热度偏低)
  • GitHub:19.5K Stars(开源数据基础设施里算顶流)
  • Slack 社区:13,000+ 成员
  • Twitter:@the_cube_dev,2,161 followers
  • GigaOm 2025:语义层品类 Leader & Outperformer
  • Gartner:4.4/5 评分
  • 用户情感评分:91/100

内容建议

  • 适合写的角度:从"AI 为什么需要语义层"切入,这个话题有教育价值且不过时
  • 蹭热点机会:Agentic AI 是 2026 最热赛道,Cube 是这个赛道的"基础设施层"案例

给早期采用者

定价分析

层级价格包含功能够用吗?
开源自托管免费Cube Core 全部功能技术能力强的团队够用
Free Cloud免费2 个开发实例,仅测试只够评估,不能上生产
StarterCCU 按量生产集群, 150GB 预聚合, 单 BI 同步小团队初期够用
PremiumCCU 按量(贵)99.95% SLA, VPC, Azure, SSO中型企业
Enterprise联系销售99.99% SLA, RBAC, VPC Peering大企业

上手指南

  • 上手时间:30 分钟可以跑起来 demo,2 周完成生产级建模
  • 学习曲线:中偏高。需要理解语义层、数据建模、预聚合等概念
  • 步骤
    1. npx cubejs-cli create 或在 Cube Cloud 注册
    2. 连接数据源(Postgres/Snowflake/BigQuery 等)
    3. 定义数据模型(YAML/JS)
    4. 通过 Playground 或 API 查询测试
    5. (可选)启用 AI Agent 做自然语言查询

坑和吐槽

  1. 没有代码补全/类型检查:写 Cube 的数据模型定义时没有 LSP 支持,语法错了不会提醒,得到运行时才发现。用 AI 编辑器写更容易出错。
  2. 预聚合调试痛苦:preAggregations 的配置只能在生产环境完整测试,开发环境测不出真实行为。
  3. 文档有些混乱:avg 类型的指标在 rollup 里被求和,timeout 逻辑不直觉。
  4. BI 工具集成偶尔翻车:某些聚合查询在 BI 工具端报错,需要手动调整。
  5. M1/ARM64 注意:最近的 Docker 镜像在 ARM64 上有 libssl 兼容问题。

安全和隐私

  • 数据存储:语义层不存原始数据,只存预聚合缓存(Parquet 格式)
  • 访问控制:支持 RBAC(Enterprise 级),数据模型内置行级别安全
  • 合规:Enterprise 支持 VPC Peering、SAML SSO
  • AI 治理:所有 AI Agent 查询必须经过语义层编译器验证,不能直接访问数据仓库

替代方案

替代品优势劣势
dbt + MetricFlow如果已用 dbt,集成无缝没有 API 层、没有缓存、没有 AI Agent
Looker (Google)成熟稳定、LookML 语义层闭源、被 Google 收购后不确定性、贵
Metabase轻量、易上手、开源没有语义层概念、查询性能一般
Apache Superset完全开源、可视化丰富没有语义层、没有预聚合、没有 AI

给投资人

市场分析

  • 语义层 + 知识图谱 for AI:$1.73B (2025) -> $4.93B (2030),CAGR 23.3%
  • Agentic AI 市场:~$9-11B (2026) -> $93-199B (2032-2034),CAGR 40-44%
  • BI & 分析平台:全球市场规模 $30B+ (2026)
  • 驱动因素:AI Agent 需要结构化的业务知识才能准确分析数据,语义层从"nice-to-have"变成了"prerequisite"

竞争格局

层级玩家定位
头部Tableau, Power BI, Looker传统 BI 巨头,开始加 AI
腰部dbt, Sisense, ThoughtSpot各有侧重(转换/嵌入/搜索式BI)
新进入者/转型者Cube从语义层切入 Agentic Analytics
数据仓库原生Snowflake, Databricks自建语义层,平台锁定

Timing 分析

  • 为什么是现在:2023-2025 的 LLM 爆发暴露了"AI + 数据 = 幻觉"的核心问题,企业开始意识到需要治理层。语义层恰好解决这个问题。
  • 技术成熟度:Cube 的语义层技术已经打磨了 7 年(2018-2025),不是 vaporware。
  • 市场准备度:GigaOm 等分析机构开始定义"语义层"为独立品类,说明市场认知在形成。Gartner 预测 2026 年 50%+ 的 BI 工具将支持"主动元数据"。

团队背景

  • CEO:Artyom Keydunov,连续创业者(Statsbot -> Cube)
  • CTO:Pavel Tiunov,联合创始人
  • 总部:San Francisco
  • 开源社区:350+ 贡献者,13K Slack 成员

融资情况

  • 已融资:$48M(Seed + Series A + Series B)
  • 最新轮:Series B $25M (2024-06)
  • 核心投资人:Databricks Ventures、Decibel、Bain Capital Ventures、Salesforce Ventures、645 Ventures、Eniac Ventures、500 Global
  • 亮点:Databricks 既是战略投资人又是潜在竞争对手,这个关系值得观察
  • 增长:2024 年客户数 4x、bookings 3x、平均交易额 3x

结论

Cube 不是一个新产品,是一个踩到新时代风口的老产品。 7 年前为了修复一个 chatbot 的数据不一致问题做的开源语义层,在 AI Agent 时代突然成了"防幻觉基础设施"。这个 pivot 之自然、之顺畅,在开源基础设施领域非常罕见。

用户类型建议
开发者值得研究。Rust + TypeScript 的混合架构、语义层 + AI 的"防幻觉"设计都是很好的学习对象。自己做一个?别想了,太重了。
产品经理值得关注。"语义层 = AI 护栏"的产品叙事、MCP/A2A 协议接入、从 Headless 到 Agentic 的转型,都是值得借鉴的产品策略。
博主适合写。"一个 bug fix 变成基础设施"的创始人故事 + "手动语义层 vs AI 自动发现"的行业辩论,内容角度丰富。
早期采用者看情况。如果你有嵌入式分析或数据一致性的痛,开源版免费,值得试。如果你是小团队数据量不大,Metabase 或直接查库更实际。
投资人值得跟踪。$48M 融资、Databricks 背书、4x 客户增长、语义层品类 Leader。但要注意数据仓库巨头自建语义层的威胁。

资源链接

资源链接
官网https://cube.dev
GitHubhttps://github.com/cube-js/cube
文档https://cube.dev/docs
Twitterhttps://x.com/the_cube_dev
定价https://cube.dev/pricing
案例https://cube.dev/case-studies
Crunchbasehttps://www.crunchbase.com/organization/cube-dev

2026-02-13 | Trend-Tracker v7.3

一句话判断

Cube 是一个成功踩中 AI 风口的老牌开源项目,现已进化为 AI 时代重要的数据治理基础设施,非常适合有数据一致性需求和 AI 落地场景的企业。

这篇分析对你有帮助吗?

常见问题

关于 Cube 的常见问题

Cube 是一个基于开源语义层的 Agentic Analytics 平台,在 AI 和数据仓库之间充当“翻译官”和“护栏”,有效防止 AI 幻觉。

Cube 的主要功能包括:统一语义建模、Cube Store 预聚合缓存加速、REST/GraphQL/SQL 多 API 支持、AI Agent 协议接入 (MCP/A2A)。

开源版免费;云端 Starter/Premium 版按量付费;Enterprise 版需联系销售定制。

SaaS 开发团队、数据工程师、分析师以及正在构建 AI 数据分析应用的团队。

Cube 的主要竞品包括:dbt (MetricFlow), Looker, Tableau, Metabase。。

数据来源: ProductHunt2026年2月13日
最后更新: