Appearance
AIHub Gateway PRD
版本: v1.0
日期: 2026-02-06
产品负责人: AIHub PM Team
一、问题陈述
1.1 核心问题
Beacon(AIHub 的 AI 能力品牌)需要稳定、可控的 AI 算力供应:
| 痛点 | 影响 |
|---|---|
| 成本不透明 | 各团队分散采购 AI API,无法统一成本核算 |
| 供应不稳定 | 单一供应商故障导致 Beacon 功能中断 |
| 缺乏灰度能力 | 无法按模型/场景智能路由请求 |
| 支付受限 | 传统支付无法支持 Crypto 原生用户和 Agent 自主付费 |
1.2 战略定位
AIHub Gateway = Beacon 的算力中台 + x402 Web3 支付基础设施
┌─────────────────────────────────────────────────────────────┐
│ AIHub 业务架构 │
├─────────────────────────────────────────────────────────────┤
│ 用户付费层(跟单分润 / VIP 订阅 / 交易手续费) │
│ ▲ │
│ │ Beacon 驱动业务价值 │
│ ┌───────────────────────────────────────────────────────┐ │
│ │ Beacon: Vibe Trading | 智能问答 | 策略推荐 | 风险预警 │ │
│ └───────────────────────────────────────────────────────┘ │
│ ▲ │
│ │ 提供 AI 算力 │
│ ┌───────────────────────────────────────────────────────┐ │
│ │ AIHub Gateway(算力中台) │ │
│ │ 内部成本中心 + 可选对外开放 │ │
│ └───────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────┘二、用户场景
2.1 核心用户
| 用户 | 场景 | 需求 |
|---|---|---|
| Beacon 开发团队 | 调用 GPT/Claude/Gemini 支撑 Vibe Trading | 统一 API、成本可控、高可用 |
| AIHub 运营 | 监控 AI 算力消耗和成本 | 用量仪表盘、成本报表 |
| AIHub VIP 用户(远期) | 直接使用 AI 对话能力 | 免费额度 + 按需付费 |
| 外部 AI Agent(远期) | 自主调用 AI 执行交易决策 | x402 自动扣款、即时结算 |
2.2 用户故事
P0: Beacon 开发
作为 Beacon 开发者,我希望通过一个统一的 API 调用任意 AI 模型,这样我不需要关心底层供应商切换。
P0: 运维监控
作为 AIHub 运营,我希望实时看到 AI 调用量和成本,这样我能及时发现异常并优化预算。
P1: 故障恢复
作为 Beacon 服务,当主供应商返回 429/503 时,我希望请求自动路由到备用供应商,这样 Beacon 功能不中断。
三、成功指标
| 指标 | Phase 0 目标 | 衡量方式 |
|---|---|---|
| 调用成功率 | > 99% | 监控系统 |
| 平均延迟增加 | < 50ms | APM |
| 成本节约 | > 10% | 与直接调用对比 |
| 供应商切换时间 | < 1s | 故障转移测试 |
四、功能规格
4.1 Phase 0 MVP
| ID | 功能 | 说明 | 验收标准 |
|---|---|---|---|
| F1 | 统一 API 入口 | OpenAI 兼容格式,支持 /v1/chat/completions | 请求格式与 OpenAI 一致 |
| F2 | 多模型支持 | GPT-5 系列、Claude 4 系列、Gemini 3 系列 | 可通过 model 参数指定 |
| F3 | 多供应商切换 | 云雾 API(主)+ OpenRouter(备) | 配置文件可热更新 |
| F4 | 故障自动转移 | 429/503/超时自动切换供应商 | 切换延迟 < 1s |
| F5 | API Key 鉴权 | 每个调用方分配独立 API Key | 无 Key 返回 401 |
| F6 | 请求日志 | Token 消耗、响应时间、供应商、成本 | 日志可查询 |
4.2 Phase 1+ 战略功能
| 功能 | 战略价值 | 优先级 |
|---|---|---|
| 钱包登录 | 链上用户体系统一 | P1 |
| x402 用户充值 | 无地区限制的 Crypto 充值 | P1 |
| x402 Agent 自主付费 | Agent 自主调用并付费,差异化核心 | P1 |
| VIP 权益对接 | 按等级分配免费调用额度 | P2 |
| 智能路由增强 | 成本/速度/质量多维优化 | P2 |
五、技术架构
┌─────────────────────────────────────────────────────────────┐
│ AIHub Gateway │
├─────────────────────────────────────────────────────────────┤
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────┐ │
│ │ API Layer │ │ Auth Layer │ │ (远期) │ │
│ │ OpenAI 兼容 │ │ API Key │ │ Payment Layer │ │
│ └──────┬──────┘ └──────┬──────┘ │ x402 协议 │ │
│ │ │ └──────────┬──────────┘ │
│ ▼ ▼ ▼ │
│ ┌─────────────────────────────────────────────────────────┐│
│ │ Router Core ││
│ │ ┌───────────┐ ┌───────────┐ ┌───────────────────┐ ││
│ │ │优先级路由 │ │故障转移 │ │(远期)成本/速度路由│ ││
│ │ └───────────┘ └───────────┘ └───────────────────┘ ││
│ └──────────────────────────┬──────────────────────────────┘│
│ │ │
│ ┌──────────────────────────▼──────────────────────────────┐│
│ │ Provider Pool ││
│ │ ┌─────────┐ ┌───────────┐ ┌─────────────────────┐ ││
│ │ │云雾 API │ │ OpenRouter │ │ (远期) 官方直签 │ ││
│ │ │ 主力 │ │ 备选 │ │ 规模化后 │ ││
│ │ └─────────┘ └───────────┘ └─────────────────────┘ ││
│ └─────────────────────────────────────────────────────────┘│
└─────────────────────────────────────────────────────────────┘六、边界情况
| 场景 | 处理方式 |
|---|---|
| 所有供应商都不可用 | 返回 503 + 重试建议 |
| Token 超过模型限制 | 返回 400 + 具体限制说明 |
| API Key 额度耗尽 | 返回 402 + 充值引导 |
| 不支持的模型名称 | 返回 400 + 支持的模型列表 |
七、排除范围
MVP 阶段不做:
| 功能 | 原因 |
|---|---|
| x402 支付 | 先验证核心能力 |
| 用户 Dashboard | 先用日志凑合 |
| 对外开放 API | Phase 2 再考虑 |
| 流式响应 | MVP 先实现同步 |
八、时间线
| 阶段 | 目标 | 时间 |
|---|---|---|
| Phase 0 | MVP 上线,内部使用 | 2 周 |
| Phase 1 | VIP 权益 + x402 充值 | 4-6 周 |
| Phase 2 | Agent 自主付费 + 对外开放 | 8-12 周 |
文档版本: v1.0 | 最后更新: 2026-02-06
