主题
价格说明
实时价格以控制台为准
本页只解释计费机制。每个模型的最终单价随上游政策动态调整,唯一可靠的价格表是控制台 模型 / 定价页——文档里写死任何数字都会很快过期。
💵 计费基本盘
- 按 token 实际用量计费——没有月费、没有起充门槛
- 预付费——账户余额扣完为止;余额不足时调用直接返 402,不会透支
- 结算单位 = token;控制台余额按人民币 / 美元显示,每次调用按当次消耗的 input + output token 数 × 单价从余额里扣
- 粒度 = 每次请求的 input tokens × 单价 + output tokens × 单价
🧮 一次调用的价格怎么算
实际扣费由 3 个因素相乘决定:
扣费 = 上游模型基础单价 × 渠道倍率 × 你所在用户组的倍率| 因素 | 谁决定 | 含义 |
|---|---|---|
| 上游基础单价 | OpenAI / Anthropic / Google | 同模型不同上游渠道可能略有差异 |
| 渠道倍率 | 中转站运营 | 不同稳定性 / 来源的渠道有不同倍率(详见下文) |
| 用户组倍率 | 你的账户等级 | 默认组、VIP 组等不同折扣 |
控制台 定价页 上看到的"单价"已经是乘完三项后的最终用户价——你不用自己算。
🏷️ 为什么同一个模型有多个价格档
同一个模型(比如 claude-sonnet-4-6)控制台可能显示多档价格,对应不同上游渠道:
| 档位 | 特点 | 适合 |
|---|---|---|
| 官方稳定档 | 走上游官方接口,价格高、稳定性最佳 | 生产环境、关键业务 |
| 二级渠道档 | 走第三方分销,价格略低,偶发风控 / 限流 | 开发测试、个人使用 |
| 逆向 / 廉价档 | 走非官方接口,价格最低,可用性波动大 | 价格敏感且能接受偶发不可用 |
WARNING
便宜不等于划算。如果你跑的是定时任务 / 生产业务,廉价档间歇性不可用导致的失败成本可能远超差价。开发测试随便用,生产稳重选。
🎖️ 用户组与折扣
按累计充值额度自动升级用户组,对应不同倍率折扣。等级长期保留,不需要每月续费维持。
具体每档的门槛和折扣力度以控制台「个人中心 → 等级」实际显示为准。如果你想知道"我现在是哪一档、还差多少升下一档",去那里看最准确。
📊 多少钱算"够用"
这张表只是直觉级参考
模型选择是 10×-50× 的变量——同样的对话量,用 Haiku 和用 Opus 4.7 月账单能差两个数量级。下面数字按"模型档位选对"估算,以控制台实际价为准。
| 场景 | 用什么档位 | 月用量参考 |
|---|---|---|
| 个人偶尔聊天 / 写作 | 便宜档(mini / haiku / flash 类) | ¥50-150 |
| 同上但偏重顶级模型 | 顶级档(opus 顶配 / 最贵 GPT 档) | ¥300-1000 |
| 日常配 Claude Code / Cursor 写代码 | 中档(sonnet 主力 / 主流 GPT 系) | ¥300-1500 |
| 同上但偏重顶级长任务 | 顶级档 | ¥1500-5000 |
| 重度 Agent 工作流(每天数小时 + 顶级模型主力) | 顶级档 + 大量上下文 | ¥3000-10000+ |
| 团队 / 小型业务 API 调用 | 按业务量评估 | —— |
不再列具体型号
模型名几周一变(更新、改名、下线),文档写死过时太快。有哪些可用模型 + 实时单价永远以 控制台模型 / 定价页 为准。当前主流的便宜 / 中档 / 顶级各家都有,到那里挑就行。
估算的钱不知道够不够时,做这件事
先充 ¥50 跑两三天,看 日志 实际消耗速度——你的 prompt 长度、模型档、调用频率三个变量都拍下来后,再决定要不要加充到月预算。一开始按上面的表估,多半要么严重高估要么严重低估。
第一次充值建议至少 ¥50 起步——确认链路 + 跑通几个真实场景,¥10 对贵模型用户来说一晚上就刷完,没法验证持续用量是否合理。本站余额永久有效,不存在"充多了浪费"。
💳 充值方式
- 支付宝 / 微信:即时到账
- 大额对公:支持开发票,联系客服走流程
充值流程详见 充值。
↩️ 退款 / 余额结算
- 已消耗的 token 不退
- 订阅套餐 / 折扣 / 满赠 / 活动类充值一经支付不退(入口处有显式二次确认,不点不会扣款)
- 普通充值未消费部分按阶梯:24h 内扣 10% / 24h-7 天扣 25% / 超过 7 天不退
- 完整规则(含混合充值的扣减优先级)→ 售前售后 § 退款政策
- 因服务方原因导致的异常消耗,可申请追溯——联系客服
💡 怎么省钱
| 招 | 节省幅度 | 代价 |
|---|---|---|
| 测试 / 探索阶段用便宜模型(gpt-5-mini / haiku 系),生产 / 关键任务才用贵模型 | 10-50× | 模型能力差异,按需选 |
控制单次会话长度,agent 流定期 /clear | 2-5× | 失去长上下文连续性 |
| 用桌面客户端的 "max tokens" 限制单次响应长度 | 1.5-3× | 长回答会被截断 |
| 给 Agent 用的 Key 单独建一个并 设额度上限 | 上限内 | 跑飞了只烧这个 Key 的预算 |
关于"prompt 缓存"
有些上游模型支持 prompt caching,能让重复的 system prompt 部分以折扣价计费。这个机制是上游自动生效的,不需要你做任何配置——本站不提供"打开缓存"的开关,缓存命中情况以上游返回的 usage 字段为准。
❓ 常见问题
控制台显示的 "倍率" 是什么意思
倍率 = 该模型相对官方原价的比例。比如倍率 2.0 表示该模型在本站的价格是官方原价的 2 倍(包含运营 / 服务成本)。你看到的最终单价已经包含倍率了,不用自己再乘。
价格会涨吗
会。上游厂商定期调价(OpenAI 历史上既涨过也降过),本站会同步更新。重大调整前会通过控制台公告 / 邮件通知。
不同模型的 input / output token 价格不一样吗
是的。绝大多数 LLM 模型的 output token 单价 ~3-5× 于 input token——因为生成成本远高于读取成本。这意味着"长 prompt + 短回答"比"短 prompt + 长回答"便宜得多。