价格说明

实时价格以控制台为准

本页只解释计费机制。每个模型的最终单价随上游政策动态调整，唯一可靠的价格表是控制台模型 / 定价页——文档里写死任何数字都会很快过期。

💵 计费基本盘

按 token 实际用量计费——没有月费、没有起充门槛
预付费——账户余额扣完为止；余额不足时调用直接返 402，不会透支
结算单位 = token；控制台余额按人民币 / 美元显示，每次调用按当次消耗的 input + output token 数 × 单价从余额里扣
粒度 = 每次请求的 input tokens × 单价 + output tokens × 单价

🧮 一次调用的价格怎么算

实际扣费由 3 个因素相乘决定：

扣费 = 上游模型基础单价 × 渠道倍率 × 你所在用户组的倍率

因素	谁决定	含义
上游基础单价	OpenAI / Anthropic / Google	同模型不同上游渠道可能略有差异
渠道倍率	中转站运营	不同稳定性 / 来源的渠道有不同倍率（详见下文）
用户组倍率	你的账户等级	默认组、VIP 组等不同折扣

控制台定价页上看到的"单价"已经是乘完三项后的最终用户价——你不用自己算。

🏷️ 为什么同一个模型有多个价格档

同一个模型（比如 claude-sonnet-4-6）控制台可能显示多档价格，对应不同上游渠道：

档位	特点	适合
官方稳定档	走上游官方接口，价格高、稳定性最佳	生产环境、关键业务
二级渠道档	走第三方分销，价格略低，偶发风控 / 限流	开发测试、个人使用
逆向 / 廉价档	走非官方接口，价格最低，可用性波动大	价格敏感且能接受偶发不可用

WARNING

便宜不等于划算。如果你跑的是定时任务 / 生产业务，廉价档间歇性不可用导致的失败成本可能远超差价。开发测试随便用，生产稳重选。

🎖️ 用户组与折扣

按累计充值额度自动升级用户组，对应不同倍率折扣。等级长期保留，不需要每月续费维持。

具体每档的门槛和折扣力度以控制台「个人中心 → 等级」实际显示为准。如果你想知道"我现在是哪一档、还差多少升下一档"，去那里看最准确。

📊 多少钱算"够用"

这张表只是直觉级参考

模型选择是 10×-50× 的变量——同样的对话量，用 Haiku 和用 Opus 4.7 月账单能差两个数量级。下面数字按"模型档位选对"估算，以控制台实际价为准。

场景	用什么档位	月用量参考
个人偶尔聊天 / 写作	便宜档（mini / haiku / flash 类）	¥50-150
同上但偏重顶级模型	顶级档（opus 顶配 / 最贵 GPT 档）	¥300-1000
日常配 Claude Code / Cursor 写代码	中档（sonnet 主力 / 主流 GPT 系）	¥300-1500
同上但偏重顶级长任务	顶级档	¥1500-5000
重度 Agent 工作流（每天数小时 + 顶级模型主力）	顶级档 + 大量上下文	¥3000-10000+
团队 / 小型业务 API 调用	按业务量评估	——

不再列具体型号

模型名几周一变（更新、改名、下线），文档写死过时太快。有哪些可用模型 + 实时单价永远以控制台模型 / 定价页为准。当前主流的便宜 / 中档 / 顶级各家都有，到那里挑就行。

估算的钱不知道够不够时，做这件事

先充 ¥50 跑两三天，看日志实际消耗速度——你的 prompt 长度、模型档、调用频率三个变量都拍下来后，再决定要不要加充到月预算。一开始按上面的表估，多半要么严重高估要么严重低估。

第一次充值建议至少 ¥50 起步——确认链路 + 跑通几个真实场景，¥10 对贵模型用户来说一晚上就刷完，没法验证持续用量是否合理。本站余额永久有效，不存在"充多了浪费"。

💳 充值方式

支付宝 / 微信：即时到账
大额对公：支持开发票，联系客服走流程

充值流程详见充值。

↩️ 退款 / 余额结算

已消耗的 token 不退
订阅套餐 / 折扣 / 满赠 / 活动类充值一经支付不退（入口处有显式二次确认，不点不会扣款）
普通充值未消费部分按阶梯：24h 内扣 10% / 24h-7 天扣 25% / 超过 7 天不退
完整规则（含混合充值的扣减优先级）→ 售前售后 § 退款政策
因服务方原因导致的异常消耗，可申请追溯——联系客服

💡 怎么省钱

招	节省幅度	代价
测试 / 探索阶段用便宜模型（gpt-5-mini / haiku 系），生产 / 关键任务才用贵模型	10-50×	模型能力差异，按需选
控制单次会话长度，agent 流定期 `/clear`	2-5×	失去长上下文连续性
用桌面客户端的 "max tokens" 限制单次响应长度	1.5-3×	长回答会被截断
给 Agent 用的 Key 单独建一个并设额度上限	上限内	跑飞了只烧这个 Key 的预算

关于"prompt 缓存"

有些上游模型支持 prompt caching，能让重复的 system prompt 部分以折扣价计费。这个机制是上游自动生效的，不需要你做任何配置——本站不提供"打开缓存"的开关，缓存命中情况以上游返回的 usage 字段为准。

❓ 常见问题

控制台显示的 "倍率" 是什么意思

倍率 = 该模型相对官方原价的比例。比如倍率 2.0 表示该模型在本站的价格是官方原价的 2 倍（包含运营 / 服务成本）。你看到的最终单价已经包含倍率了，不用自己再乘。

价格会涨吗

会。上游厂商定期调价（OpenAI 历史上既涨过也降过），本站会同步更新。重大调整前会通过控制台公告 / 邮件通知。

不同模型的 input / output token 价格不一样吗

是的。绝大多数 LLM 模型的 output token 单价 ~3-5× 于 input token——因为生成成本远高于读取成本。这意味着"长 prompt + 短回答"比"短 prompt + 长回答"便宜得多。

🚀 下一步

注册账号
充值
模型选择——挑模型的实操指南

价格说明 ​

💵 计费基本盘 ​

🧮 一次调用的价格怎么算 ​

🏷️ 为什么同一个模型有多个价格档 ​

🎖️ 用户组与折扣 ​

📊 多少钱算"够用" ​

💳 充值方式 ​

↩️ 退款 / 余额结算 ​

💡 怎么省钱 ​

❓ 常见问题 ​

控制台显示的 "倍率" 是什么意思 ​

价格会涨吗 ​

不同模型的 input / output token 价格不一样吗 ​

🚀 下一步 ​