Skip to content

价格说明

实时价格以控制台为准

本页只解释计费机制。每个模型的最终单价随上游政策动态调整,唯一可靠的价格表是控制台 模型 / 定价页——文档里写死任何数字都会很快过期。

💵 计费基本盘

  • 按 token 实际用量计费——没有月费、没有起充门槛
  • 预付费——账户余额扣完为止;余额不足时调用直接返 402,不会透支
  • 结算单位 = token;控制台余额按人民币 / 美元显示,每次调用按当次消耗的 input + output token 数 × 单价从余额里扣
  • 粒度 = 每次请求的 input tokens × 单价 + output tokens × 单价

🧮 一次调用的价格怎么算

实际扣费由 3 个因素相乘决定:

扣费 = 上游模型基础单价 × 渠道倍率 × 你所在用户组的倍率
因素谁决定含义
上游基础单价OpenAI / Anthropic / Google同模型不同上游渠道可能略有差异
渠道倍率中转站运营不同稳定性 / 来源的渠道有不同倍率(详见下文)
用户组倍率你的账户等级默认组、VIP 组等不同折扣

控制台 定价页 上看到的"单价"已经是乘完三项后的最终用户价——你不用自己算。

🏷️ 为什么同一个模型有多个价格档

同一个模型(比如 claude-sonnet-4-6)控制台可能显示多档价格,对应不同上游渠道

档位特点适合
官方稳定档走上游官方接口,价格高、稳定性最佳生产环境、关键业务
二级渠道档走第三方分销,价格略低,偶发风控 / 限流开发测试、个人使用
逆向 / 廉价档走非官方接口,价格最低,可用性波动大价格敏感且能接受偶发不可用

WARNING

便宜不等于划算。如果你跑的是定时任务 / 生产业务,廉价档间歇性不可用导致的失败成本可能远超差价。开发测试随便用,生产稳重选。

🎖️ 用户组与折扣

按累计充值额度自动升级用户组,对应不同倍率折扣。等级长期保留,不需要每月续费维持

具体每档的门槛和折扣力度以控制台「个人中心 → 等级」实际显示为准。如果你想知道"我现在是哪一档、还差多少升下一档",去那里看最准确。

📊 多少钱算"够用"

这张表只是直觉级参考

模型选择是 10×-50× 的变量——同样的对话量,用 Haiku 和用 Opus 4.7 月账单能差两个数量级。下面数字按"模型档位选对"估算,以控制台实际价为准。

场景用什么档位月用量参考
个人偶尔聊天 / 写作便宜档(mini / haiku / flash 类)¥50-150
同上但偏重顶级模型顶级档(opus 顶配 / 最贵 GPT 档)¥300-1000
日常配 Claude Code / Cursor 写代码中档(sonnet 主力 / 主流 GPT 系)¥300-1500
同上但偏重顶级长任务顶级档¥1500-5000
重度 Agent 工作流(每天数小时 + 顶级模型主力)顶级档 + 大量上下文¥3000-10000+
团队 / 小型业务 API 调用按业务量评估——

不再列具体型号

模型名几周一变(更新、改名、下线),文档写死过时太快。有哪些可用模型 + 实时单价永远以 控制台模型 / 定价页 为准。当前主流的便宜 / 中档 / 顶级各家都有,到那里挑就行。

估算的钱不知道够不够时,做这件事

先充 ¥50 跑两三天,看 日志 实际消耗速度——你的 prompt 长度、模型档、调用频率三个变量都拍下来后,再决定要不要加充到月预算。一开始按上面的表估,多半要么严重高估要么严重低估。

第一次充值建议至少 ¥50 起步——确认链路 + 跑通几个真实场景,¥10 对贵模型用户来说一晚上就刷完,没法验证持续用量是否合理。本站余额永久有效,不存在"充多了浪费"。

💳 充值方式

  • 支付宝 / 微信:即时到账
  • 大额对公:支持开发票,联系客服走流程

充值流程详见 充值

↩️ 退款 / 余额结算

  • 已消耗的 token 不退
  • 订阅套餐 / 折扣 / 满赠 / 活动类充值一经支付不退(入口处有显式二次确认,不点不会扣款)
  • 普通充值未消费部分按阶梯:24h 内扣 10% / 24h-7 天扣 25% / 超过 7 天不退
  • 完整规则(含混合充值的扣减优先级)→ 售前售后 § 退款政策
  • 因服务方原因导致的异常消耗,可申请追溯——联系客服

💡 怎么省钱

节省幅度代价
测试 / 探索阶段用便宜模型(gpt-5-mini / haiku 系),生产 / 关键任务才用贵模型10-50×模型能力差异,按需选
控制单次会话长度,agent 流定期 /clear2-5×失去长上下文连续性
用桌面客户端的 "max tokens" 限制单次响应长度1.5-3×长回答会被截断
给 Agent 用的 Key 单独建一个并 设额度上限上限内跑飞了只烧这个 Key 的预算

关于"prompt 缓存"

有些上游模型支持 prompt caching,能让重复的 system prompt 部分以折扣价计费。这个机制是上游自动生效的,不需要你做任何配置——本站不提供"打开缓存"的开关,缓存命中情况以上游返回的 usage 字段为准。

❓ 常见问题

控制台显示的 "倍率" 是什么意思

倍率 = 该模型相对官方原价的比例。比如倍率 2.0 表示该模型在本站的价格是官方原价的 2 倍(包含运营 / 服务成本)。你看到的最终单价已经包含倍率了,不用自己再乘

价格会涨吗

会。上游厂商定期调价(OpenAI 历史上既涨过也降过),本站会同步更新。重大调整前会通过控制台公告 / 邮件通知。

不同模型的 input / output token 价格不一样吗

是的。绝大多数 LLM 模型的 output token 单价 ~3-5× 于 input token——因为生成成本远高于读取成本。这意味着"长 prompt + 短回答"比"短 prompt + 长回答"便宜得多。

🚀 下一步