Documentation Index
Fetch the complete documentation index at: https://docs.apiyi.com/llms.txt
Use this file to discover all available pages before exploring further.
一句话回答
分组是令牌可选择的”调用通道”,决定可用模型范围、计费倍率与上游路由。 从用户视角看像”我自己所在的分组”,但每一次调用真正生效的,始终是令牌上选定的那个分组。用户视角 vs 平台视角
用户视角
分组 = 我在创建/编辑令牌时自选的通道,决定这把令牌能用哪些模型、按什么倍率计费、走哪条上游线路。
平台视角
分组是资源管理与突显特性的手段:把同类型模型、专属算力、定向折扣聚合成一条通道,便于精准计费与差异化定价。
“用户分组” ≠ “令牌分组”,别混淆
很多用户的第一反应是:“我账户上是不是有个分组,需要在哪里切换?”- 账户层确实有”用户分组”概念,决定基础权限范围(例如能否看到 SVIP 模型列表、是否解锁企业兜底分组等)
- 但每一次 API 调用,决定路由、计费倍率与模型可用性的,都是令牌上所选的分组
案例 1:为什么会有 ClaudeCode 这个分组?
目的:把支持 Anthropic 原生 /v1/messages 调用格式的模型聚合到一个通道,让你在 Claude Code、Cherry Studio、其它 Anthropic 原生客户端里像调用 Claude 一样直接使用国产编程模型,无需改任何代码格式。
包含哪些模型:
- Claude 全系列(官转 / AWS Claude)
- 国产兼容
/v1/messages的编程模型,如qwen3.x-max、glm-5.x、deepseek-v4等
- 默认 95 折(5% off),无需任何操作
- 可叠加充值加赠 10%–20%,实际成本比官方直连便宜约两成
- 打开 https://api.apiyi.com/token 新增或编辑令牌
- 「选择分组」选
ClaudeCode - 客户端按 Anthropic 原生格式调用即可
案例 2:视频模型为什么要走专属分组?
视频模型的计费方式(按秒、按张、按时长)与文本模型完全不同,且各自的上游通道独立。平台用分组来让特殊计费规则精准生效:| 模型 | 必须选择的分组 |
|---|---|
| Sora 2 官转视频 | Sora2Official(按秒计费) |
| 阿里 Wan 视频系列 | Wan |
| Seedance 2 视频 | 对应专属分组(以控制台为准) |
案例 3:报错”当前分组上游负载已饱和”是平台在限我吗?
这是 SaaS 多用户产品场景下的高频问题,取材自一次真实工单。 场景还原:- 开发者:我的工具是 SaaS 模式,多用户分散调用,点击量一上来就报:
error 429 (content-type-not-allowed):当前分组上游负载已饱和,请稍后再试 - 我以为是平台限制了我的并发,需要在哪里”分组”来规避?
- 这条错误不是账户层面的并发限流
- 它指的是:该模型在该分组所对应的上游通道当前繁忙
- 常见诱因:使用了厂商侧仍处于 preview 阶段的模型(例如
*-preview-*命名的版本),其官方算力本身存在波动
我们没有对客户的调用做并发墙。这条 429 来自上游通道,不是计费意义上的限流,重试通常即可恢复。
我该怎么选分组?快速决策
| 你的场景 | 选择分组 |
|---|---|
| 文本、多模态、NanoBanana、Veo 3.1 等绝大部分模型 | Default |
Claude Code 里同时使用 Claude 与国产编程模型(/v1/messages 格式) | ClaudeCode(默认 95 折,可叠加加赠) |
| Sora 2 官转视频 | Sora2Official |
| Wan / Seedance 2 视频 | 对应专属分组 |
| 高并发不稳定、需要更高成功率 | 在令牌挂 1–2 个兜底分组 |
关于”组倍率”
控制台显示的「组倍率」是人民币计价的相对值,并非直接的美元折扣比例——0.14x 不等于”打 1.4 折”。一般情况下您不需要深究,选对分组即可;想理解倍率与价格换算,请看 系统里模型的【倍率】是什么?。
相关文档
令牌与分组
令牌作用、创建/编辑、查看代码示例与分组一览图。
令牌计费模式
按量优先、按次优先等计费模式的区别。
模型倍率说明
倍率含义、人民币计价单位与美元价格的换算。
模型可用性
模型分级与不同用户分组的访问权限。