什么是分组？用户分组与令牌分组解析

一句话回答

分组是令牌可选择的”调用通道”，决定可用模型范围、计费倍率与上游路由。 从用户视角看像”我自己所在的分组”，但每一次调用真正生效的，始终是令牌上选定的那个分组。

用户视角 vs 平台视角

用户视角

分组 = 我在创建/编辑令牌时自选的通道，决定这把令牌能用哪些模型、按什么倍率计费、走哪条上游线路。

平台视角

分组是资源管理与突显特性的手段：把同类型模型、专属算力、定向折扣聚合成一条通道，便于精准计费与差异化定价。

“用户分组” ≠ “令牌分组”，别混淆

很多用户的第一反应是：“我账户上是不是有个分组，需要在哪里切换？”

账户层确实有”用户分组”概念，决定基础权限范围（例如能否看到 SVIP 模型列表、是否解锁企业兜底分组等）
但每一次 API 调用，决定路由、计费倍率与模型可用性的，都是令牌上所选的分组

所以排查问题时，先看令牌的「选择分组」与「兜底分组」设置，而不是去找”我账户的分组”。详见令牌与分组。

案例 1：为什么会有 `ClaudeCode` 这个分组？

目的：把支持 Anthropic 原生 /v1/messages 调用格式的模型聚合到一个通道，让你在 Claude Code、Cherry Studio、其它 Anthropic 原生客户端里像调用 Claude 一样直接使用国产编程模型，无需改任何代码格式。 包含哪些模型：

Claude 全系列（官转 / AWS Claude）
国产兼容 /v1/messages 的编程模型，如 qwen3.x-max、glm-5.x、deepseek-v4 等

折扣：

默认 95 折（5% off），无需任何操作
可叠加充值加赠 10%–20%，实际成本比官方直连便宜约两成

怎么用：

打开 https://api.apiyi.com/token 新增或编辑令牌
「选择分组」选 ClaudeCode
客户端按 Anthropic 原生格式调用即可

案例 2：视频模型为什么要走专属分组？

视频模型的计费方式（按秒、按张、按时长）与文本模型完全不同，且各自的上游通道独立。平台用分组来让特殊计费规则精准生效：

模型	必须选择的分组
Sora 2 官转视频	`Sora2Official`（按秒计费）
阿里 Wan & HappyHorse 视频系列	`Wan&HappyHorse`
Seedance 2 视频	对应专属分组（以控制台为准）

走错分组的常见后果：模型不可用（404）、计费异常或调用直接被拒。请确认令牌的「选择分组」或「兜底分组」里有目标模型对应的分组。

案例 3：报错”当前分组上游负载已饱和”是平台在限我吗？

这是 SaaS 多用户产品场景下的高频问题，取材自一次真实工单。 场景还原：

开发者：我的工具是 SaaS 模式，多用户分散调用，点击量一上来就报：
error 429 (content-type-not-allowed)：当前分组上游负载已饱和，请稍后再试
我以为是平台限制了我的并发，需要在哪里”分组”来规避？

真相：

这条错误不是账户层面的并发限流
它指的是：该模型在该分组所对应的上游通道当前繁忙
常见诱因：使用了厂商侧仍处于 preview 阶段的模型（例如 *-preview-* 命名的版本），其官方算力本身存在波动

正确应对：

放宽客户端的超时与重试

把超时调到更宽松（如 60–120s），失败重试间隔从立即重试改为指数退避；不要在错误瞬间立刻并发重发。

为常用模型挂兜底分组

在令牌上为目标模型对应的分组添加 1–2 个兜底分组，主分组拥塞时自动切换备用通道，提高成功率。

对高并发业务做模型评估

若业务对延迟和稳定性敏感，可在自己的场景里中性评估同系列里负载更稳定的型号（不同厂商通常会有更轻量、负载更分散的同系列分支），由业务侧自行测试取舍。

我们没有对客户的调用做并发墙。这条 429 来自上游通道，不是计费意义上的限流，重试通常即可恢复。

我该怎么选分组？快速决策

你的场景	选择分组
文本、多模态、NanoBanana、Veo 3.1 等绝大部分模型	`Default`
Claude Code 里同时使用 Claude 与国产编程模型（`/v1/messages` 格式）	`ClaudeCode`（默认 95 折，可叠加加赠）
Sora 2 官转视频	`Sora2Official`
Wan&HappyHorse / Seedance 2 视频	对应专属分组
高并发不稳定、需要更高成功率	在令牌挂 1–2 个兜底分组

关于”组倍率”

控制台显示的「组倍率」是人民币计价的相对值，并非直接的美元折扣比例——0.14x 不等于”打 1.4 折”。一般情况下您不需要深究，选对分组即可；想理解倍率与价格换算，请看系统里模型的【倍率】是什么？。

令牌与分组

令牌作用、创建/编辑、查看代码示例与分组一览图。

令牌计费模式

按量优先、按次优先等计费模式的区别。

模型倍率说明

倍率含义、人民币计价单位与美元价格的换算。

模型可用性

模型分级与不同用户分组的访问权限。

网站功能介绍

模型与调用

令牌与日志

企业服务

充值与安全

网络与连接

账号与登录

什么是分组？用户分组与令牌分组解析

一句话回答

用户视角 vs 平台视角

用户视角

平台视角

“用户分组” ≠ “令牌分组”，别混淆

案例 1：为什么会有 `ClaudeCode` 这个分组？

案例 2：视频模型为什么要走专属分组？

案例 3：报错”当前分组上游负载已饱和”是平台在限我吗？

我该怎么选分组？快速决策

关于”组倍率”

相关文档

令牌与分组

令牌计费模式

模型倍率说明

模型可用性

​一句话回答

​用户视角 vs 平台视角

用户视角

平台视角

​“用户分组” ≠ “令牌分组”，别混淆

​案例 1：为什么会有 ClaudeCode 这个分组？

​案例 2：视频模型为什么要走专属分组？

​案例 3：报错”当前分组上游负载已饱和”是平台在限我吗？

​我该怎么选分组？快速决策

​关于”组倍率”

​相关文档

令牌与分组

令牌计费模式

模型倍率说明

模型可用性

一句话回答

用户视角 vs 平台视角

“用户分组” ≠ “令牌分组”，别混淆

案例 1：为什么会有 `ClaudeCode` 这个分组？

案例 2：视频模型为什么要走专属分组？

案例 3：报错”当前分组上游负载已饱和”是平台在限我吗？

我该怎么选分组？快速决策

关于”组倍率”

相关文档