Documentation Index
Fetch the complete documentation index at: https://docs.apiyi.com/llms.txt
Use this file to discover all available pages before exploring further.
一句话结论
| 你需要 | 选这个 |
|---|---|
quality 画质参数 / mask 局部重绘 / OpenAI 官方完全对齐字段 | gpt-image-2(官转) |
| 可预测的统一价($0.03/张)+ 出图较快 | gpt-image-2-all(官逆,ChatGPT 网页线,~90s) |
| 可预测的统一价 + 严格锁尺寸(含 4K) | gpt-image-2-vip(官逆,Codex 线,~120–200s) |
官逆两兄弟(-all / -vip):本页”官逆”列同时覆盖
gpt-image-2-all 与 gpt-image-2-vip——两者调用方式完全一致、同价 $0.03/张,差异仅在 size 字段 和 出图速度:gpt-image-2-all:无size(写进 prompt),ChatGPT 网页线,约 90 秒 出图gpt-image-2-vip:支持 30 档 size(10 比例 × 1K/2K/4K,含 4K),Codex 线,约 120–200 秒 出图(与官转持平)- 共同点:均不支持
quality、不支持n、不支持 mask 局部重绘
-all / -vip 子格分别标注。需要 quality 画质或 mask 局部重绘时仍请走官转 gpt-image-2。完整对比表
| 维度 | gpt-image-2-all / -vip(官逆,高性价比) | gpt-image-2(官转,正式版) |
|---|---|---|
| 模型名 | gpt-image-2-all(不锁尺寸、出图最快) / gpt-image-2-vip(要指定 size 或 4K 时用) | gpt-image-2 |
| 通道性质 | -all:逆向 ChatGPT 官网线路-vip:逆向 Codex 线路 | 官方直连(OpenAI Images API) |
| 计费方式 | 按次计费:固定 $0.03/次(两模同价、所有 size 统一价) | 按量计费:按 token 实计,官网同价;本站充值加赠后约 8.5 折 |
| 典型成本/张 | $0.03(不区分尺寸 / 画质 / 模型) | 实测 $0.03 – $0.2(与提示词长度、size、quality 正相关) |
| 令牌分组 | 默认分组(Default) | 默认分组(Default) |
| 令牌类型 | 按次计费 或 按量优先 均可 | 仅支持按量优先(本模型按 token 计费,按次计费令牌不可用) |
| 推荐端点 | /v1/chat/completions(方便传 URL) + /v1/images/generations + /v1/images/edits(同套代码兼容官转) | /v1/images/generations + /v1/images/edits |
| 备选端点 | 三端点皆可,按场景选 | (仅官方两个端点) |
| 上传图片格式 | base64 或 https URL(chat 端点)/ multipart file(edits 端点) | multipart file(编辑接口) |
| 输出图片格式 | b64_json(已带前缀)或 url(R2 CDN) | b64_json(纯 base64,无前缀) |
| 上传图片数(编辑) | 多张(chat 模式理论上限较高) | 最多 16 张(image[]) |
| mask 局部重绘 | ❌ 不支持 | ✅ 支持(要求带 alpha 通道) |
| 指令遵循 | 好 | 优秀 |
| 生成速度 | -all:约 90 秒(较快)-vip:约 120–200 秒(与官转持平)📌 当前比刚上线时慢——OpenAI 官方算力波动所致,非 APIYI 侧问题 | 约 100-120 秒,复杂场景 + 4K 可达 3-5 分钟 |
size 参数 | -all:❌ 不接受(写进 prompt)-vip:✅ 30 档常见 size(10 比例 × 1K/2K/4K) | ✅ 任意合法尺寸 |
size = auto 行为 | -all:— 不接受 size 字段-vip:文生图时模型自动选尺寸(同 prompt 倾向收敛到一个相对固定值);改图时按 prompt 指代图的比例输出 | ✅ 默认值,OpenAI 官方语义”按 prompt 智能选”;社区实测偏向 1:1 方形(1024×1024),要其它比例请显式传 size |
| 支持 4K | -all:❌-vip:✅ 4K Detail 档(如 3840x2160 / 2880x2880) | ✅ 含 3840×2160 |
| 常见输出尺寸 | -all:16:9 → 1672×941、9:16 → 941×1672、1:1 → 1254×1254(自适应)-vip:见 完整 30 档表 | 8 个预设 + 任意合法自定义尺寸 |
画质参数 quality | ❌ 两模均不支持(不要传) | ✅ low / medium / high / auto |
n 参数 | ❌ 两模均不支持(单次仅返回 1 张) | ✅ 支持 |
| 透明背景 | — | ❌ 不支持(background: transparent 会报错) |
| 中文提示词 | ✅ 原生 | ✅ 原生 |
| 文字渲染 | 高还原度 | 高还原度(high 档位最强) |
| 内容限制 | 较少(更宽松) | 较严格(OpenAI 官方策略) |
| API 文档 | GPT-Image-2-All 概览 / GPT-Image-2-VIP 概览 | GPT-Image-2 概览 |
🔑 如何创建或管理令牌:https://api.apiyi.com/token
在控制台创建令牌时可以选择分组(
在控制台创建令牌时可以选择分组(
Default 默认即可)和令牌类型(按次计费 / 按量优先)。调用 gpt-image-2(官转)必须使用「按量优先」类型的令牌,否则会因计费方式不匹配被拒。选型场景
选 gpt-image-2-all(官逆)的场景
💰 成本可预测
单价稳定 $0.03/张,无尺寸 / 画质阶梯,适合大批量生产、成本必须封顶的场景(信息图、营销物料、电商素材批量)。
⚡ 出图速度较快
约 90 秒出图,比
-vip 和官转都略快,前端实时交互体验更好。🗨️ 对话式工作流
/v1/chat/completions 同端点支持多轮迭代改图、文生图、带图编辑,集成最简单。🌏 中文 + 营销文字
中文提示词原生友好、招牌 / 海报 / 信息图文字还原度高,适合面向中文用户的内容生产。
选 gpt-image-2-vip(官逆,要锁尺寸或 4K)的场景
📐 严格锁定输出尺寸
支持 30 档常见 size(10 比例 × 1K/2K/4K),适合电商主图、海报模板、视频封面、桌面壁纸等需要稳定输出尺寸的场景。
🖼️ 同价拿到 4K
4K Detail 档(2880×2880 / 3840×2160 / 3840×1632 等)与 1K/2K 同价 $0.03/张,4K 不加价。
🔁 与 -all 共用代码
调用结构与
-all 完全一致,请求体里只多一个 size 字段——可以一套代码两个模型来回切。💰 成本仍可预测
单价仍稳定 $0.03/张,比官转 4K 高画质便宜很多——4K 锁尺寸场景的高性价比之选。
选 gpt-image-2(官转)的场景
🎚️ 需要画质档位
quality 支持 low/medium/high/auto。草稿用 low 省成本,终稿 high 出印刷级效果——这是官转独有,官逆两模都不支持。🎯 mask 局部重绘
支持 alpha 通道蒙版,精准修改图片局部区域而保留其余部分——官逆两模都不支持。
🖼️ 任意自定义尺寸
size 参数接受任意合法尺寸;如果你的尺寸不在 -vip 的 30 档之内,需要更细粒度的尺寸控制时选官转。🔌 与 OpenAI 官方一致
走官方 Images API,字段与行为完全与官方一致。已有基于 OpenAI 官方 SDK 的代码 / 系统可零改动迁移,长期更稳。
关键差异详解
1. b64_json 格式差异(迁移坑!)
2. 分辨率控制方式
gpt-image-2-all(写在 prompt 里):size,30 档含 4K):
size 参数严格控制 + quality 档位):
3. 上传 / 输出格式差异
| 操作 | gpt-image-2-all | gpt-image-2 |
|---|---|---|
| 上传参考图 | base64 data URL 或 https URL(在 chat messages 的 image_url 里) | multipart image[] 文件字段 |
| 下载生成图 | 默认 url(R2 CDN,24 小时有效期),可改 b64_json(带前缀) | b64_json(纯 base64,需 decode) |
| 多图融合 | chat 端点多个 image_url 即可 | image[] 数组重复传入,最多 16 张 |
4. 价格示例(粗算)
| 场景 | gpt-image-2-all / -vip | gpt-image-2 |
|---|---|---|
| 1024×1024 草图 | $0.03 | ~$0.006(low) |
| 1024×1024 中等画质 | $0.03 | ~$0.053(medium) |
| 1024×1024 高画质 | $0.03 | ~$0.211(high) |
| 2048×1152 高画质 | $0.03 | ~$0.20+(按 token 实计) |
| 3840×2160 4K 高画质 | $0.03(仅 -vip 支持 4K) | 按 token 实计,显著高于 1K |
| 编辑 / 多图融合 | $0.03 | 输入 token 显著上升,单次成本可达 $0.1+ |
结论:批量、低画质场景用官逆不一定省(草图 1K low 在官转上反而更便宜);中-高画质区段 + 4K 都是官逆 $0.03 的甜点区——
-vip 的 4K 与 1K/2K 同价,相比官转 4K 高画质能省一个数量级。需要 quality 档位 / mask 局部重绘 / OpenAI 官方完全对齐字段 时再选官转。客户端调用建议
| 设置项 | gpt-image-2-all / -vip | gpt-image-2 |
|---|---|---|
| 超时(保守值) | -all:300 秒(典型 ~90s)-vip:300 秒(典型 120–200s,4K 长尾更长) | 360 秒(4K 高画质实测可达 3-5 分钟) |
| 重试策略 | 5xx 与超时指数退避 2 次 | 同左 |
| 并发 | chat 端点天然并发友好;单次仅返回 1 张,多张请并发 | 单次 1 张,需要多张请并发 |
| 请求 ID | request-id 响应头 | x-request-id 响应头 |
常见问题
输入图要压缩吗?提示词里写 4K / 8K 有用吗?
输入图要压缩吗?提示词里写 4K / 8K 有用吗?
强烈建议压。三个模型上传给接口的图都先压到 1.5MB 以内(JPEG 质量 80-90 / 分辨率适当下调):偶发的
shell_api_error / Unknown error 大多就是图片体积过大触发的,压一下请求成功率和出图速度都会明显改善。别担心压输入会损画质——输出分辨率与输入图体积无关,三个模型的”输出端”控制方式不同:gpt-image-2-all:用 prompt 的画幅描述控制(参见 -all 概览页的「经过验证的『提示词 → 实际分辨率』对照表」),prompt 光写4K/8K不算数gpt-image-2-vip:用size字段控制(30 档含 4K,同价 $0.03/张)gpt-image-2:用size+quality字段控制(任意合法尺寸)
同一个 API Key 三个模型都能用吗?
同一个 API Key 三个模型都能用吗?
可以。三者都走默认分组(Default),同一个 API Key 同时调用即可,无需额外配置。注意:调用
gpt-image-2(官转)需要「按量优先」类型的令牌;-all / -vip 两种令牌类型都能用。对话式 API 会不会返回文字而不是图?
对话式 API 会不会返回文字而不是图?
有可能。当出图意图不够明确时,官逆模型的 chat 端点可能返回纯文字。强化办法:在用户提示词的开头追加固定前缀如「生成图片:」或 system 提示词约束输出。
官逆里 -all 和 -vip 怎么挑?
官逆里 -all 和 -vip 怎么挑?
两者都是逆向通道、同价 $0.03/张、调用方式完全一致,差异只有:
size字段:-all不接受(写进 prompt);-vip接受 30 档常见 size(含 4K)- 出图速度:
-all约 90 秒;-vip约 120–200 秒(与官转持平)。当前比刚上线时慢,源自 OpenAI 官方算力波动
-all;要锁尺寸或要 4K → -vip。详见 GPT-Image-2-VIP 概览。官逆 -vip 既然支持 4K,还需要官转吗?
官逆 -vip 既然支持 4K,还需要官转吗?
需要。官转独有:
quality 档位(low/medium/high/auto)、mask 局部重绘(alpha 通道蒙版)、OpenAI 官方完全对齐字段(已有官方 SDK 代码零改动迁移)、任意非 30 档之外的合法尺寸。成本上,-vip 的 4K 与 1K/2K 同价 $0.03/张,相比官转 4K 高画质能省一个数量级——4K 锁尺寸场景首推 -vip。想从 1.5 迁移,应该选哪个?
想从 1.5 迁移,应该选哪个?
- 沿用官方 SDK / 要求与 OpenAI 官方一致:选
gpt-image-2(官转),需要删掉input_fidelity、避开background: transparent,其它字段不动 - 想顺便降低成本,对尺寸不敏感:选
gpt-image-2-all(官逆,~90s) - 想顺便降低成本,要锁尺寸或 4K:选
gpt-image-2-vip(官逆,~120–200s)
可以同时部署多个做兜底吗?
可以同时部署多个做兜底吗?
可以。常见做法:主用
-all 或 -vip(成本可预测,按业务是否要锁尺寸选),兜底用 gpt-image-2(需要 quality 档位 / mask 时切过去)。官转和官逆两类模型响应字段不同,业务层做一次格式归一即可。图片下载链接(R2 CDN)很慢怎么办?
图片下载链接(R2 CDN)很慢怎么办?
相关文档
- GPT-Image-2 概览 - 官转完整接入文档
- GPT-Image-2-All 概览 - 官逆 ChatGPT 网页线(出图最快)完整接入文档
- GPT-Image-2-VIP 概览 - 官逆 Codex 线(30 档 size,含 4K)完整接入文档
- 深度解读:gpt-image-2 上线 - 官转上线说明
- 深度解读:gpt-image-2-all 上线 - 官逆上线说明
- 社区贡献:Luck GPT-Image 2 ComfyUI 节点 - 多模型合一的 ComfyUI 节点包
- 社区贡献:APIYI GPT-Image 2 Skills - 多模型合一的 AI Agent Skill 包
- 充值优惠活动 - 充值加赠政策