Documentation Index
Fetch the complete documentation index at: https://docs.apiyi.com/llms.txt
Use this file to discover all available pages before exploring further.
概述
gpt-image-2-vip 是 API易 平台上线的 GPT 图像生成 Codex 官逆模型。与gpt-image-2-all 同价 $0.03/张,调用方式完全一致,最大区别是 支持 size 参数——覆盖 10 比例 × 3 分辨率档(1K Fast / 2K Recommended / 4K Detail)共 30 档常见尺寸,含 4K。
🎨 核心定位:当你需要锁定输出尺寸(电商主图、海报模板、视频封面、4K 壁纸等)时使用
gpt-image-2-vip。请求体里只需把 model 改成 gpt-image-2-vip、加一个 size 字段,其它代码与 gpt-image-2-all 完全相同。对话式 API
OpenAI Chat Completions 格式,同端点支持文生图与带图改图,方便直接传入在线图片 URL。
文生图 API
/v1/images/generations,输入文本提示词 + size 生成指定尺寸图片。图片编辑 API
/v1/images/edits,multipart 上传参考图 + 编辑/融合指令。与 gpt-image-2-all 的关键差异
gpt-image-2-vip 与 gpt-image-2-all 同属逆向通道、同价、同套调用代码。互相映射——把同一段请求里的 model 字段从一个换成另一个,行为整体一致,差异如下:
| 维度 | gpt-image-2-all | gpt-image-2-vip |
|---|---|---|
| 渠道 | 逆向 ChatGPT 官网 | 逆向 Codex 线路 |
| 价格 | $0.03 / 张 | $0.03 / 张(所有 size 统一价) |
size 参数 | ❌ 不接受(写进 prompt) | ✅ 30 档 size,含 4K |
4K(如 3840x2160) | ❌ | ✅ 4K Detail 档 |
| 出图速度 | 约 30–60 秒 | 约 90–150 秒(与官转 gpt-image-2 持平) |
quality 参数 | ❌ 不接受 | ❌ 不接受(不要传) |
| 支持端点 | /chat/completions + /images/generations + /images/edits | 同左(一模一样) |
| 响应格式 | url / b64_json(已含前缀) | 同左 |
| 适合场景 | 提示词驱动、对尺寸不敏感 | 需要稳定指定输出尺寸(含 4K) |
核心特性
稳定锁定输出尺寸
size 字段直接接受 30 档常见尺寸,电商主图、海报模板、4K 壁纸都能严格输出4K 高分辨率
4K Detail 档支持 2880×2880 / 3840×2160 / 3840×1632 等,适合大尺寸交付物
所有 size 统一价
1K / 2K / 4K 所有档位统一 $0.03/张,4K 不额外加价
调用方式同 -all
请求结构、字段、响应字段与
gpt-image-2-all 完全一致,可秒级切换模型名文字还原度高
图内中英文、招牌、海报文字还原稳定,适合信息图与营销物料
中文提示词友好
原生理解中文描述,无需翻译即可获得高质量输出
自然语言改图
支持通过对话描述直接改图,无需蒙版,可多轮迭代
三端点兼容
同时兼容
/images/generations、/images/edits、/chat/completions模型定价
| 模型名 | 计费方式 | 价格 | 输出 |
|---|---|---|---|
gpt-image-2-vip | 按次计费 | $0.03 / 张 | 单次返回 1 张图片,size 字段锁定输出尺寸 |
计费说明:
- 所有 30 档 size 统一定价 $0.03/张——4K Detail 不加价
- 失败请求不计费(如鉴权失败、参数校验失败)
- 如需生成 N 张,客户端并行调用 N 次
分组介绍
gpt-image-2-vip 放在 Default 默认分组 即可,不需要额外切分组。逆向通道目前供给稳定,不存在像官转那样需要”企业分组”过渡的场景。
| 模型 | 分组 | 备注 |
|---|---|---|
gpt-image-2-vip | Default | 逆向 Codex 线路,统一 $0.03/张,约 90–150 秒出图 |
gpt-image-2-vip | image2_OSS | 1x 倍率(不加价),确定性 URL 输出——默认分组资源紧张时不会降级为 base64 |
需要确定性 URL 输出 → 切到 image2_OSS 分组
gpt-image-2-vip(及 gpt-image-2-all)默认返回图片 url(R2 CDN 链接)。但当默认分组资源紧张时,为保证仍能出图,响应可能降级为 b64_json(base64 图片数据)而不是 URL。
如果你的业务强依赖 URL 输出(直接把 URL 落库、前端按 URL 渲染、不接受 base64),请把令牌分组切到 image2_OSS——这是专为 URL 输出确定性设计的分组,1x 倍率(不加价),对 gpt-image-2-vip 和 gpt-image-2-all 两个官逆模型都生效,保证响应稳定输出图片 URL,不会降级为 base64。

image2Enterprise 企业分组:/live/2026-04/image2-enterprise
技术规格
| 维度 | 参数 |
|---|---|
| 模型名 | gpt-image-2-vip |
| 渠道性质 | 官方逆向(逆向 Codex 线路) |
| 定价 | $0.03 / 张,按次计费(所有 size 统一价) |
| 出图速度 | 约 90–150 秒(与官转 gpt-image-2 持平,慢于 gpt-image-2-all 的 30–60 秒) |
size 参数 | ✅ 30 档:10 比例 × 3 分辨率档(1K Fast / 2K Recommended / 4K Detail) |
| 4K 支持 | ✅ 4K Detail 档(如 3840x2160 / 2880x2880) |
quality 参数 | ❌ 不支持,不要传 |
n 参数 | ❌ 不支持,单次仅返回 1 张 |
| 默认响应格式 | url(R2 CDN 加速链接,默认 1 天有效期) |
| 可选响应格式 | b64_json(已含 data:image/png;base64, 前缀) |
| 中文提示词 | ✅ 原生支持 |
| 支持能力 | 文生图、单图编辑、多图融合、自然语言改图(三端点皆可) |
端点一览
gpt-image-2-vip 与 gpt-image-2-all 兼容完全相同的三个端点。把 model 字段换掉、按需加上 size 即可:
| 端点 | 用途 | Content-Type | 适用场景 |
|---|---|---|---|
POST /v1/chat/completions | 对话式(文生图 / 改图 / 多轮 / 参考图) | application/json | 方便直接传入在线图片 URL;一个端点同时支持文生图与图片编辑 |
POST /v1/images/generations | 文生图 | application/json | OpenAI Images API 标准格式,方便同一套代码同时调用官转与官逆 |
POST /v1/images/edits | 图片编辑(单图 / 多图) | multipart/form-data | OpenAI Images API 标准格式,方便同一套代码同时调用官转与官逆 |
支持的 size(30 档完整对照表)
gpt-image-2-vip 支持 10 个比例 × 3 个分辨率档 = 30 档 常见尺寸。请求体直接传 size: "宽x高"(半角小写 x)。
1K Fast — 草稿与低成本试稿
| 比例 | 命名 | 像素 |
|---|---|---|
| 1:1 | Square | 1280x1280 |
| 2:3 | Portrait | 848x1280 |
| 3:2 | Photo | 1280x848 |
| 3:4 | Portrait | 960x1280 |
| 4:3 | Standard | 1280x960 |
| 4:5 | Social | 1024x1280 |
| 5:4 | Large | 1280x1024 |
| 9:16 | Story | 720x1280 |
| 16:9 | Wide | 1280x720 |
| 21:9 | Cinema | 1280x544 |
2K Recommended — 默认推荐档(多数终稿)
| 比例 | 命名 | 像素 |
|---|---|---|
| 1:1 | Square | 2048x2048 |
| 2:3 | Portrait | 1360x2048 |
| 3:2 | Photo | 2048x1360 |
| 3:4 | Portrait | 1536x2048 |
| 4:3 | Standard | 2048x1536 |
| 4:5 | Social | 1632x2048 |
| 5:4 | Large | 2048x1632 |
| 9:16 | Story | 1152x2048 |
| 16:9 | Wide | 2048x1152 |
| 21:9 | Cinema | 2048x864 |
4K Detail — 大尺寸交付物
| 比例 | 命名 | 像素 |
|---|---|---|
| 1:1 | Square | 2880x2880 |
| 2:3 | Portrait | 2336x3520 |
| 3:2 | Photo | 3520x2336 |
| 3:4 | Portrait | 2480x3312 |
| 4:3 | Standard | 3312x2480 |
| 4:5 | Social | 2560x3216 |
| 5:4 | Large | 3216x2560 |
| 9:16 | Story | 2160x3840 |
| 16:9 | Wide | 3840x2160 |
| 21:9 | Cinema | 3840x1632 |
30 档统一价:所有档位都是 $0.03/张,4K Detail 不额外加价。
size,不要传 quality):
最佳实践
输入图先压到 1.5MB 以内(图生图 / 多图融合)
上传给接口的每张图先压到 1.5MB 以内(JPEG 质量 80-90 / 分辨率适当下调),多图融合时也按这个标准逐张控制。偶发的
shell_api_error / Unknown error 大多就是图片体积过大触发的,压一下请求成功率和出图速度都会明显改善。输出分辨率由 size 字段决定,与输入图体积无关——压小输入只会提速、不会损画质。提示词里光写 4K / 8K 这类词也不会真给你 4K,画质看 size,不看 prompt 修饰词。错误码与重试
| 状态码 | 含义 | 建议 |
|---|---|---|
400 | size 取值不在 30 档内或格式错误 | 用上表中的精确字符串 |
401 | 令牌无效 | 检查 Bearer Token |
429 | 限流/额度不足 | 指数退避重试 |
500(4K 偶发) | OpenAI 上游算力波动,4K Detail 档较易触发 | 优先降到 2K Recommended 档重试;必须 4K 时改用官转 gpt-image-2 + image2Enterprise 企业分组 |
5xx(其它) | 网关/后端临时错误 | 重试 1–2 次 |
| 超时 | Codex 高峰 + 4K 长尾 | 客户端设置 ≥ 300s 超时(保守值) |
建议客户端:
- 请求超时 300 秒 起步(保守值;典型 90–150s,但 4K Detail + 高峰长尾会更长)
- 对 5xx 与超时做 指数退避重试(建议 2–3 次)
- 记录响应头
request-id方便排查
常见问题
vip 和 -all 调用代码可以共用吗?
vip 和 -all 调用代码可以共用吗?
可以,几乎完全一样。 三个端点(
/v1/chat/completions、/v1/images/generations、/v1/images/edits)的请求字段、响应字段、b64_json 前缀行为都一致。差异只有两处:model字段:gpt-image-2-vip↔gpt-image-2-allsize字段:vip 接受 30 档常见尺寸;-all 不接受size,尺寸要写进 prompt
if model == 'vip': payload['size'] = ... 的开关即可。vip 出图为什么这么慢?
vip 出图为什么这么慢?
gpt-image-2-vip 走的是 Codex 逆向通道,典型 90–150 秒,与官转 gpt-image-2(100–120 秒)持平,比 ChatGPT 网页线路的 gpt-image-2-all(约 30–60 秒)慢。如果对响应延迟敏感,建议优先用 gpt-image-2-all;只在必须锁尺寸或 4K 时切换到 vip。size 必须严格按表里写吗?传 1024x768 会怎么样?
size 必须严格按表里写吗?传 1024x768 会怎么样?
是的,建议严格用表里 30 档之一。非表内 size 可能触发上游
invalid_request_error,请按交付需求选最接近的档位。4K 调用为何频繁报 500?怎么稳定出 4K?
4K 调用为何频繁报 500?怎么稳定出 4K?
现象:在 4K Detail 档(如 根因:OpenAI 算力波动,与请求参数本身无关——同一段请求换 2K 档大概率就过了。Codex 官逆通道对 4K 这种大输出的负载更敏感,高峰期更明显。应对建议(按性价比排序):
3840x2160 / 2880x2880)较容易触发 status_code: 500 错误,上游返回 invalid_request_error:- 优先改用 2K Recommended 档(如
2048x1360/2048x2048)—— 2K 成功率显著更高,价格同样 $0.03/张 - 图生图 / 多图融合少传输入图 —— Codex 官逆链路对多入图请求处理压力大,会进一步增加 4K 失败率;单张输入图先压到 1.5MB 以内也有帮助
- 如必须稳定出 4K —— 切换到官转模型
gpt-image-2+image2Enterprise企业分组。官转 4K 价格更高(约 $0.3+/张),但稳定性显著更好,适合对 4K 交付有硬要求的场景。
输入图要压缩吗?提示词里写 4K / 8K 有用吗?
输入图要压缩吗?提示词里写 4K / 8K 有用吗?
强烈建议压。单张输入图压到 1.5MB 以内(JPEG 质量 80-90 / 分辨率适当下调):偶发的
shell_api_error / Unknown error 大多就是图片体积过大触发的,压一下请求成功率和出图速度都会明显改善。注意 1.5MB 是推荐上限(追求稳定性与速度),上面 FAQ 写的 10MB 是网关硬上限。别担心压输入会损画质——本模型输出分辨率由 size 参数决定,跟你上传图的体积没关系。压小输入只会提速、不会损画质。提示词里光写 4K / 8K 这类词也不会真给你 4K。如果 prompt 写 8K 超清 但 size 选 1024x1024,最终拿到的就是 1K 水平。要 4K 请在 size 字段里指定——30 档里 1K / 2K / 4K 同价 $0.03/张,按需要直接选。📖 排错来源:/live/2026-05/gpt-image-2-vip-unknown-error4K 真的不加价吗?
4K 真的不加价吗?
不加价,4K Detail 档(
3840x2160 / 2880x2880 等)与 1K / 2K 同价 $0.03/张。支持 n 参数吗?传 n=3 会怎样?
支持 n 参数吗?传 n=3 会怎样?
不支持。 本模型单次只返回 1 张图,请通过重复调用 / 并发调用的方式生成多张。⚠️ 重要:如果在请求里传入
n=3,计费会按 0.03 × 3 = $0.09 扣费,但实际上仍然只返回 1 张图。请务必把 n 字段从请求里去掉,避免被多扣费。内容被拒/模型回复「我不能做到这个需求」,会计费吗?
内容被拒/模型回复「我不能做到这个需求」,会计费吗?
官逆是同步对话式返回,结果分两种情况,计费规则不同:1) 返回 5xx 状态码 → 不计费上游内容策略明确拦截时会返回类似:这种”明确报错”调用不计费,引导用户调整提示词重试即可。2) 返回 200 状态码(模型用文字软拒绝)→ 计费模型在对话里软拒绝、用文字回复(例如「我不能做到这个需求」「抱歉,这个请求涉及……」),从协议层看就是一次正常的对话返回,这种情况会被计费。官逆目前没有办法在协议层提前识别”这一段是拒绝文字而不是图片”。为什么不能直接对软拒绝免单?强行对所有”软拒绝”都不计费意味着平台要为每次失败承担上游成本;更关键的是,频繁触发上游内容安全会让供应方账号更容易被封号——这部分供给侧的硬成本也无法完全规避。给接入方的建议
- ✅ 前置内容过滤 / 风险提示:在前端或接入层先做一道关键词与场景过滤(如真实姓名、版权角色、敏感题材),并在 UI 上提示”涉及名人/版权题材时上游限制较严,可能失败也会计费”,能显著降低误扣率。
- ✅ C 端产品月度补发:理解 C 端产品无法完全控制用户输入。如果你的月用量较大(月消费 $1000+ 起),可以按月汇总日志(短耗时调用通常对应软拒绝)联系客服一次性人工补发,无须逐条申诉。
b64_json 前缀要不要自己加 data:image/png;base64,?
b64_json 前缀要不要自己加 data:image/png;base64,?
不要。本模型返回的
b64_json 字段已经带前缀,可直接赋给 HTML <img src> 或写入文件。如果你的代码沿用了”先拼前缀”的老逻辑,会产出损坏的 data URL,请先做 startsWith('data:') 检测。参考图最大多大?格式要求?
参考图最大多大?格式要求?
推荐 单张 ≤ 10MB,格式
png / jpg / webp。过大的图可能触发网关限制。多图融合时每张都需满足此限制。生成的图片 URL 有效期是多久?需要自己转存吗?
生成的图片 URL 有效期是多久?需要自己转存吗?
默认响应的
url 字段是 R2 CDN 加速链接,有效期约 1 天(24 小时),过期后会 404。强烈建议:生成后尽快把图片 转存到自己的对象存储(S3 / OSS / R2)、CDN 或数据库,不要长期直接引用本服务返回的 URL。能流式返回吗?
能流式返回吗?
本模型为一次性出图,不支持 stream 输出。如果对响应延迟敏感,建议客户端显示”生成中”进度提示,并合理配置 300s 超时(保守值)。
能用 OpenAI 的官方 SDK 直连吗?
能用 OpenAI 的官方 SDK 直连吗?
可以。把
base_url 指向 https://api.apiyi.com/v1,api_key 设为 API易 令牌即可。client.images.generate(model="gpt-image-2-vip", size="2048x1360", prompt=...) 直接可用。什么时候应该改用官方版 gpt-image-2?
什么时候应该改用官方版 gpt-image-2?
需要
quality(low/medium/high)档位、需要 mask 局部重绘、需要 OpenAI 官方完全一致的字段行为时,改用 gpt-image-2(官转)。详见 官转 vs 官逆 对比。相关文档
- GPT-Image-2-All 概览 - 同价位、出图更快的姐妹模型,适合不需要锁尺寸的场景
- ⚖️ 官转 vs 官逆 对比 - 与官方版
gpt-image-2(含-all/-vip)的选型对照表 - 对话式 Playground - Chat Completions 风格,同端点支持文生图与改图
- 文生图 Playground -
/v1/images/generations兼容端点,传size锁定尺寸 - 图片编辑 Playground -
/v1/images/edits多图融合与改图 - GPT-Image-2 官方版 - 需要
quality参数 / mask 局部重绘 / OpenAI 官方对齐字段时的选择 - GPT-Image 系列总览 - 官方 GPT-Image 系列对比
- API 使用手册 - 通用调用规范
gpt-image-2-vip 属于官逆通道(Codex 线路),行为对齐但定价/能力与官方版本不完全一致。需要官方完全一致字段时,请使用
gpt-image-2。