GPT-Image-2-VIP 生图/编辑

⚠️ size 参数再次失效：当前仅支持自适应 1K 出图（2026-06-23 更新）因 Codex 调整生成规则，size 参数再次失效（此前曾短暂恢复一次），目前固定为自适应（auto）+ 1K 分辨率，暂无恢复预期。本页下方关于 size 锁尺寸、2K / 4K 档位的内容暂不生效，请勿依赖。那如何控制图片尺寸？ 和 gpt-image-2-all 一样，把比例写进提示词里仍然有效——例如提示词带上 [16:9]，最终出图约为 1672 × 941 像素（940.5 像素取整）。需要其它比例时同样在提示词里注明（如 [9:16]、[1:1]）。注意：目前分辨率只有 1K，提示词只能控比例、控不了到 2K / 4K。最新状态以实时动态为准：该参数是否恢复会随上游变动，最新进展请查看实时动态栏目（docs.apiyi.com/live）。

图片 API 全部为同步调用：没有异步任务 ID，客户端断开连接结果即丢失、但请求仍会计费。请为本模型设置足够大的 timeout，详见图片 API 调用须知与最佳实践。

概述

gpt-image-2-vip 是 API易平台上线的 GPT 图像生成 Codex 官逆模型。与 gpt-image-2-all 同价 $0.03/张，调用方式完全一致，最大区别是 支持 size 参数——覆盖 10 比例 × 3 分辨率档（1K Fast / 2K Recommended / 4K Detail）共 30 档常见尺寸，含 4K。

🎨 核心定位：当你需要锁定输出尺寸（电商主图、海报模板、视频封面、4K 壁纸等）时使用 gpt-image-2-vip。请求体里只需把 model 改成 gpt-image-2-vip、加一个 size 字段，其它代码与 gpt-image-2-all 完全相同。

文生图 API

/v1/images/generations，输入文本提示词 + size 生成指定尺寸图片。

图片编辑 API

/v1/images/edits，multipart 上传参考图 + 编辑/融合指令。

与 `gpt-image-2-all` 的关键差异

gpt-image-2-vip 与 gpt-image-2-all 同属逆向通道、同价、同套调用代码。互相映射——把同一段请求里的 model 字段从一个换成另一个，行为整体一致，差异如下：

维度	`gpt-image-2-all`	`gpt-image-2-vip`
渠道	逆向 ChatGPT 官网	逆向 Codex 线路
价格	$0.03 / 张	$0.03 / 张（所有 size 统一价）
`size` 参数	❌ 不接受（写进 prompt）	✅ 30 档 size，含 4K
4K（如 `3840x2160`）	❌	✅ 4K Detail 档
出图速度	约 30–60 秒	约 90–150 秒（与官转 `gpt-image-2` 持平）
`quality` 参数	❌ 不接受	❌ 不接受（不要传）
支持端点	`/images/generations` + `/images/edits`	同左（一模一样）
响应格式	`b64_json`（默认，纯 base64 无前缀）/ `url`（显式传参）	同左
适合场景	提示词驱动、对尺寸不敏感	需要稳定指定输出尺寸（含 4K）

一句话决策：不需要严格控尺寸、追求出图速度 → gpt-image-2-all；要锁死输出尺寸或要 4K → gpt-image-2-vip；需要画质参数 quality 或 OpenAI 官方完全对齐的字段 → 改用官方版 gpt-image-2。

核心特性

稳定锁定输出尺寸

size 字段直接接受 30 档常见尺寸，电商主图、海报模板、4K 壁纸都能严格输出

4K 高分辨率

4K Detail 档支持 2880×2880 / 3840×2160 / 3840×1632 等，适合大尺寸交付物

所有 size 统一价

1K / 2K / 4K 所有档位统一 $0.03/张，4K 不额外加价

调用方式同 -all

请求结构、字段、响应字段与 gpt-image-2-all 完全一致，可秒级切换模型名

文字还原度高

图内中英文、招牌、海报文字还原稳定，适合信息图与营销物料

中文提示词友好

原生理解中文描述，无需翻译即可获得高质量输出

自然语言改图

支持通过对话描述直接改图，无需蒙版，可多轮迭代

标准端点兼容

兼容 OpenAI Images API 标准端点 /images/generations、/images/edits

模型定价

模型名	计费方式	价格	输出
`gpt-image-2-vip`	按次计费	$0.03 / 张	单次返回 1 张图片，`size` 字段锁定输出尺寸

计费说明：

所有 30 档 size 统一定价 $0.03/张——4K Detail 不加价
失败请求不计费（如鉴权失败、参数校验失败）
如需生成 N 张，客户端并行调用 N 次

分组介绍

gpt-image-2-vip 放在 Default 默认分组 即可，不需要额外切分组。逆向通道目前供给稳定，不存在像官转那样需要”企业分组”过渡的场景。

模型	分组	备注
`gpt-image-2-vip`	`Default`	逆向 Codex 线路，统一 $0.03/张，约 90–150 秒出图
`gpt-image-2-vip`	`image2_OSS`	1x 倍率（不加价），确定性 URL 输出——默认分组资源紧张时不会降级为 base64

需要确定性 URL 输出 → 切到 `image2_OSS` 分组

gpt-image-2-vip（及 gpt-image-2-all）在默认分组下实测（2026-07）不传 response_format 时返回 b64_json；显式传 response_format: "url" 可拿到图片 URL。但默认分组的输出格式不做承诺——历史上曾默认返回 url、资源紧张时降级为 b64_json，行为随负载与渠道版本变化过。如果你的业务强依赖 URL 输出（直接把 URL 落库、前端按 URL 渲染、不接受 base64），请把令牌分组切到 image2_OSS——这是专为 URL 输出确定性设计的分组，1x 倍率（不加价），对 gpt-image-2-vip 和 gpt-image-2-all 两个官逆模型都生效，保证响应稳定输出图片 URL，不会降级为 base64。

令牌创建界面：计费模式「按量优先」，选择分组 image2_OSS（1x 倍率），支持输出为图片 URL 的分组，适合 gpt-image-2-all 与 gpt-image-2-vip — 令牌创建：计费模式选「按量优先」，分组选 image2_OSS（1x）——需要确定性 URL 输出时使用

进阶玩法（同时使用 gpt-image-2-all 与官转 gpt-image-2）：如果你的令牌同时覆盖逆向两模与官转 gpt-image-2，可以在令牌的「分组优先级」里这样配——

第一优先级：image2Enterprise（1.2x 企业分组，官转专用稳定通道）
默认（兜底）：Default（逆向两模都在这里，按模型路由）

这样官转 gpt-image-2 走企业分组保稳，逆向两模仍走默认分组——一把令牌覆盖三种模型，互不干扰。

📖 关于 image2Enterprise 企业分组：/live/2026-04/image2-enterprise

技术规格

维度	参数
模型名	`gpt-image-2-vip`
渠道性质	官方逆向（逆向 Codex 线路）
定价	$0.03 / 张，按次计费（所有 size 统一价）
出图速度	约 90–150 秒（与官转 `gpt-image-2` 持平，慢于 `gpt-image-2-all` 的 30–60 秒）
`size` 参数	✅ 30 档：10 比例 × 3 分辨率档（1K Fast / 2K Recommended / 4K Detail）
4K 支持	✅ 4K Detail 档（如 `3840x2160` / `2880x2880`）
`quality` 参数	❌ 不支持，不要传
`n` 参数	❌ 不支持，单次仅返回 1 张
默认响应格式	`b64_json`（纯 base64，无 `data:` 前缀，2026-07 实测；建议显式传 `response_format`）
可选响应格式	`url`（R2 CDN 加速链接，默认 1 天有效期，需显式传 `response_format: "url"`）
中文提示词	✅ 原生支持
支持能力	文生图、单图编辑、多图融合、自然语言改图

⏰ 图片 URL 有效期：默认 1 天url 模式响应的 url 字段是 R2 CDN 加速链接，有效期约 24 小时，过期后访问会 404。需要长期保存的图片请在生成后尽快转存到自己的对象存储 / CDN / 数据库，或改用 b64_json 响应格式。

端点一览

gpt-image-2-vip 与 gpt-image-2-all 兼容完全相同的两个端点。把 model 字段换掉、按需加上 size 即可：

端点	用途	Content-Type	适用场景
`POST /v1/images/generations`	文生图	`application/json`	OpenAI Images API 标准格式，方便同一套代码同时调用官转与官逆
`POST /v1/images/edits`	图片编辑（单图 / 多图）	`multipart/form-data`	OpenAI Images API 标准格式，方便同一套代码同时调用官转与官逆

统一使用 OpenAI Images API（/v1/images/generations + /v1/images/edits），理由有二：

更稳定：上游对 Images API 通道的资源供给更充足，调用成功率更高
兼容官转，便于切换：与官转 gpt-image-2 调用方式、size 等参数完全兼容——遇到官逆通道风控异常时，只需更换 model 名即可切换，业务代码零改动

另有对话式端点（/v1/chat/completions，不主推），见下方「常见问题」。

域名选择：api.apiyi.com 为主域名，也可使用 b.apiyi.com / vip.apiyi.com 等平台提供的其他网关域名，响应行为一致。

支持的 size（30 档完整对照表）

gpt-image-2-vip 支持 10 个比例 × 3 个分辨率档 = 30 档 常见尺寸。请求体直接传 size: "宽x高"（半角小写 x）。

1K Fast — 草稿与低成本试稿

比例	命名	像素
1:1	Square	`1280x1280`
2:3	Portrait	`848x1280`
3:2	Photo	`1280x848`
3:4	Portrait	`960x1280`
4:3	Standard	`1280x960`
4:5	Social	`1024x1280`
5:4	Large	`1280x1024`
9:16	Story	`720x1280`
16:9	Wide	`1280x720`
21:9	Cinema	`1280x544`

2K Recommended — 默认推荐档（多数终稿）

比例	命名	像素
1:1	Square	`2048x2048`
2:3	Portrait	`1360x2048`
3:2	Photo	`2048x1360`
3:4	Portrait	`1536x2048`
4:3	Standard	`2048x1536`
4:5	Social	`1632x2048`
5:4	Large	`2048x1632`
9:16	Story	`1152x2048`
16:9	Wide	`2048x1152`
21:9	Cinema	`2048x864`

4K Detail — 大尺寸交付物

比例	命名	像素
1:1	Square	`2880x2880`
2:3	Portrait	`2336x3520`
3:2	Photo	`3520x2336`
3:4	Portrait	`2480x3312`
4:3	Standard	`3312x2480`
4:5	Social	`2560x3216`
5:4	Large	`3216x2560`
9:16	Story	`2160x3840`
16:9	Wide	`3840x2160`
21:9	Cinema	`3840x1632`

30 档统一价：所有档位都是 $0.03/张，4K Detail 不额外加价。

怎么选档位：

1K Fast：用于草稿、缩略图、A/B 测试，省时（也不省钱，价格统一），出图最快。
2K Recommended：默认档，覆盖大部分终稿场景（电商主图、海报、信息图）。
4K Detail：印刷、大屏壁纸、视频封面、桌面 / 户外大图。

最小调用示例（只传 size，不要传 quality）：

curl "https://api.apiyi.com/v1/images/generations" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $YI_API_KEY" \
  -d '{
    "model": "gpt-image-2-vip",
    "prompt": "生成一张白色陶瓷马克杯放在灰色桌面上的产品图，柔和自然光，简洁背景",
    "size": "2048x1360"
  }'

最佳实践

输入图先压到 1.5MB 以内（图生图 / 多图融合）

上传给接口的每张图先压到 1.5MB 以内（JPEG 质量 80-90 / 分辨率适当下调），多图融合时也按这个标准逐张控制。偶发的 shell_api_error / Unknown error 大多就是图片体积过大触发的，压一下请求成功率和出图速度都会明显改善。输出分辨率由 size 字段决定，与输入图体积无关——压小输入只会提速、不会损画质。提示词里光写 4K / 8K 这类词也不会真给你 4K，画质看 size，不看 prompt 修饰词。

按交付物档位选 size

草稿用 1K Fast、终稿用 2K Recommended、印刷/大屏用 4K Detail。所有档位统一价，按需要选。

size 用半角小写 x

请求体写 "size": "1536x1024"，不是 1536×1024、不是大写 X。

不要传 quality 与 n

quality 不接受；n 单次仅返回 1 张图，多张请客户端并行调用。

超时设到 300 秒

出图典型 90–150s，叠加图片上传/下载与高峰长尾，保守按 300s 配，避免大量误超时。

响应格式按需选择

Web 应用直接渲染用 b64_json，服务端中转存储用 url。

代码可与 -all 共用

同一套调用代码，把 model 在 gpt-image-2-all ↔ gpt-image-2-vip 之间切换即可。需要锁尺寸时切到 -vip，需要更快出图时切回 -all。

错误码与重试

状态码	含义	建议
`400`	size 取值不在 30 档内或格式错误	用上表中的精确字符串
`401`	令牌无效	检查 Bearer Token
`429`	限流/额度不足	指数退避重试
`500`（4K 偶发）	OpenAI 上游算力波动，4K Detail 档较易触发	优先降到 2K Recommended 档重试；必须 4K 时改用官转 `gpt-image-2` + `image2Enterprise` 企业分组
`5xx`（其它）	网关/后端临时错误	重试 1–2 次
超时	Codex 高峰 + 4K 长尾	客户端设置 ≥ 300s 超时（保守值）

建议客户端：

请求超时 300 秒 起步（保守值；典型 90–150s，但 4K Detail + 高峰长尾会更长）
对 5xx 与超时做 指数退避重试（建议 2–3 次）
记录响应头 request-id 方便排查

常见问题

vip 和 -all 调用代码可以共用吗？

可以，几乎完全一样。 两个端点（/v1/images/generations、/v1/images/edits）的请求字段、响应字段、b64_json 前缀行为都一致。差异只有两处：

model 字段：gpt-image-2-vip ↔ gpt-image-2-all
size 字段：vip 接受 30 档常见尺寸；-all 不接受 size，尺寸要写进 prompt

实际工程实践：保留同一套代码，做一个 if model == 'vip': payload['size'] = ... 的开关即可。

vip 出图为什么这么慢？

gpt-image-2-vip 走的是 Codex 逆向通道，典型 90–150 秒，与官转 gpt-image-2（100–120 秒）持平，比 ChatGPT 网页线路的 gpt-image-2-all（约 30–60 秒）慢。如果对响应延迟敏感，建议优先用 gpt-image-2-all；只在必须锁尺寸或 4K 时切换到 vip。

size 必须严格按表里写吗？传 1024x768 会怎么样？

是的，建议严格用表里 30 档之一。非表内 size 可能触发上游 invalid_request_error，请按交付需求选最接近的档位。

4K 调用为何频繁报 500？怎么稳定出 4K？

现象：在 4K Detail 档（如 3840x2160 / 2880x2880）较容易触发 status_code: 500 错误，上游返回 invalid_request_error：

{
  "status_code": 500,
  "error": {
    "message": "An error occurred while processing your request. ... Please include the request ID xxxxxxxx in your message.",
    "type": "invalid_request_error",
    "code": null
  }
}

根因：OpenAI 算力波动，与请求参数本身无关——同一段请求换 2K 档大概率就过了。Codex 官逆通道对 4K 这种大输出的负载更敏感，高峰期更明显。应对建议（按性价比排序）：

优先改用 2K Recommended 档（如 2048x1360 / 2048x2048）—— 2K 成功率显著更高，价格同样 $0.03/张
图生图 / 多图融合少传输入图 —— Codex 官逆链路对多入图请求处理压力大，会进一步增加 4K 失败率；单张输入图先压到 1.5MB 以内也有帮助
如必须稳定出 4K —— 切换到官转模型 gpt-image-2 + image2Enterprise 企业分组。官转 4K 价格更高（约 $0.3+/张），但稳定性显著更好，适合对 4K 交付有硬要求的场景。

📖 经验来源：/live/2026-05/gpt-image-2-vip-4k-tips

输入图要压缩吗？提示词里写 4K / 8K 有用吗？

强烈建议压。单张输入图压到 1.5MB 以内（JPEG 质量 80-90 / 分辨率适当下调）：偶发的 shell_api_error / Unknown error 大多就是图片体积过大触发的，压一下请求成功率和出图速度都会明显改善。注意 1.5MB 是推荐上限（追求稳定性与速度），上面 FAQ 写的 10MB 是网关硬上限。别担心压输入会损画质——本模型输出分辨率由 size 参数决定，跟你上传图的体积没关系。压小输入只会提速、不会损画质。提示词里光写 4K / 8K 这类词也不会真给你 4K。如果 prompt 写 8K 超清 但 size 选 1024x1024，最终拿到的就是 1K 水平。要 4K 请在 size 字段里指定——30 档里 1K / 2K / 4K 同价 $0.03/张，按需要直接选。📖 排错来源：/live/2026-05/gpt-image-2-vip-unknown-error

4K 真的不加价吗？

不加价，4K Detail 档（3840x2160 / 2880x2880 等）与 1K / 2K 同价 $0.03/张。

支持 n 参数吗？传 n=3 会怎样？

不支持。 本模型单次只返回 1 张图，请通过重复调用 / 并发调用的方式生成多张。⚠️ 重要：如果在请求里传入 n=3，计费会按 0.03 × 3 = $0.09 扣费，但实际上仍然只返回 1 张图。请务必把 n 字段从请求里去掉，避免被多扣费。

内容被拒/模型回复「我不能做到这个需求」，会计费吗？

官逆是同步对话式返回，结果分两种情况，计费规则不同：1) 返回 5xx 状态码 → 不计费上游内容策略明确拦截时会返回类似：

{
  "error": {
    "message": "没有按照预期生成图片，请重新调整提示词后重试（traceid: 0672821c6951af183dbf847130caaf16）",
    "localized_message": "Unknown error",
    "type": "invalid_request_error",
    "param": "",
    "code": null
  }
}

这种”明确报错”调用不计费，引导用户调整提示词重试即可。2) 返回 200 状态码（模型用文字软拒绝）→ 计费模型在对话里软拒绝、用文字回复（例如「我不能做到这个需求」「抱歉，这个请求涉及……」），从协议层看就是一次正常的对话返回，这种情况会被计费。官逆目前没有办法在协议层提前识别”这一段是拒绝文字而不是图片”。为什么不能直接对软拒绝免单？强行对所有”软拒绝”都不计费意味着平台要为每次失败承担上游成本；更关键的是，频繁触发上游内容安全会让供应方账号更容易被封号——这部分供给侧的硬成本也无法完全规避。给接入方的建议

✅ 前置内容过滤 / 风险提示：在前端或接入层先做一道关键词与场景过滤（如真实姓名、版权角色、敏感题材），并在 UI 上提示”涉及名人/版权题材时上游限制较严，可能失败也会计费”，能显著降低误扣率。
✅ C 端产品月度补发：理解 C 端产品无法完全控制用户输入。如果你的月用量较大（月消费 $1000+ 起），可以按月汇总日志（短耗时调用通常对应软拒绝）联系客服一次性人工补发，无须逐条申诉。

📖 相关：官逆 500 多为内容违规

b64_json 前缀要不要自己加 data:image/png;base64,？

先检测再处理。2026-07 实测返回的 b64_json 为纯 base64（不带前缀），需要解码写文件或自行拼接前缀后再渲染；但历史版本曾直接带前缀。请在代码里做 startsWith('data:') 检测：有前缀直接用作 img src，无前缀先解码，避免双重拼接或带前缀解码产出损坏的图片。

参考图最大多大？格式要求？

推荐 单张 ≤ 10MB，格式 png / jpg / webp。过大的图可能触发网关限制。多图融合时每张都需满足此限制。

生成的图片 URL 有效期是多久？需要自己转存吗？

url 模式响应的 url 字段是 R2 CDN 加速链接，有效期约 1 天（24 小时），过期后会 404。强烈建议：生成后尽快把图片 转存到自己的对象存储（S3 / OSS / R2）、CDN 或数据库，不要长期直接引用本服务返回的 URL。

能流式返回吗？

本模型为一次性出图，不支持 stream 输出。如果对响应延迟敏感，建议客户端显示”生成中”进度提示，并合理配置 300s 超时（保守值）。

能用 OpenAI 的官方 SDK 直连吗？

可以。把 base_url 指向 https://api.apiyi.com/v1，api_key 设为 API易令牌即可。client.images.generate(model="gpt-image-2-vip", size="2048x1360", prompt=...) 直接可用。

还能用 /v1/chat/completions 对话方式出图吗？

可以，端点仍然可用，但不再主推——推荐统一使用 /v1/images/generations 与 /v1/images/edits（更稳定、与官转 gpt-image-2 同套代码）。对话方式仅适合两类场景：多轮迭代改图、需要直接传在线图片 URL。注意出图意图不够明确时可能返回纯文字而不是图片（可在提示词开头加「生成图片：」前缀强化）。详细参数见对话式调用说明。

什么时候应该改用官方版 gpt-image-2？

需要 quality（low/medium/high）档位、需要 mask 局部重绘、需要 OpenAI 官方完全一致的字段行为时，改用 gpt-image-2（官转）。详见官转 vs 官逆对比。

产品基础

基础 API

图片 API（官转）

视频 API（官转）

多模态理解 API

文本 API

概述

文生图 API

图片编辑 API

与 `gpt-image-2-all` 的关键差异

核心特性

稳定锁定输出尺寸

4K 高分辨率

所有 size 统一价

调用方式同 -all

文字还原度高

中文提示词友好

自然语言改图

标准端点兼容

模型定价

分组介绍

需要确定性 URL 输出 → 切到 `image2_OSS` 分组

技术规格

端点一览

支持的 size（30 档完整对照表）

1K Fast — 草稿与低成本试稿

2K Recommended — 默认推荐档（多数终稿）

4K Detail — 大尺寸交付物

最佳实践

错误码与重试

常见问题

相关文档

​概述

文生图 API

图片编辑 API

​与 gpt-image-2-all 的关键差异

​核心特性

稳定锁定输出尺寸

4K 高分辨率

所有 size 统一价

调用方式同 -all

文字还原度高

中文提示词友好

自然语言改图

标准端点兼容

​模型定价

​分组介绍

​需要确定性 URL 输出 → 切到 image2_OSS 分组

​技术规格

​端点一览

​支持的 size（30 档完整对照表）

​1K Fast — 草稿与低成本试稿

​2K Recommended — 默认推荐档（多数终稿）

​4K Detail — 大尺寸交付物

​最佳实践

​错误码与重试

​常见问题

​相关文档

概述

与 `gpt-image-2-all` 的关键差异

核心特性

模型定价

分组介绍

需要确定性 URL 输出 → 切到 `image2_OSS` 分组

技术规格

端点一览

支持的 size（30 档完整对照表）

1K Fast — 草稿与低成本试稿

2K Recommended — 默认推荐档（多数终稿）

4K Detail — 大尺寸交付物

最佳实践

错误码与重试

常见问题

相关文档