跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.apiyi.com/llms.txt

Use this file to discover all available pages before exploring further.

一句话结论

你需要选这个
quality 画质参数 / mask 局部重绘 / OpenAI 官方完全对齐字段gpt-image-2(官转)
可预测的统一价($0.03/张)+ 出图较快gpt-image-2-all(官逆,ChatGPT 网页线,~90s)
可预测的统一价 + 严格锁尺寸(含 4K)gpt-image-2-vip(官逆,Codex 线,~120–200s)
三个模型底层都是 OpenAI gpt-image-2,差别在通道性质(官方直连 vs 逆向)、计费方式、参数粒度。
官逆两兄弟(-all / -vip):本页”官逆”列同时覆盖 gpt-image-2-allgpt-image-2-vip——两者调用方式完全一致、同价 $0.03/张,差异仅在 size 字段出图速度
  • gpt-image-2-all:无 size(写进 prompt),ChatGPT 网页线,约 90 秒 出图
  • gpt-image-2-vip:支持 30 档 size(10 比例 × 1K/2K/4K,含 4K),Codex 线,约 120–200 秒 出图(与官转持平)
  • 共同点:均不支持 quality、不支持 n、不支持 mask 局部重绘
下表”官逆”列差异行会用 -all / -vip 子格分别标注。需要 quality 画质或 mask 局部重绘时仍请走官转 gpt-image-2
关于速度:当前 -all / -vip 出图速度比刚上线时慢一些,这是 OpenAI 官方算力波动 导致的全链路放缓——APIYI 的号池和运维侧并无问题,所有逆向通道用户都会感受到。建议把超时设置在 300 秒以上,复杂场景预留更多。

完整对比表

维度gpt-image-2-all / -vip(官逆,高性价比)gpt-image-2(官转,正式版)
模型名gpt-image-2-all(不锁尺寸、出图最快) / gpt-image-2-vip(要指定 size 或 4K 时用)gpt-image-2
通道性质-all:逆向 ChatGPT 官网线路
-vip:逆向 Codex 线路
官方直连(OpenAI Images API)
计费方式按次计费:固定 $0.03/次(两模同价、所有 size 统一价)按量计费:按 token 实计,官网同价;本站充值加赠后约 8.5 折
典型成本/张$0.03(不区分尺寸 / 画质 / 模型)实测 $0.03 – $0.2(与提示词长度、size、quality 正相关)
令牌分组默认分组(Default)默认分组(Default)
令牌类型按次计费按量优先 均可仅支持按量优先(本模型按 token 计费,按次计费令牌不可用)
推荐端点/v1/chat/completions(方便传 URL) + /v1/images/generations + /v1/images/edits(同套代码兼容官转)/v1/images/generations + /v1/images/edits
备选端点三端点皆可,按场景选(仅官方两个端点)
上传图片格式base64 或 https URL(chat 端点)/ multipart file(edits 端点)multipart file(编辑接口)
输出图片格式b64_json已带前缀)或 url(R2 CDN)b64_json纯 base64,无前缀
上传图片数(编辑)多张(chat 模式理论上限较高)最多 16 张image[]
mask 局部重绘❌ 不支持✅ 支持(要求带 alpha 通道)
指令遵循优秀
生成速度-all:约 90 秒(较快)
-vip:约 120–200 秒(与官转持平)
📌 当前比刚上线时慢——OpenAI 官方算力波动所致,非 APIYI 侧问题
100-120 秒,复杂场景 + 4K 可达 3-5 分钟
size 参数-all:❌ 不接受(写进 prompt)
-vip:✅ 30 档常见 size(10 比例 × 1K/2K/4K)
✅ 任意合法尺寸
size = auto 行为-all:— 不接受 size 字段
-vip:文生图时模型自动选尺寸(同 prompt 倾向收敛到一个相对固定值);改图时按 prompt 指代图的比例输出
✅ 默认值,OpenAI 官方语义”按 prompt 智能选”;社区实测偏向 1:1 方形(1024×1024),要其它比例请显式传 size
支持 4K-all:❌
-vip:✅ 4K Detail 档(如 3840x2160 / 2880x2880
✅ 含 3840×2160
常见输出尺寸-all:16:9 → 1672×941、9:16 → 941×1672、1:1 → 1254×1254(自适应)
-vip:见 完整 30 档表
8 个预设 + 任意合法自定义尺寸
画质参数 quality❌ 两模均不支持(不要传)low / medium / high / auto
n 参数❌ 两模均不支持(单次仅返回 1 张)✅ 支持
透明背景❌ 不支持(background: transparent 会报错)
中文提示词✅ 原生✅ 原生
文字渲染高还原度高还原度(high 档位最强)
内容限制较少(更宽松)较严格(OpenAI 官方策略)
API 文档GPT-Image-2-All 概览 / GPT-Image-2-VIP 概览GPT-Image-2 概览
🔑 如何创建或管理令牌https://api.apiyi.com/token
在控制台创建令牌时可以选择分组(Default 默认即可)和令牌类型(按次计费 / 按量优先)。调用 gpt-image-2(官转)必须使用「按量优先」类型的令牌,否则会因计费方式不匹配被拒。

选型场景

gpt-image-2-all(官逆)的场景

💰 成本可预测

单价稳定 $0.03/张,无尺寸 / 画质阶梯,适合大批量生产、成本必须封顶的场景(信息图、营销物料、电商素材批量)。

⚡ 出图速度较快

约 90 秒出图,-vip 和官转都略快,前端实时交互体验更好。

🗨️ 对话式工作流

/v1/chat/completions 同端点支持多轮迭代改图、文生图、带图编辑,集成最简单

🌏 中文 + 营销文字

中文提示词原生友好、招牌 / 海报 / 信息图文字还原度高,适合面向中文用户的内容生产

gpt-image-2-vip(官逆,要锁尺寸或 4K)的场景

📐 严格锁定输出尺寸

支持 30 档常见 size(10 比例 × 1K/2K/4K),适合电商主图、海报模板、视频封面、桌面壁纸等需要稳定输出尺寸的场景。

🖼️ 同价拿到 4K

4K Detail 档(2880×2880 / 3840×2160 / 3840×1632 等)与 1K/2K 同价 $0.03/张,4K 不加价

🔁 与 -all 共用代码

调用结构与 -all 完全一致,请求体里只多一个 size 字段——可以一套代码两个模型来回切。

💰 成本仍可预测

单价仍稳定 $0.03/张,比官转 4K 高画质便宜很多——4K 锁尺寸场景的高性价比之选。

gpt-image-2(官转)的场景

🎚️ 需要画质档位

quality 支持 low/medium/high/auto。草稿用 low 省成本,终稿 high 出印刷级效果——这是官转独有,官逆两模都不支持。

🎯 mask 局部重绘

支持 alpha 通道蒙版,精准修改图片局部区域而保留其余部分——官逆两模都不支持。

🖼️ 任意自定义尺寸

size 参数接受任意合法尺寸;如果你的尺寸不在 -vip 的 30 档之内,需要更细粒度的尺寸控制时选官转。

🔌 与 OpenAI 官方一致

走官方 Images API,字段与行为完全与官方一致。已有基于 OpenAI 官方 SDK 的代码 / 系统可零改动迁移,长期更稳。

关键差异详解

1. b64_json 格式差异(迁移坑!)

# gpt-image-2-all:b64_json 已含前缀,可直接用作 <img src>
all_b64 = resp["data"][0]["b64_json"]
# "data:image/png;base64,iVBORw0KGgo..."
img_tag = f'<img src="{all_b64}">'  # ✅ 直接用

# gpt-image-2:b64_json 是纯 base64,无前缀,需自己 decode 或拼前缀
official_b64 = resp.data[0].b64_json
# "iVBORw0KGgo..."
with open("out.png", "wb") as f:
    f.write(base64.b64decode(official_b64))  # ✅ 写文件
img_tag = f'<img src="data:image/png;base64,{official_b64}">'  # ✅ 浏览器渲染
从一个切到另一个时,b64_json 处理代码必须改,否则会拿到损坏的 data URL 或 decode 失败。

2. 分辨率控制方式

gpt-image-2-all(写在 prompt 里):
"横版 16:9 电影画幅,黄昏时的海边老灯塔"   → 输出约 1672×941
"竖版 9:16 手机壁纸,赛博朋克城市雨夜"      → 输出约 941×1672
"1024×1024 方形 LOGO,极简猫咪线条"          → 输出约 1254×1254
gpt-image-2-vip(同为官逆,可直接传 size,30 档含 4K):
curl "https://api.apiyi.com/v1/images/generations" \
  -H "Authorization: Bearer $YI_API_KEY" \
  -d '{
    "model": "gpt-image-2-vip",
    "prompt": "白色陶瓷马克杯放在灰色桌面上",
    "size": "2048x1360"
  }'

# 4K 也可以,同价 $0.03
# "size": "3840x2160"
gpt-image-2size 参数严格控制 + quality 档位):
client.images.generate(
    model="gpt-image-2",
    prompt="...",
    size="2048x1152",   # ✅ 精确按此输出
    quality="high"      # 仅官转支持
)

3. 上传 / 输出格式差异

操作gpt-image-2-allgpt-image-2
上传参考图base64 data URL 或 https URL(在 chat messages 的 image_url 里)multipart image[] 文件字段
下载生成图默认 url(R2 CDN,24 小时有效期),可改 b64_json(带前缀)b64_json纯 base64,需 decode)
多图融合chat 端点多个 image_url 即可image[] 数组重复传入,最多 16 张

4. 价格示例(粗算)

场景gpt-image-2-all / -vipgpt-image-2
1024×1024 草图$0.03~$0.006(low)
1024×1024 中等画质$0.03~$0.053(medium)
1024×1024 高画质$0.03~$0.211(high)
2048×1152 高画质$0.03~$0.20+(按 token 实计)
3840×2160 4K 高画质$0.03(仅 -vip 支持 4K)按 token 实计,显著高于 1K
编辑 / 多图融合$0.03输入 token 显著上升,单次成本可达 $0.1+
结论:批量、低画质场景用官逆不一定省(草图 1K low 在官转上反而更便宜);中-高画质区段 + 4K 都是官逆 $0.03 的甜点区——-vip 的 4K 与 1K/2K 同价,相比官转 4K 高画质能省一个数量级。需要 quality 档位 / mask 局部重绘 / OpenAI 官方完全对齐字段 时再选官转。

客户端调用建议

设置项gpt-image-2-all / -vipgpt-image-2
超时(保守值)-all300 秒(典型 ~90s)
-vip300 秒(典型 120–200s,4K 长尾更长)
360 秒(4K 高画质实测可达 3-5 分钟)
重试策略5xx 与超时指数退避 2 次同左
并发chat 端点天然并发友好;单次仅返回 1 张,多张请并发单次 1 张,需要多张请并发
请求 IDrequest-id 响应头x-request-id 响应头
三个模型通用:图生图 / 多图融合时,单张输入图先压到 1.5MB 以内(JPEG 质量 80-90 / 分辨率适当下调)。偶发的 shell_api_error / Unknown error 大多就是图片体积过大触发的,压一下请求成功率和出图速度都会明显改善。输出分辨率与输入图体积无关——画质看输出端配置(-vip / 官转看 size-all 看 prompt 画幅描述),不看输入端体积。

常见问题

强烈建议压。三个模型上传给接口的图都先压到 1.5MB 以内(JPEG 质量 80-90 / 分辨率适当下调):偶发的 shell_api_error / Unknown error 大多就是图片体积过大触发的,压一下请求成功率和出图速度都会明显改善。别担心压输入会损画质——输出分辨率与输入图体积无关,三个模型的”输出端”控制方式不同:总结:压输入只会提速,不会损画质——画质看输出端配置,不看输入端体积。
可以。三者都走默认分组(Default),同一个 API Key 同时调用即可,无需额外配置。注意:调用 gpt-image-2(官转)需要「按量优先」类型的令牌;-all / -vip 两种令牌类型都能用。
有可能。当出图意图不够明确时,官逆模型的 chat 端点可能返回纯文字。强化办法:在用户提示词的开头追加固定前缀如「生成图片:」或 system 提示词约束输出。
两者都是逆向通道、同价 $0.03/张、调用方式完全一致,差异只有:
  • size 字段-all 不接受(写进 prompt);-vip 接受 30 档常见 size(含 4K)
  • 出图速度-all 约 90 秒;-vip 约 120–200 秒(与官转持平)。当前比刚上线时慢,源自 OpenAI 官方算力波动
决策:不锁尺寸、追求最快出图 → -all;要锁尺寸或要 4K → -vip。详见 GPT-Image-2-VIP 概览
需要。官转独有:quality 档位(low/medium/high/auto)、mask 局部重绘(alpha 通道蒙版)、OpenAI 官方完全对齐字段(已有官方 SDK 代码零改动迁移)、任意非 30 档之外的合法尺寸成本上,-vip 的 4K 与 1K/2K 同价 $0.03/张,相比官转 4K 高画质能省一个数量级——4K 锁尺寸场景首推 -vip
  • 沿用官方 SDK / 要求与 OpenAI 官方一致:选 gpt-image-2(官转),需要删掉 input_fidelity、避开 background: transparent,其它字段不动
  • 想顺便降低成本,对尺寸不敏感:选 gpt-image-2-all(官逆,~90s)
  • 想顺便降低成本,要锁尺寸或 4K:选 gpt-image-2-vip(官逆,~120–200s)
可以。常见做法:主用 -all-vip(成本可预测,按业务是否要锁尺寸选),兜底用 gpt-image-2(需要 quality 档位 / mask 时切过去)。官转和官逆两类模型响应字段不同,业务层做一次格式归一即可。

相关文档