当下热门模型（保持更新）

API易支持 300+ 主流 AI 模型，本页面提供详细的模型信息、定价和使用说明。

企业级专业稳定的AI大模型API中转站
本站均为官方源头转发，价格八折（叠加充值加赠和汇率优势），聚合各种优秀大模型。不限速，不过期，不惧封号，按量计费，长期可靠服务。

🔥 当前推荐模型

以下为当前稳定供给的热门模型，完整模型列表和实时价格请访问 API易控制台定价页面。

模型升级建议：我们推荐优先使用最新模型以获得最佳性能，但请注意：

上线初期可能不稳定：新模型刚发布时，原厂商算力可能不足，导致响应慢、超时或偶发错误，通常数天至数周后趋于稳定
注意参数兼容性：新模型可能新增或变更参数（如 max_completion_tokens 替代 max_tokens），升级前请检查 API 参数是否兼容老模型
务必先测试再上线：在将新模型用于生产环境前，务必在测试环境充分验证，确保输出质量和接口兼容性符合预期

模型分类

🤖 OpenAI 系列

🆕 最新模型

模型名称	模型ID	上下文长度	特点	推荐场景
GPT-5.5 Pro	`gpt-5.5-pro`	1M	当前最强推理，Terminal-Bench 2.0 82.7%；仅 `/v1/responses` 端点 + SVIP 分组，价格高昂	顶级推理、科研（专业需求）
GPT-5.5 🔥	`gpt-5.5`	1M	SWE-bench Verified 88.7%，幻觉率较 5.4 降 60%，新增 `xhigh` 推理档	复杂智能体、专业工作流
GPT-5.4	`gpt-5.4`	1M	原生计算机操控，GDPval 83%	复杂智能体、专业工作流
chat-latest	`chat-latest`	400K	去版本号别名，始终指向最新 ChatGPT Instant（当前 GPT-5.5 Instant）	快速写作、对话
GPT-5.2	`gpt-5.2`	400K	GDPval 70.9% 超越专业人士	编程规划、结构化任务
GPT-5.3 Codex 🔥	`gpt-5.3-codex`	128K	SWE-Bench Pro SOTA，复杂编程与智能体任务	复杂编程、智能体任务
GPT-5.1	`gpt-5.1`	128K	智能与速度平衡，SWE-bench 76.3%，24h 缓存	综合应用、编程

GPT Pro 系列（如 gpt-5.5-pro、gpt-5-pro）使用须知：

仅支持 /v1/responses 端点：不能走 /v1/chat/completions，调用前请确认 SDK / 代码已切换到 Responses API
价格高昂：单次调用可能消耗数美金，且仅对 SVIP 分组开放，避免 Default 分组误用
非专业需求不建议使用：日常任务用 GPT-5.5 / GPT-5.4 即可，Pro 仅适合对推理深度有极致要求的科研、顶级任务

✅ 稳定/经典系列

模型名称	模型ID	上下文长度	特点	推荐场景
GPT-5 ⭐	`gpt-5`	128K	旗舰稳定版，超强推理能力	顶级推理、复杂任务
GPT-5 Mini	`gpt-5-mini`	128K	GPT-5 轻量版，性能优异	平衡性能与成本
GPT-5 Nano	`gpt-5-nano`	128K	GPT-5 超轻量版	大批量处理
o3 ⭐	`o3`	200K	推理模型，已大幅降价，性价比极高	复杂推理、数学、编程
o4-mini	`o4-mini`	200K	轻量级推理模型	编程任务首选
GPT-4.1 ⭐	`gpt-4.1`	128K	速度快，主力模型之一	综合应用
GPT-4.1 Mini	`gpt-4.1-mini`	128K	更便宜的轻量版本	成本敏感场景
GPT-4o	`gpt-4o`	128K	综合能力平衡，多模态支持	通用场景
GPT-4o Mini	`gpt-4o-mini`	128K	轻量快速版本	快速响应

GPT-5 系列使用注意事项：

温度参数 temperature 必须设置为 1（只支持 1）
使用 max_completion_tokens 替代 max_tokens
不要传递 top_p 参数

图像和视频生成模型已移至专属页面，请访问图像与视频生成模型查看完整列表和定价。

🎭 Claude 系列 (Anthropic)

🆕 最新模型

模型名称	模型ID	上下文长度	特点	推荐场景
Claude Opus 4.7 🔥	`claude-opus-4-7`	1M (Beta)	编程基准较 4.6 +13%，生产任务 3 倍，工具错误降至 1/3，新增 xhigh 推理档	顶级编程、复杂智能体
Claude Opus 4.7 Thinking 🔥	`claude-opus-4-7-thinking`	1M (Beta)	自适应思维链，深度推理增强	顶级推理任务
Claude Opus 4.6	`claude-opus-4-6`	1M (Beta)	Terminal-Bench 2.0 登顶，128K 输出	顶级编程、复杂智能体
Claude Sonnet 4.6 🔥	`claude-sonnet-4-6`	1M (Beta)	全面升级，性能媲美 Opus 4.5，性价比极高	编程首选、智能体开发

✅ 稳定/经典系列

模型名称	模型ID	上下文长度	特点	推荐场景
Claude Opus 4.5 ⭐	`claude-opus-4-5-20251101`	200K	SWE-bench 80.9%，价格降至前代 1/3	复杂编程、顶级推理
Claude Sonnet 4.5 ⭐	`claude-sonnet-4-5-20250929`	200K	世界级编码模型，SWE-bench 77.2%	代码生成、智能体开发
Claude Sonnet 4.5 Thinking	`claude-sonnet-4-5-20250929-thinking`	200K	思维链模式，深度推理	复杂编程推理任务
Claude Haiku 4.5 ⭐	`claude-haiku-4-5-20251001`	200K	高性价比编码模型，SWE-bench 73.3%，速度 2 倍	实时聊天、结对编程
Claude 4 Sonnet	`claude-sonnet-4-20250514`	200K	稳定版本，编程首选	代码生成、分析
Claude Opus 4.1	`claude-opus-4-1-20250805`	200K	迭代升级版，编程优化	高要求编程任务

最新推荐：Claude Opus 4.7 编程基准较 4.6 提升 13%，工具调用错误降至 1/3，新增 xhigh 推理档，价格持平 4.6。Sonnet 4.6 性能媲美 Opus 4.5，已成为 claude.ai 默认模型，性价比极高。稳定首选：Opus 4.5 和 Sonnet 4.5 经过充分验证，适合生产环境。Haiku 4.5 速度快 2 倍，性价比高。

🌟 Google Gemini 系列

🆕 最新模型

模型名称	模型ID	上下文长度	特点	推荐场景
Gemini 3.5 Flash 🔥	`gemini-3.5-flash`	1M	Terminal-Bench 2.1 76.2% 全面反超 3.1 Pro，速度约 4 倍、价格约一半	编程首选、性价比之王
Gemini 3.1 Pro Preview 🔥	`gemini-3.1-pro-preview`	1M	ARC-AGI-2 77.1%（3 Pro 的 2 倍+），最强推理模型	复杂推理、多模态分析
Gemini 3 Flash Preview	`gemini-3-flash-preview`	1M	SWE-bench 78%，速度快 3 倍，含 thinking / nothinking 变体	编程、性价比
Gemini 3.1 Flash Lite 🔥	`gemini-3.1-flash-lite`	1M	GA 版，比 2.5 Flash 快 64%，超低价	高并发、大批量、低成本

注意：Gemini 3 Pro Preview 已于 2026 年 3 月 9 日停止服务，请迁移至 Gemini 3.1 Pro Preview。

✅ 稳定/经典系列

模型名称	模型ID	上下文长度	特点	推荐场景
Gemini 2.5 Pro ⭐	`gemini-2.5-pro`	2M	正式版，编程优势，多模态能力强	长文本、编程、多模态
Gemini 2.5 Flash ⭐	`gemini-2.5-flash`	1M	速度快，成本低，正式版	快速响应场景
Gemini 2.5 Flash Lite	`gemini-2.5-flash-lite`	1M	超轻量版本，更快更便宜	大批量简单任务

最新推荐：Gemini 3.5 Flash 在 Terminal-Bench 2.1、MCP Atlas 等基准全面反超 Gemini 3.1 Pro，速度约 4 倍、价格约一半，是当前编程性价比之王。Gemini 3.1 Pro Preview 推理能力翻倍（ARC-AGI-2 77.1%），是谷歌最先进推理模型。Gemini 3.1 Flash Lite 已转 GA，是最便宜的前沿模型，适合高并发场景。稳定首选：Gemini 2.5 Pro（2M 超长上下文）和 Gemini 2.5 Flash 已正式发布，适合生产环境。

🚀 xAI Grok 系列

🆕 最新模型

模型名称	模型ID	上下文长度	特点	推荐场景
Grok 4.3 🔥	`grok-4.3`	1M	Intelligence Index 53、τ²-Bench 98%、IFBench 81%，1M 上下文 + 多模态	复杂推理、综合任务
Grok 4	`grok-4`	标准	官方版本，可选 `grok-4-all` 原生联网	综合任务、实时信息
Grok 4 Fast Reasoning 🔥	`grok-4-fast-reasoning`	200K	推理模式，显示思考过程，降价 93%+	复杂推理任务
Grok Code Fast 1 ⭐	`grok-code-fast-1`	256K	SWE-bench 70.8%，高速生成	代码生成、智能体编程

✅ 稳定/经典系列

模型名称	模型ID	上下文长度	特点	推荐场景
Grok 3 ⭐	`grok-3`	标准	官方稳定版本	日常使用
Grok 3 All	`grok-3-all`	标准	原生联网增强版	新闻资讯、市场分析
Grok 3 Mini	`grok-3-mini`	标准	带推理能力的小模型	轻量任务

Grok Fast 系列价格优势：

相比 Grok-4 系列降价 93%+
输入：$0.20/1M tokens，输出：$0.50/1M tokens
业界领先的性价比，适合超长上下文场景

🔍 DeepSeek 系列

🆕 最新模型

模型名称	模型ID	上下文长度	特点	推荐场景
DeepSeek V4 Pro 🔥	`deepseek-v4-pro`	1M	1.6T/49B 激活，SWE-Verified 80.6 接近 Claude/Gemini，Hybrid Attention	复杂推理、编程、智能体
DeepSeek V4 Flash 🔥	`deepseek-v4-flash`	1M	284B/13B 激活，仅 $0.14/M 输入，开源 SOTA 性价比	高并发、大批量
DeepSeek V3.2	`deepseek-v3.2`	128K	性能比肩 GPT-5，工具调用融入推理	复杂推理、编程

✅ 稳定/经典系列

模型名称	模型ID	上下文长度	特点	推荐场景
DeepSeek V3.1 ⭐	`deepseek-v3-1-250821`	128K	混合推理模式，Think/Non-Think 双模式	智能推理、编程
DeepSeek R1	`deepseek-r1`	64K	推理模型	数学、推理
DeepSeek V3	`deepseek-v3`	128K	综合能力强	通用场景

🐘 国产模型系列

智谱 AI (GLM)

🆕 最新：GLM-5.1 | ✅ 稳定/经典：GLM-5、GLM-4.6

模型名称	模型ID	上下文长度	特点	推荐场景
GLM-5.1 🔥	`glm-5.1`	200K	SWE-Bench Pro 58.4 击败 GPT-5.4 / Opus 4.6 / Gemini 3.1 Pro，744B MoE，MIT 开源	复杂编程、智能体
GLM-5 ⭐	`glm-5`	200K	744B 参数（40B 激活），编程对齐 Claude Opus 4.5，开源	复杂编程、系统工程
GLM-4.6	`glm-4.6`	200K	代码与推理增强版，稳定可靠	编程、推理、智能体
GLM-4.5	`glm-4.5`	128K	标准版本，综合能力强	通用场景

GLM-5.1 特性：

744B MoE 参数，支持 8 小时长程智能体任务
SWE-Bench Pro 58.4，开源模型中编程能力最强
MIT 协议开源，性价比极高

阿里通义千问 (Qwen)

🆕 最新：Qwen3.7-Max | ✅ 稳定/经典：Qwen Max、Plus、Turbo

模型名称	模型ID	上下文长度	特点	推荐场景
Qwen3.7-Max 🔥	`qwen3.7-max`	1M	AA Intelligence Index 56.6 全球前五、国产第一，agent 长程 35 小时自主任务	智能体、多语言、长文本
Qwen Max ⭐	`qwen-max`	32K	最强稳定版本	综合任务
Qwen Plus	`qwen-plus`	32K	增强版本	性价比场景
Qwen Turbo	`qwen-turbo`	32K	快速版本	低延迟场景

Moonshot Kimi 系列

🆕 最新：Kimi K2.6 | ✅ 稳定/经典：Kimi K2.5、K2

模型名称	模型ID	上下文长度	特点	推荐场景
Kimi K2.6 🔥	`kimi-k2.6`	256K	1T MoE / 32B 激活，SWE-Bench Pro 58.6 反超 GPT-5.4 与 Opus 4.6	编程、智能体
Kimi K2.5	`kimi-k2.5`	200K	原生多模态，Agent Swarm 100 智能体协作	多模态、智能体
Kimi K2 正式版 ⭐	`kimi-k2-250711`	200K	火山引擎官方合作，稳定性强	生产环境

🌐 MiniMax 系列

🆕 最新：MiniMax M2.7 | ✅ 稳定/经典：MiniMax M2.5

模型名称	模型ID	上下文长度	特点	推荐场景
MiniMax M2.7 🔥	`MiniMax-M2.7`	标准	10B 参数 SWE-bench Pro 56.22%，自进化能力，最小 Tier-1 模型	编程、智能体
MiniMax M2.5	`minimax-m2.5`	标准	230B（10B 激活），SWE-bench 80.2%，极致性价比	编程、智能体、办公自动化

MiniMax M2.7 特性：

仅 10B 参数即达 SWE-bench Pro 56.22%，最小的 Tier-1 模型
具备自进化能力，标准版 $0.3 / highspeed 版（MiniMax-M2.7-highspeed）$0.6 每百万输入 tokens
模型权重已开源

💰 定价说明

计费方式

按量计费：根据实际使用的 Token 数量计费
无最低消费：充多少用多少，余额永不过期
实时扣费：每次调用后立即从余额扣除费用

价格优势

官方源头转发，价格略有优势
批量使用可联系客服获取更优惠价格
新用户注册送 300万 Token 测试额度

查看实时价格

访问 API易控制台定价页面查看所有模型的最新价格。

🛠️ 使用建议

模型选择指南

编程开发

顶级性能：Claude Opus 4.7（编程基准较 4.6 +13%）、GPT-5.5（SWE-bench 88.7%）、Claude Sonnet 4.6（媲美 Opus 4.5）
高性价比：Gemini 3.5 Flash（全面反超 3.1 Pro，价格约一半）、GLM-5.1（SWE-Bench Pro 58.4）、Kimi K2.6、DeepSeek V4 Flash
备选：DeepSeek V4 Pro、Qwen3.7-Max、MiniMax M2.7、o4-mini

文本创作

首选：GPT-5.5、GPT-5.4、Gemini 3.1 Pro Preview、Claude Opus 4.7、Claude Sonnet 4.6
备选：chat-latest、Claude Sonnet 4.5、GPT-4.1、GPT-4o、Claude Haiku 4.5、GLM-4.6

快速响应

首选：Gemini 3.5 Flash（约 4 倍速度）、Claude Haiku 4.5（速度快 2 倍）、GPT-4o Mini
备选：Gemini 3.1 Flash Lite、Gemini 2.5 Flash、Grok 4 Fast、GPT-4.1 Mini

图像生成

最新推荐：GPT Image 1.5（速度提升 4 倍，精准编辑，低 $0.01 起）
专业设计：SeeDream 4.5（12 亿参数，4K 画质，$0.035/张）、Nano Banana Pro（4K 高清，最佳文本渲染）
高性价比：Nano Banana 正式版（10 种宽高比，$0.025/张）、SeeDream 4.0（$0.025/张）
逆向、价格最便宜：sora_image、gpt-4o-image

视频生成

首选：Sora 2 系列（音视频同步，无水印，$0.15/次起）
竖屏：sora_video2，横屏：sora_video2-landscape，高清：sora-2-pro

长文本处理

超长上下文：Gemini 2.5 Pro（2M）、Grok 4 Fast 系列（200K）、Grok Code Fast 1（256K）
编程场景：GLM-4.6（200K）、Claude 4 系列（200K）、Kimi K2（200K）

联网搜索

原生联网：Grok 4 All、Grok 3 All（无需工具调用）
适合场景：实时信息、新闻资讯、市场动态分析

成本优化建议

分级使用：简单任务用便宜模型，复杂任务用高级模型
测试优化：先用小模型测试，确定需求后再用大模型
批量处理：大量相似任务可以选择 Nano 或 Mini 版本
缓存复用：对重复查询结果进行缓存

🔗 相关资源

模型对比测试 - 图像生成效果对比
实时价格查询 - 最新定价信息
API 文档 - 详细接口说明
快速开始 - 集成指南

模型列表持续更新中，我们会及时添加最新发布的优秀模型。如需使用特定模型或有批量需求，请联系客服。

产品基础

基础 API

图片 API（官转）

视频 API（官转）

多模态理解 API

文本 API

当下热门模型（保持更新）

🔥 当前推荐模型

模型分类

🤖 OpenAI 系列

🆕 最新模型

✅ 稳定/经典系列

🎭 Claude 系列 (Anthropic)

🆕 最新模型

✅ 稳定/经典系列

🌟 Google Gemini 系列

🆕 最新模型

✅ 稳定/经典系列

🚀 xAI Grok 系列

🆕 最新模型

✅ 稳定/经典系列

🔍 DeepSeek 系列

🆕 最新模型

✅ 稳定/经典系列

🐘 国产模型系列

智谱 AI (GLM)

阿里通义千问 (Qwen)

Moonshot Kimi 系列

🌐 MiniMax 系列

💰 定价说明

计费方式

价格优势

查看实时价格

🛠️ 使用建议

模型选择指南

成本优化建议

🔗 相关资源

​🔥 当前推荐模型

​模型分类

​🤖 OpenAI 系列

​🆕 最新模型

​✅ 稳定/经典系列

​🎭 Claude 系列 (Anthropic)

​🆕 最新模型

​✅ 稳定/经典系列

​🌟 Google Gemini 系列

​🆕 最新模型

​✅ 稳定/经典系列

​🚀 xAI Grok 系列

​🆕 最新模型

​✅ 稳定/经典系列

​🔍 DeepSeek 系列

​🆕 最新模型

​✅ 稳定/经典系列

​🐘 国产模型系列

​智谱 AI (GLM)

​阿里通义千问 (Qwen)

​Moonshot Kimi 系列

​🌐 MiniMax 系列

​💰 定价说明

​计费方式

​价格优势

​查看实时价格

​🛠️ 使用建议

​模型选择指南

​成本优化建议

​🔗 相关资源

🔥 当前推荐模型

模型分类

🤖 OpenAI 系列

🆕 最新模型

✅ 稳定/经典系列

🎭 Claude 系列 (Anthropic)

🆕 最新模型

✅ 稳定/经典系列

🌟 Google Gemini 系列

🆕 最新模型

✅ 稳定/经典系列

🚀 xAI Grok 系列

🆕 最新模型

✅ 稳定/经典系列

🔍 DeepSeek 系列

🆕 最新模型

✅ 稳定/经典系列

🐘 国产模型系列

智谱 AI (GLM)

阿里通义千问 (Qwen)

Moonshot Kimi 系列

🌐 MiniMax 系列

💰 定价说明

计费方式

价格优势

查看实时价格

🛠️ 使用建议

模型选择指南

成本优化建议

🔗 相关资源