跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.apiyi.com/llms.txt

Use this file to discover all available pages before exploring further.

API易 支持 300+ 主流 AI 模型,本页面提供详细的模型信息、定价和使用说明。
企业级专业稳定的AI大模型API中转站
本站均为官方源头转发,价格八折(叠加充值加赠和汇率优势),聚合各种优秀大模型。不限速,不过期,不惧封号,按量计费,长期可靠服务。

🔥 当前推荐模型

以下为当前稳定供给的热门模型,完整模型列表和实时价格请访问 API易控制台定价页面
模型升级建议:我们推荐优先使用最新模型以获得最佳性能,但请注意:
  1. 上线初期可能不稳定:新模型刚发布时,原厂商算力可能不足,导致响应慢、超时或偶发错误,通常数天至数周后趋于稳定
  2. 注意参数兼容性:新模型可能新增或变更参数(如 max_completion_tokens 替代 max_tokens),升级前请检查 API 参数是否兼容老模型
  3. 务必先测试再上线:在将新模型用于生产环境前,务必在测试环境充分验证,确保输出质量和接口兼容性符合预期

模型分类

🤖 OpenAI 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
GPT-5.5 Progpt-5.5-pro1M当前最强推理,Terminal-Bench 2.0 82.7%;/v1/responses 端点 + SVIP 分组,价格高昂顶级推理、科研(专业需求)
GPT-5.5 🔥gpt-5.51MSWE-bench Verified 88.7%,幻觉率较 5.4 降 60%,新增 xhigh 推理档复杂智能体、专业工作流
GPT-5.4gpt-5.41M原生计算机操控,GDPval 83%复杂智能体、专业工作流
chat-latestchat-latest400K去版本号别名,始终指向最新 ChatGPT Instant(当前 GPT-5.5 Instant)快速写作、对话
GPT-5.2gpt-5.2400KGDPval 70.9% 超越专业人士编程规划、结构化任务
GPT-5.3 Codex 🔥gpt-5.3-codex128KSWE-Bench Pro SOTA,复杂编程与智能体任务复杂编程、智能体任务
GPT-5.1gpt-5.1128K智能与速度平衡,SWE-bench 76.3%,24h 缓存综合应用、编程
GPT Pro 系列(如 gpt-5.5-progpt-5-pro)使用须知
  1. 仅支持 /v1/responses 端点:不能走 /v1/chat/completions,调用前请确认 SDK / 代码已切换到 Responses API
  2. 价格高昂:单次调用可能消耗数美金,且仅对 SVIP 分组开放,避免 Default 分组误用
  3. 非专业需求不建议使用:日常任务用 GPT-5.5 / GPT-5.4 即可,Pro 仅适合对推理深度有极致要求的科研、顶级任务

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
GPT-5gpt-5128K旗舰稳定版,超强推理能力顶级推理、复杂任务
GPT-5 Minigpt-5-mini128KGPT-5 轻量版,性能优异平衡性能与成本
GPT-5 Nanogpt-5-nano128KGPT-5 超轻量版大批量处理
o3o3200K推理模型,已大幅降价,性价比极高复杂推理、数学、编程
o4-minio4-mini200K轻量级推理模型编程任务首选
GPT-4.1gpt-4.1128K速度快,主力模型之一综合应用
GPT-4.1 Minigpt-4.1-mini128K更便宜的轻量版本成本敏感场景
GPT-4ogpt-4o128K综合能力平衡,多模态支持通用场景
GPT-4o Minigpt-4o-mini128K轻量快速版本快速响应
GPT-5 系列使用注意事项
  1. 温度参数 temperature 必须设置为 1(只支持 1)
  2. 使用 max_completion_tokens 替代 max_tokens
  3. 不要传递 top_p 参数
图像和视频生成模型已移至专属页面,请访问 图像与视频生成模型 查看完整列表和定价。

🎭 Claude 系列 (Anthropic)

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
Claude Opus 4.7 🔥claude-opus-4-71M (Beta)编程基准较 4.6 +13%,生产任务 3 倍,工具错误降至 1/3,新增 xhigh 推理档顶级编程、复杂智能体
Claude Opus 4.7 Thinking 🔥claude-opus-4-7-thinking1M (Beta)自适应思维链,深度推理增强顶级推理任务
Claude Opus 4.6claude-opus-4-61M (Beta)Terminal-Bench 2.0 登顶,128K 输出顶级编程、复杂智能体
Claude Sonnet 4.6 🔥claude-sonnet-4-61M (Beta)全面升级,性能媲美 Opus 4.5,性价比极高编程首选、智能体开发

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
Claude Opus 4.5claude-opus-4-5-20251101200KSWE-bench 80.9%,价格降至前代 1/3复杂编程、顶级推理
Claude Sonnet 4.5claude-sonnet-4-5-20250929200K世界级编码模型,SWE-bench 77.2%代码生成、智能体开发
Claude Sonnet 4.5 Thinkingclaude-sonnet-4-5-20250929-thinking200K思维链模式,深度推理复杂编程推理任务
Claude Haiku 4.5claude-haiku-4-5-20251001200K高性价比编码模型,SWE-bench 73.3%,速度 2 倍实时聊天、结对编程
Claude 4 Sonnetclaude-sonnet-4-20250514200K稳定版本,编程首选代码生成、分析
Claude Opus 4.1claude-opus-4-1-20250805200K迭代升级版,编程优化高要求编程任务
最新推荐:Claude Opus 4.7 编程基准较 4.6 提升 13%,工具调用错误降至 1/3,新增 xhigh 推理档,价格持平 4.6。Sonnet 4.6 性能媲美 Opus 4.5,已成为 claude.ai 默认模型,性价比极高。稳定首选:Opus 4.5 和 Sonnet 4.5 经过充分验证,适合生产环境。Haiku 4.5 速度快 2 倍,性价比高。

🌟 Google Gemini 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
Gemini 3.5 Flash 🔥gemini-3.5-flash1MTerminal-Bench 2.1 76.2% 全面反超 3.1 Pro,速度约 4 倍、价格约一半编程首选、性价比之王
Gemini 3.1 Pro Preview 🔥gemini-3.1-pro-preview1MARC-AGI-2 77.1%(3 Pro 的 2 倍+),最强推理模型复杂推理、多模态分析
Gemini 3 Flash Previewgemini-3-flash-preview1MSWE-bench 78%,速度快 3 倍,含 thinking / nothinking 变体编程、性价比
Gemini 3.1 Flash Lite 🔥gemini-3.1-flash-lite1MGA 版,比 2.5 Flash 快 64%,超低价高并发、大批量、低成本
注意:Gemini 3 Pro Preview 已于 2026 年 3 月 9 日停止服务,请迁移至 Gemini 3.1 Pro Preview。

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
Gemini 2.5 Progemini-2.5-pro2M正式版,编程优势,多模态能力强长文本、编程、多模态
Gemini 2.5 Flashgemini-2.5-flash1M速度快,成本低,正式版快速响应场景
Gemini 2.5 Flash Litegemini-2.5-flash-lite1M超轻量版本,更快更便宜大批量简单任务
最新推荐:Gemini 3.5 Flash 在 Terminal-Bench 2.1、MCP Atlas 等基准全面反超 Gemini 3.1 Pro,速度约 4 倍、价格约一半,是当前编程性价比之王。Gemini 3.1 Pro Preview 推理能力翻倍(ARC-AGI-2 77.1%),是谷歌最先进推理模型。Gemini 3.1 Flash Lite 已转 GA,是最便宜的前沿模型,适合高并发场景。稳定首选:Gemini 2.5 Pro(2M 超长上下文)和 Gemini 2.5 Flash 已正式发布,适合生产环境。

🚀 xAI Grok 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
Grok 4.3 🔥grok-4.31MIntelligence Index 53、τ²-Bench 98%、IFBench 81%,1M 上下文 + 多模态复杂推理、综合任务
Grok 4grok-4标准官方版本,可选 grok-4-all 原生联网综合任务、实时信息
Grok 4 Fast Reasoning 🔥grok-4-fast-reasoning200K推理模式,显示思考过程,降价 93%+复杂推理任务
Grok Code Fast 1grok-code-fast-1256KSWE-bench 70.8%,高速生成代码生成、智能体编程

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
Grok 3grok-3标准官方稳定版本日常使用
Grok 3 Allgrok-3-all标准原生联网增强版新闻资讯、市场分析
Grok 3 Minigrok-3-mini标准带推理能力的小模型轻量任务
Grok Fast 系列价格优势
  • 相比 Grok-4 系列降价 93%+
  • 输入:$0.20/1M tokens,输出:$0.50/1M tokens
  • 业界领先的性价比,适合超长上下文场景

🔍 DeepSeek 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
DeepSeek V4 Pro 🔥deepseek-v4-pro1M1.6T/49B 激活,SWE-Verified 80.6 接近 Claude/Gemini,Hybrid Attention复杂推理、编程、智能体
DeepSeek V4 Flash 🔥deepseek-v4-flash1M284B/13B 激活,仅 $0.14/M 输入,开源 SOTA 性价比高并发、大批量
DeepSeek V3.2deepseek-v3.2128K性能比肩 GPT-5,工具调用融入推理复杂推理、编程

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
DeepSeek V3.1deepseek-v3-1-250821128K混合推理模式,Think/Non-Think 双模式智能推理、编程
DeepSeek R1deepseek-r164K推理模型数学、推理
DeepSeek V3deepseek-v3128K综合能力强通用场景

🐘 国产模型系列

智谱 AI (GLM)

🆕 最新:GLM-5.1 | ✅ 稳定/经典:GLM-5、GLM-4.6
模型名称模型ID上下文长度特点推荐场景
GLM-5.1 🔥glm-5.1200KSWE-Bench Pro 58.4 击败 GPT-5.4 / Opus 4.6 / Gemini 3.1 Pro,744B MoE,MIT 开源复杂编程、智能体
GLM-5glm-5200K744B 参数(40B 激活),编程对齐 Claude Opus 4.5,开源复杂编程、系统工程
GLM-4.6glm-4.6200K代码与推理增强版,稳定可靠编程、推理、智能体
GLM-4.5glm-4.5128K标准版本,综合能力强通用场景
GLM-5.1 特性
  • 744B MoE 参数,支持 8 小时长程智能体任务
  • SWE-Bench Pro 58.4,开源模型中编程能力最强
  • MIT 协议开源,性价比极高

阿里通义千问 (Qwen)

🆕 最新:Qwen3.7-Max | ✅ 稳定/经典:Qwen Max、Plus、Turbo
模型名称模型ID上下文长度特点推荐场景
Qwen3.7-Max 🔥qwen3.7-max1MAA Intelligence Index 56.6 全球前五、国产第一,agent 长程 35 小时自主任务智能体、多语言、长文本
Qwen Maxqwen-max32K最强稳定版本综合任务
Qwen Plusqwen-plus32K增强版本性价比场景
Qwen Turboqwen-turbo32K快速版本低延迟场景

Moonshot Kimi 系列

🆕 最新:Kimi K2.6 | ✅ 稳定/经典:Kimi K2.5、K2
模型名称模型ID上下文长度特点推荐场景
Kimi K2.6 🔥kimi-k2.6256K1T MoE / 32B 激活,SWE-Bench Pro 58.6 反超 GPT-5.4 与 Opus 4.6编程、智能体
Kimi K2.5kimi-k2.5200K原生多模态,Agent Swarm 100 智能体协作多模态、智能体
Kimi K2 正式版kimi-k2-250711200K火山引擎官方合作,稳定性强生产环境

🌐 MiniMax 系列

🆕 最新:MiniMax M2.7 | ✅ 稳定/经典:MiniMax M2.5
模型名称模型ID上下文长度特点推荐场景
MiniMax M2.7 🔥MiniMax-M2.7标准10B 参数 SWE-bench Pro 56.22%,自进化能力,最小 Tier-1 模型编程、智能体
MiniMax M2.5minimax-m2.5标准230B(10B 激活),SWE-bench 80.2%,极致性价比编程、智能体、办公自动化
MiniMax M2.7 特性
  • 仅 10B 参数即达 SWE-bench Pro 56.22%,最小的 Tier-1 模型
  • 具备自进化能力,标准版 $0.3 / highspeed 版(MiniMax-M2.7-highspeed)$0.6 每百万输入 tokens
  • 模型权重已开源

💰 定价说明

计费方式

  • 按量计费:根据实际使用的 Token 数量计费
  • 无最低消费:充多少用多少,余额永不过期
  • 实时扣费:每次调用后立即从余额扣除费用

价格优势

  • 官方源头转发,价格略有优势
  • 批量使用可联系客服获取更优惠价格
  • 新用户注册送 300万 Token 测试额度

查看实时价格

访问 API易控制台定价页面 查看所有模型的最新价格。

🛠️ 使用建议

模型选择指南

编程开发
  • 顶级性能:Claude Opus 4.7(编程基准较 4.6 +13%)、GPT-5.5(SWE-bench 88.7%)、Claude Sonnet 4.6(媲美 Opus 4.5)
  • 高性价比:Gemini 3.5 Flash(全面反超 3.1 Pro,价格约一半)、GLM-5.1(SWE-Bench Pro 58.4)、Kimi K2.6、DeepSeek V4 Flash
  • 备选:DeepSeek V4 Pro、Qwen3.7-Max、MiniMax M2.7、o4-mini
文本创作
  • 首选:GPT-5.5、GPT-5.4、Gemini 3.1 Pro Preview、Claude Opus 4.7、Claude Sonnet 4.6
  • 备选:chat-latest、Claude Sonnet 4.5、GPT-4.1、GPT-4o、Claude Haiku 4.5、GLM-4.6
快速响应
  • 首选:Gemini 3.5 Flash(约 4 倍速度)、Claude Haiku 4.5(速度快 2 倍)、GPT-4o Mini
  • 备选:Gemini 3.1 Flash Lite、Gemini 2.5 Flash、Grok 4 Fast、GPT-4.1 Mini
图像生成
  • 最新推荐:GPT Image 1.5(速度提升 4 倍,精准编辑,低 $0.01 起)
  • 专业设计:SeeDream 4.5(12 亿参数,4K 画质,$0.035/张)、Nano Banana Pro(4K 高清,最佳文本渲染)
  • 高性价比:Nano Banana 正式版(10 种宽高比,$0.025/张)、SeeDream 4.0($0.025/张)
  • 逆向、价格最便宜:sora_image、gpt-4o-image
视频生成
  • 首选:Sora 2 系列(音视频同步,无水印,$0.15/次起)
  • 竖屏:sora_video2,横屏:sora_video2-landscape,高清:sora-2-pro
长文本处理
  • 超长上下文:Gemini 2.5 Pro(2M)、Grok 4 Fast 系列(200K)、Grok Code Fast 1(256K)
  • 编程场景:GLM-4.6(200K)、Claude 4 系列(200K)、Kimi K2(200K)
联网搜索
  • 原生联网:Grok 4 All、Grok 3 All(无需工具调用)
  • 适合场景:实时信息、新闻资讯、市场动态分析

成本优化建议

  1. 分级使用:简单任务用便宜模型,复杂任务用高级模型
  2. 测试优化:先用小模型测试,确定需求后再用大模型
  3. 批量处理:大量相似任务可以选择 Nano 或 Mini 版本
  4. 缓存复用:对重复查询结果进行缓存

🔗 相关资源

模型列表持续更新中,我们会及时添加最新发布的优秀模型。如需使用特定模型或有批量需求,请联系客服。