五大模型平台API全方位对比：DeepSeek、OpenAI、Gemini、Claude、Kimi

此篇内容由 AI 生成，仅供参考。

前言

随着大语言模型（LLM）的快速发展，DeepSeek、OpenAI、Google Gemini、Anthropic Claude 和 Moonshot Kimi 已成为开发者最常接触的五大模型平台。虽然各家 API 在设计上都参考了 OpenAI 的 Chat Completions 格式，但在参数细节、响应结构、模型能力和定价策略上仍有显著差异。

本文将从 请求参数、响应格式、模型列表、定价 等多个维度进行全面对比，帮助开发者在做技术选型时快速找到最适合的方案。文中数据均核对自 2026 年 6 月各平台官方文档。

一、基本信息速览

对比维度	DeepSeek	OpenAI	Gemini	Claude	Kimi
API 端点	`https://api.deepseek.com/v1/chat/completions`	`https://api.openai.com/v1/chat/completions`	原生：`generativelanguage.googleapis.com/v1beta/models/{model}:generateContent` 兼容层：`.../v1beta/openai/chat/completions`	`https://api.anthropic.com/v1/messages`	`https://api.moonshot.cn/v1/chat/completions`
协议兼容	✅ OpenAI 兼容 ✅ Anthropic 兼容	原生	✅ OpenAI 兼容层 ❌ 原生格式独立	❌ 独立协议	✅ OpenAI 兼容
认证方式	`Bearer $API_KEY`	`Bearer $API_KEY`	`Authorization: Bearer $API_KEY`（兼容层）或 `?key=$API_KEY`（原生）	`x-api-key: $API_KEY`	`Bearer $API_KEY`
系统提示	`messages[0].role="system"`	`messages[0].role="system"`	兼容层：`role="system"` 原生：`systemInstruction`	`system` 独立参数	`messages[0].role="system"`
多模态支持	❌ 文本	✅ 文本+图片+音频	✅ 文本+图片+音频+视频	✅ 文本+图片+PDF	✅ 文本+图片+视频
思考模式	✅ `thinking` + `reasoning_effort`	✅ `reasoning_effort`（GPT-5.x）	✅ `reasoning_effort`（兼容层） `thinkingConfig`（原生）	✅ `thinking` / `adaptive` + `output_config.effort`	✅ `thinking` 参数

💡 关键发现：DeepSeek、Kimi 和 Gemini（兼容层）均可通过 OpenAI SDK 接入，只需修改 base_url。DeepSeek 还额外支持 Anthropic 格式（https://api.deepseek.com/anthropic）。Claude 仍使用独立的 Messages API，迁移成本最高。

二、请求参数全面对比

2.1 核心生成参数

参数	DeepSeek	OpenAI	Gemini	Claude	Kimi
model (必填)	✅	✅	路径参数 / body	✅	✅
messages/contents (必填)	✅ `messages`	✅ `messages`	✅ `contents` / `messages`	✅ `messages`	✅ `messages`
temperature	0-2，默认 1	0-2，默认 1	0-2，默认 1	0-1，默认 1	K2.x 未公开默认值；V1 默认 0
top_p	0-1，默认 1	0-1，默认 1	0-1，默认 0.95	0-1，默认 1	0-1，默认 1
top_k	❌	❌	✅ 默认 40	❌	❌
max_tokens	✅ `max_tokens`	⚠️ 已弃用，改用 `max_completion_tokens`	✅ `maxOutputTokens`	✅ 必填	✅
stop	✅ string/array（最多 16 个）	✅ string/array（最多 4 个）	✅ `stopSequences`	✅ `stop_sequences`	✅
stream	✅ SSE	✅ SSE	✅ SSE	✅ SSE	✅ SSE
frequency_penalty	⚠️ 已弃用	✅ -2.0~2.0	❌	❌	✅（V1 系列）
presence_penalty	⚠️ 已弃用	✅ -2.0~2.0	❌	❌	✅（V1 系列）
seed	❌	✅	❌	❌	❌
logprobs	✅	✅	❌	❌	❌
n（多候选）	❌	✅	❌	❌	✅（V1 系列）

⚠️ DeepSeek 在思考模式下，temperature、top_p、frequency_penalty、presence_penalty 传入后不生效（不报错）。

2.2 消息结构对比

DeepSeek / OpenAI / Kimi / Gemini（OpenAI 兼容层）

{
  "messages": [
    {"role": "system", "content": "你是一个有用的助手"},
    {"role": "user", "content": "你好"},
    {"role": "assistant", "content": "你好！有什么可以帮助你的？"},
    {"role": "user", "content": "今天天气怎么样？"}
  ]
}

支持角色：system、user、assistant、tool

Kimi K2.x 还支持多模态 content 数组（text / image_url / video_url）。

Claude（独立格式）

{
  "system": "你是一个有用的助手",
  "messages": [
    {"role": "user", "content": "你好"},
    {"role": "assistant", "content": "你好！有什么可以帮助你的？"},
    {"role": "user", "content": "今天天气怎么样？"}
  ]
}

关键区别：

Claude 的 system 是顶层参数，不在 messages 数组中
Claude 的 content 支持数组格式（文本+图片混合）
Claude 的 messages 必须以 user 开头，不支持 system 角色

Gemini（原生格式）

{
  "systemInstruction": {
    "parts": [{"text": "你是一个有用的助手"}]
  },
  "contents": [
    {
      "role": "user",
      "parts": [{"text": "你好"}]
    },
    {
      "role": "model",
      "parts": [{"text": "你好！有什么可以帮助你的？"}]
    },
    {
      "role": "user",
      "parts": [{"text": "今天天气怎么样？"}]
    }
  ]
}

关键区别：

使用 contents 而非 messages
助手角色为 model 而非 assistant
内容通过 parts 数组组织
systemInstruction 为独立顶层字段

2.3 工具调用（Function Calling）

功能	DeepSeek	OpenAI	Gemini	Claude	Kimi
支持工具调用	✅ 最多 128 个函数	✅	✅ `functionDeclarations`	✅ `tools`	✅
并行调用	❌	✅ `parallel_tool_calls`	❌	⚠️ 默认开启，可 `disable_parallel_tool_use`	❌
强制调用	✅ `tool_choice: "required"`	✅	✅ `toolConfig`	✅ `tool_choice`	✅
严格模式	✅ `strict: true`（Beta）	✅ `strict: true`	❌	❌	❌

工具定义对比：

// DeepSeek / OpenAI / Kimi (OpenAI 兼容格式)
{
  "type": "function",
  "function": {
    "name": "get_weather",
    "description": "查询天气",
    "parameters": {
      "type": "object",
      "properties": {
        "city": {"type": "string", "description": "城市名"}
      },
      "required": ["city"]
    }
  }
}

// Claude 格式
{
  "name": "get_weather",
  "description": "查询天气",
  "input_schema": {
    "type": "object",
    "properties": {
      "city": {"type": "string", "description": "城市名"}
    },
    "required": ["city"]
  }
}

⚠️ 注意：Claude 使用 input_schema 而非 parameters，且工具定义不需要 type: "function" 包裹。

2.4 思考/推理模式

平台	参数	说明
DeepSeek	`thinking: {type: "enabled"/"disabled"}` + `reasoning_effort: "high"/"max"`	V4 默认开启思考；`low`/`medium` 映射为 `high`，`xhigh` 映射为 `max`
OpenAI	`reasoning_effort: "none"/"low"/"medium"/"high"/"xhigh"`	GPT-5.4 / GPT-5.5 等旗舰模型支持；GPT-5.5 默认 `medium`
Gemini	兼容层：`reasoning_effort`；原生：`thinkingConfig`	2.5 系列映射为 `thinking_budget`；3.x 系列映射为 `thinking_level`
Claude	`thinking: {type: "enabled", budget_tokens: N}` 或 `{type: "adaptive"}` + `output_config.effort`	Opus 4.8 使用自适应思考（始终开启）；Sonnet 4.6 支持扩展思考
Kimi	`thinking: {type: "enabled"/"disabled", keep: "all"}`	K2.6 默认开启；K2.7 Code 仅支持 `enabled`，始终思考

DeepSeek / Kimi 思考模式下，响应会额外返回 reasoning_content 字段（与 content 同级）。

三、响应格式对比

3.1 非流式响应

DeepSeek / OpenAI / Kimi

{
  "id": "chatcmpl-xxx",
  "object": "chat.completion",
  "created": 1712345678,
  "model": "deepseek-v4-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好！今天天气不错。",
        "reasoning_content": "（思考模式下可选返回）"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 8,
    "total_tokens": 18
  }
}

DeepSeek 额外返回 prompt_cache_hit_tokens / prompt_cache_miss_tokens；Kimi 返回 cached_tokens。

Claude

{
  "id": "msg_xxx",
  "type": "message",
  "role": "assistant",
  "model": "claude-sonnet-4-6",
  "content": [
    {
      "type": "text",
      "text": "你好！今天天气不错。"
    }
  ],
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 10,
    "output_tokens": 8
  }
}

Gemini（原生）

{
  "candidates": [
    {
      "content": {
        "parts": [{"text": "你好！今天天气不错。"}],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 10,
    "candidatesTokenCount": 8,
    "totalTokenCount": 18
  }
}

3.2 finish_reason / stop_reason 对比

含义	DeepSeek	OpenAI	Gemini	Claude	Kimi
正常结束	`stop`	`stop`	`STOP`	`end_turn`	`stop`
达到长度限制	`length`	`length`	`MAX_TOKENS`	`max_tokens`	`length`
工具调用	`tool_calls`	`tool_calls`	`TOOL_CALLS`	`tool_use`	`tool_calls`
内容过滤	`content_filter`	`content_filter`	`SAFETY`	-	`content_filter`
资源不足	`insufficient_system_resource`	-	-	-	-

3.3 流式响应对比

平台	事件格式	结束标志	usage 包含方式
DeepSeek	SSE `data: {...}`	`data: [DONE]`	`stream_options.include_usage`
OpenAI	SSE `data: {...}`	`data: [DONE]`	`stream_options.include_usage`
Gemini	SSE `data: {...}`	流结束	最后 chunk
Claude	SSE `event: content_block_delta`	`event: message_stop`	`event: message_delta`
Kimi	SSE `data: {...}`	`data: [DONE]`	最后 chunk 含 usage

四、模型列表与能力

4.1 DeepSeek

模型	上下文	最大输出	思考模式	特点
`deepseek-v4-flash`	1M	384K	默认开启，可切换	高性价比，通用对话
`deepseek-v4-pro`	1M	384K	默认开启，可切换	旗舰性能，复杂推理

⚠️ deepseek-chat / deepseek-reasoner 将于 2026 年 7 月 24 日 弃用，分别对应 V4 Flash 的非思考与思考模式。

4.2 OpenAI

模型	上下文	特点
`gpt-5.5`	1.05M	最新旗舰，复杂专业任务，默认 `reasoning_effort: medium`
`gpt-5.4`	1.05M	高性价比旗舰，支持 none/low/medium/high/xhigh
`gpt-5.4-mini`	1.05M	最强 mini 模型，适合子 Agent 和代码
`gpt-4o`	128K	上一代多模态旗舰（仍可用）
`o3` / `o4-mini`	200K	专用推理模型

GPT-5.4 / GPT-5.5 在输入超过 272K tokens 时，整段会话按 2 倍输入、1.5 倍输出计费。

4.3 Gemini

模型	上下文	特点
`gemini-3.5-flash`	1M	最新快速模型，前沿智能+搜索增强
`gemini-3.1-pro-preview`	1M	最强多模态与 Agent 能力
`gemini-3.1-flash-lite`	1M	极致性价比，高吞吐 Agent 任务
`gemini-2.5-flash`	1M	混合推理，支持 thinking budget
`gemini-2.5-pro`	1M	稳定强推理，多模态
`gemini-2.5-flash-lite`	1M	2.5 系列最低成本

4.4 Claude

模型	上下文	特点
`claude-opus-4-8`	1M	最新 Opus，自适应思考，128K 最大输出
`claude-sonnet-4-6`	1M	速度与智能最佳平衡，支持扩展思考
`claude-haiku-4-5`	200K	最快速度，近前沿智能
`claude-fable-5`	1M	2026 年 6 月 GA 的新旗舰（$10/$50 MTok）

Claude 4.6 及以后模型 ID 采用无日期格式（如 claude-sonnet-4-6），均为固定快照版本。

4.5 Kimi

模型	上下文	特点
`kimi-k2.7-code`	256K	最新编码模型，始终思考，支持文本+图片+视频
`kimi-k2.7-code-highspeed`	256K	高速版，~180 tokens/s
`kimi-k2.6`	256K	旗舰通用模型，支持思考开关
`kimi-k2.5`	256K	上一代多模态，性价比更高
`moonshot-v1-128k`	128K	V1 经典系列

五、定价对比

数据采集于 2026 年 6 月。DeepSeek、Kimi 为官方人民币标价；OpenAI、Gemini、Claude 为官方美元标价，按 1 USD ≈ 7.2 CNY 换算供横向参考（实际汇率以账单为准）。

平台	模型	输入（缓存命中）	输入（缓存未命中）	输出
DeepSeek	V4 Flash	¥0.02	¥1.00	¥2.00
DeepSeek	V4 Pro	¥0.025	¥3.00	¥6.00
OpenAI	GPT-5.5	¥3.60	¥36.00	¥216.00
OpenAI	GPT-5.4	¥1.80	¥18.00	¥108.00
OpenAI	GPT-5.4 mini	¥0.54	¥5.40	¥32.40
Gemini	3.5 Flash	-	¥10.80	¥64.80
Gemini	2.5 Flash	-	¥2.16	¥18.00
Gemini	2.5 Pro	-	¥9.00	¥72.00
Claude	Haiku 4.5	¥0.72	¥7.20	¥36.00
Claude	Sonnet 4.6	¥2.16	¥21.60	¥108.00
Claude	Opus 4.8	¥3.60	¥36.00	¥180.00
Kimi	K2.6	¥1.10	¥6.50	¥27.00
Kimi	K2.7 Code	¥1.30	¥6.50	¥27.00
Kimi	K2.5	¥0.70	¥4.00	¥21.00

💡 定价结论：

DeepSeek 在缓存命中场景成本极低（¥0.02/百万 tokens），整体最具价格竞争力

Gemini 2.5 Flash（¥2.16 输入）和 Kimi K2.5（¥4.00 输入）是性价比较高的国际/国产选择

Claude Opus 4.8 已从旧版 Opus 4 的 $15/$75 降至 $5/$25，定价大幅下调

OpenAI GPT-5.4 mini（¥5.40 输入）在 GPT-5 系列中性价比最佳

六、代码示例

6.1 DeepSeek（OpenAI 兼容）

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://api.deepseek.com/v1"
)

response = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个有用的助手"},
        {"role": "user", "content": "介绍一下深度求索公司"}
    ],
    temperature=0.7,
    max_tokens=2048,
    extra_body={"thinking": {"type": "enabled"}},
    reasoning_effort="high"
)

print(response.choices[0].message.content)
# 思考模式还可访问 response.choices[0].message.reasoning_content

6.2 OpenAI

from openai import OpenAI

client = OpenAI(api_key="sk-xxx")

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": "你是一个有用的助手"},
        {"role": "user", "content": "介绍一下OpenAI公司"}
    ],
    reasoning_effort="medium",
    max_completion_tokens=2048
)

print(response.choices[0].message.content)

6.3 Gemini（OpenAI 兼容层，推荐）

from openai import OpenAI

client = OpenAI(
    api_key="your-gemini-api-key",
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

response = client.chat.completions.create(
    model="gemini-3.5-flash",
    messages=[
        {"role": "system", "content": "你是一个有用的助手"},
        {"role": "user", "content": "介绍一下Google公司"}
    ],
    reasoning_effort="low",
    max_completion_tokens=2048
)

print(response.choices[0].message.content)

6.4 Claude

import anthropic

client = anthropic.Anthropic(api_key="sk-ant-xxx")

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=2048,
    system="你是一个有用的助手",
    messages=[
        {"role": "user", "content": "介绍一下Anthropic公司"}
    ]
)

print(response.content[0].text)

6.5 Kimi（OpenAI 兼容）

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://api.moonshot.cn/v1"
)

response = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[
        {"role": "system", "content": "你是一个有用的助手"},
        {"role": "user", "content": "介绍一下月之暗面公司"}
    ],
    max_tokens=2048,
    extra_body={"thinking": {"type": "enabled"}}
)

print(response.choices[0].message.content)

七、迁移指南：从 OpenAI 切换到其他平台

切换到 DeepSeek

client = OpenAI(
    api_key="sk-your-deepseek-key",
    base_url="https://api.deepseek.com/v1"
)
# model 改为 deepseek-v4-flash 或 deepseek-v4-pro
# 注意：frequency_penalty / presence_penalty 已弃用
# 思考模式需通过 extra_body={"thinking": {"type": "enabled"}} 开启

切换到 Kimi

client = OpenAI(
    api_key="sk-your-kimi-key",
    base_url="https://api.moonshot.cn/v1"
)
# model 改为 kimi-k2.6 或 kimi-k2.7-code
# K2.7 Code 始终开启思考，不支持 thinking.type="disabled"

切换到 Gemini（兼容层，低成本迁移）

client = OpenAI(
    api_key="your-gemini-api-key",
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)
# model 改为 gemini-3.5-flash 或 gemini-2.5-flash
# reasoning_effort 可直接映射 Gemini 思考强度

切换到 Claude（需要重构）

import anthropic

client = anthropic.Anthropic(api_key="sk-ant-xxx")

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=2048,                      # 必填！
    system="你是一个有用的助手",           # 独立参数
    messages=[...]
)
# content 是数组，需要 response.content[0].text

八、选型建议

场景	推荐平台	理由
最低成本	DeepSeek V4 Flash	缓存命中仅 ¥0.02/百万 tokens
最强推理	Claude Opus 4.8 / OpenAI GPT-5.5	复杂推理与 Agent 任务表现最佳
多模态应用	Gemini 3.1 Pro / Kimi K2.6	原生支持文本+图片+视频
代码生成	Claude Sonnet 4.6 / Kimi K2.7 Code	编码场景专项优化
超长上下文	DeepSeek（1M）/ Claude Opus 4.8（1M）	文档分析、长文本处理
快速集成	DeepSeek / Kimi / Gemini 兼容层	均兼容 OpenAI SDK
生态最丰富	OpenAI	Responses API、MCP、Computer Use 等工具链最完善
中文最佳	DeepSeek / Kimi	国产模型，中文理解更自然
安全合规	Claude	内置多层次内容安全机制

九、总结

本文从 请求参数、响应格式、模型能力、定价、迁移成本 五个维度对比了五大模型平台。核心要点：

DeepSeek、Kimi、Gemini（兼容层） 均可通过 OpenAI SDK 接入，迁移成本较低
OpenAI 已全面转向 GPT-5 系列，参数最丰富（seed、logprobs、parallel_tool_calls、Responses API）
Claude 独立 API 设计，system 提示词和 max_tokens 位置独特；Opus 4.8 已升级至 1M 上下文
Gemini 除原生 API 外，还提供 OpenAI 兼容层，降低了接入门槛
定价上 DeepSeek 仍断层领先；Claude Opus 4.8 和 Gemini 2.5 Flash 定价也已显著下调

选择哪家平台，取决于你的具体需求：成本优先选 DeepSeek，性能优先选 Claude/OpenAI，多模态选 Gemini/Kimi，中文场景选 DeepSeek/Kimi。

📝 参考文档

DeepSeek API 文档

DeepSeek 定价

OpenAI API 文档

OpenAI 定价

Gemini API 文档

Gemini OpenAI 兼容层

Claude API 文档

Claude 模型概览

Kimi API 文档

本文数据采集于 2026 年 6 月，各平台参数和价格可能随时调整，请以官方文档为准。