🚀 2026年4月正式发布

DeepSeek V4

新一代旗舰大语言模型,以 1M 超长上下文为标配,兼具顶尖推理能力与极致性价比,全面开源。

1M
上下文长度
1.6T
V4-Pro 总参数量
49B
V4-Pro 激活参数量
384K
最大输出长度
🔭 概览

DeepSeek V4 是 DeepSeek 团队在 2026 年 4 月发布的新一代大语言模型,包含 Pro 和 Flash 两个版本,在推理、编程、世界知识等多项能力上达到世界领先水平。

🧠

世界级推理能力

在数学、STEM、编程等推理基准测试中全面领先所有开源模型,比肩顶级闭源模型。

数学推理STEM编程
🤖

增强 Agent 能力

在 Agentic Coding 基准测试中达到开源 SOTA(最优水平),无缝集成 Claude Code、OpenClaw、OpenCode 等主流 AI Agent。

Agentic Coding工具调用
📚

丰富世界知识

世界知识能力领先所有当前开源模型,仅次于 Gemini 3.1 Pro。

知识问答长文理解
📏

1M 超长上下文

以 1M token 上下文长度作为官方默认配置,采用创新的 Tokenwise 压缩 + DSA(DeepSeek Sparse Attention)架构,显著降低计算与内存成本。

DSA 注意力长文本
💡

双模式:思考 / 非思考

支持 Thinking Mode(深度思考链)和 Non-Thinking Mode(快速响应),可根据场景灵活切换。

CoT快速响应
🔓

完全开源

权重和技术报告均已开源在 HuggingFace,推动 AI 社区的开放与进步。

Open SourceHuggingFace
⚖️ 模型对比

DeepSeek V4 提供两个版本,兼顾极致性能与高效经济。

对比项 DeepSeek-V4-Flash DeepSeek-V4-Pro
DeepSeek-V4-Flash 快速·经济·高效 ⚡ 闪电版 默认选择,兼顾速度与质量 🏆 专业版 极致性能,顶级推理
总参数量 284B 1.6T
激活参数量 13B 49B
上下文长度 1M 1M
最大输出长度 384K 384K
思考模式 支持(默认启用) 支持(默认启用)
JSON 输出
工具调用 (Tool Calls)
上下文缓存 (KV Cache)
Chat Prefix 补全 (Beta)
FIM 补全 (Beta) 仅限非思考模式 仅限非思考模式
Strict 模式 (Beta)
API 格式兼容 OpenAI + Anthropic OpenAI + Anthropic
推理能力 接近 V4-Pro 世界顶级
Agent 任务 (简单) 与 V4-Pro 持平 顶级
核心功能详解

DeepSeek V4 提供丰富的 API 功能,覆盖从简单对话到复杂 Agent 的各类场景。

🧩 工具调用 (Tool Calls)

模型可以调用外部工具来增强自身能力,支持思考模式和非思考模式下的工具调用。在思考模式下,模型可以进行多轮推理与工具调用,持续提升回答质量。

📝 JSON 输出 (JSON Output)

通过 response_format: { type: 'json_object' } 确保模型始终输出合法 JSON 字符串,便于结构化的数据解析与下游处理。

💾 上下文缓存 (Context Caching)

默认对所有用户启用,无需修改代码。基于磁盘缓存技术,当后续请求与之前请求存在重叠前缀时,重叠部分自动从缓存读取(即"缓存命中"),成本仅为非命中的 1/50。

✂️ Chat Prefix 补全 (Beta)

在 Chat Completion API 中,用户可提供 assistant 前缀消息,让模型基于该前缀自动续写。例如设置 assistant 前缀为 ```python\n 强制输出 Python 代码。

🔧 FIM 补全 (Beta)

Fill In the Middle 功能,支持提供前缀和后缀(可选),模型自动补全中间内容。常用于代码补全场景,已与 Continue.dev VSCode 插件集成。

🔄 多轮对话 (Multi-round Conversation)

完整支持多轮对话上下文拼接。在思考模式下,不含工具调用的历史轮次无需传递 CoT 内容;含工具调用的轮次则必须完整传递 reasoning_content。

🤝 Agent 集成

DeepSeek V4 已与以下主流 AI Agent 深度集成:

🤔 思考模式详解

思考模式(Thinking Mode)是 DeepSeek V4 的核心能力,模型在输出最终答案前先生成思维链推理,显著提升回答准确性。

参数 说明
思考模式开关 {"thinking": {"type": "enabled/disabled"}}(默认启用)
推理努力度 {"reasoning_effort": "high/max"}(OpenAI 格式)
{"output_config": {"effort": "high/max"}}(Anthropic 格式)
默认 high,复杂 agent 请求自动设为 max
不受支持的参数 temperature、top_p、presence_penalty、frequency_penalty
(传入不会报错但无效果)
CoT 输出位置 通过 reasoning_content 字段返回,与 content 同级

使用 OpenAI SDK 时,需将 thinking 参数放在 extra_body 中:

# thinking 参数通过 extra_body 传递 response = client.chat.completions.create( model="deepseek-v4-pro", messages=messages, reasoning_effort="high", extra_body={"thinking": {"type": "enabled"}} )
💰 定价

价格单位为每 1M tokens。V4-Pro 当前享受 75% 折扣,持续至 2026/05/31 15:59 UTC。

🏆 DeepSeek-V4-Pro

$1.74 / 1M 输入
  • 输入(缓存命中)$0.0145
  • 输入(缓存未命中)$1.74
  • 输出 $3.48
  • 1.6T 总参数 / 49B 激活
  • 1M 上下文 / 384K 最大输出
顶级性能75% 折扣中
🚀 快速开始

兼容 OpenAI / Anthropic API 格式,只需修改 base_url 和 model 名称即可快速接入。

📋 API 基本信息

参数
Base URL (OpenAI 格式)https://api.deepseek.com
Base URL (Anthropic 格式)https://api.deepseek.com/anthropic
Model (Flash)deepseek-v4-flash
Model (Pro)deepseek-v4-pro
API Key前往 platform.deepseek.com 申请

🐍 Python 示例

# pip install openai from openai import OpenAI client = OpenAI( api_key="<your-api-key>", base_url="https://api.deepseek.com" ) response = client.chat.completions.create( model="deepseek-v4-pro", messages=[ {"role": "system", "content": "You are a helpful assistant"}, {"role": "user", "content": "Hello!"} ], reasoning_effort="high", extra_body={"thinking": {"type": "enabled"}}, stream=False ) print(response.choices[0].message.content)

🌐 cURL 示例

curl https://api.deepseek.com/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer ${DEEPSEEK_API_KEY}" \ -d '{ "model": "deepseek-v4-pro", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "Hello!"} ], "thinking": {"type": "enabled"}, "reasoning_effort": "high", "stream": false }'

⚠️ 兼容性提醒

旧模型名称 deepseek-chatdeepseek-reasoner 将在 2026 年 7 月 24 日 后彻底弃用,请尽快迁移至 deepseek-v4-flash(deepseek-chat 对应 Flash 非思考模式,deepseek-reasoner 对应 Flash 思考模式)。

🔗 相关链接
📖 API 文档 🎯 DeepSeek Platform 🤗 HuggingFace 权重 💬 DeepSeek Chat