大模型

DeepSeek-R2 开源发布:推理能力对标闭源顶级模型

吴启明2025-06-076 分钟阅读31,200 阅读
DeepSeek-R2 开源发布:推理能力对标闭源顶级模型

开源推理新标杆

DeepSeek 发布了 R2 推理模型,并在多个重要基准测试中展现出与顶级闭源模型相当的性能。更重要的是,该模型完全开源,采用了宽松的 MIT 许可证。

性能对比

  • 数学推理(MATH-500):96.2%,接近 GPT-5 的 97.1%
  • 代码生成(SWE-bench Verified):52.3%,超过 Claude Opus 的 50.8%
  • 科学推理(GPQA Diamond):71.5%,与顶级模型持平

DeepSeek 团队表示,R2 的成功证明了开源社区有能力在推理能力上追赶闭源模型,这对整个 AI 生态的健康发展具有重要意义。

标签:DeepSeek开源推理模型