DeepSeek R1 开源人工智能模型（胜过 OpenAI-o1！）--DeepSeek R1 开源人工智能模型（胜过 OpenAI-o1

Rifx.Online
Programming , Machine Learning , Data Science
24 Jan, 2025

DeepSeek R1 模型作为一种革命性的开源推理 AI，已成为与 OpenAI-o1 等专有解决方案竞争的对手。凭借令人印象深刻的基准测试和经济实惠的价格，它承诺将重新塑造开发人员和研究人员处理 AI 驱动推理任务的方式。让我们深入了解它的能力、技术特性，以及它在竞争激烈的 AI 领域中脱颖而出的原因，以及如何在本地使用它。

什么是 DeepSeek R1？

DeepSeek R1 是一个开源推理模型，旨在超越专有模型，提供可访问性和成本效益。根据 MIT 许可证发布，可以免费用于商业用途。其 API 和聊天接口随时可用，使其成为个人开发者和企业的实用选择。

关键亮点：

开源优势： DeepSeek R1 在 AIME 2024、Math-500 和 SWE-bench 等推理基准测试中击败了闭源对手。

2. 性能提升： 经过强化学习微调，使用最少的标记数据取得了令人印象深刻的结果。

3. 成本优势： 相比于专有模型，它的成本显著更低，使先进的 AI 能力更加普及。

与其他模型的成本比较

DeepSeek R1 的一个显著特点是其成本效益。与 OpenAI 的模型相比，差异令人震惊：

OpenAI o1 模型成本：

1M 输入标记 $15
1M 输出标记 $60

DeepSeek R1 成本：

$0.55 每百万输入令牌
$2 每百万输出令牌

这种价格实惠使其成为预算有限项目的理想选择，而不影响性能。

DeepSeek R1与R1-Zero：了解模型

DeepSeek提供了两个主要变体：

DeepSeek R1-Zero： 基础模型，没有进行微调，DeepSeek-R1-Zero是通过大规模强化学习（RL）训练的模型，没有作为初步步骤的监督微调（SFT），在推理方面表现出色。
DeepSeek R1： 一个经过微调的版本，结合了强化学习，在需要推理和思维链过程的任务中表现优异。

DeepSeek R1 的能力：

自我验证与反思： 提高推理任务的准确性。
思维链处理： 生成连贯的长篇逻辑解释。
训练流程： 提供了一种简化的方法来开发类似的高性能模型。

蒸馏模型版本

为了进一步实现普及化，已发布六个DeepSeek R1的蒸馏版本，包括流行模型的微调版本，如：

这些蒸馏模型利用DeepSeek R1生成的样本，并以极低的计算成本提供卓越的性能。

本地测试和用例

DeepSeek R1 可以使用 vLLM Serve 或 Olama 本地运行，使其成为多种任务的通用工具。您可以轻松使用 vLLM 启动服务：

conda create -n deepseekenv python==3.12
conda activate deepseekenv
pip install vllm
vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 2 --max-model-len 32768 --enforce-eager