DeepSeek: R1 Distill Qwen 1.5B
- 128K Context
- 0.18/M Input Tokens
- 0.18/M Output Tokens
- DeepSeek
- Text 2 text
- 07 Feb, 2025
DeepSeek R1 Distill Qwen 1.5B 是一个基于 Qwen 2.5 Math 1.5B 的蒸馏大型语言模型,使用来自 DeepSeek R1 的输出。它是一个非常小且高效的模型,在数学基准测试中超越了 GPT 4o 0513。
其他基准测试结果包括:
- AIME 2024 pass@1: 28.9
- AIME 2024 cons@64: 52.7
- MATH-500 pass@1: 83.9
该模型利用了 DeepSeek R1 输出的微调,使其在性能上与更大前沿模型相媲美。