Pre training

Qwen2.5：重新定义大型语言模型的效率

Rifx.Online
Programming , Machine Learning , Natural Language Processing
27 Dec, 2024

更智能地扩展和更好地学习与强化学习语言模型的新纪元：介绍 Qwen2.5 基于大型语言模型（LLMs）的突破，Qwen2.5 处于提高效率和先进学习的最前沿。忠于其指导原则——“更聪明地扩展，更好地学习，通过强化学习”——Qwen2.5 被设计用来解决模型性能、与人类偏好的对齐以及成本效益等紧迫问题。无论您是在探索基本的问答功能，还是在推动复杂的

SmolLM2：Qwen2.5 和 Llama 3.2 的最佳替代品

Rifx.Online
Technology , Machine Learning , Data Science
10 Nov, 2024

而且它是完全开放的！ Hugging Face 加大了对 SmolLM 计划的投入。他们发布了 SmolLM2：1.7B、360M 和 135M 模型，训练于 11T 令牌（相比 SmolLM 的 1T）。他们发布了基础版和指导版：Hugging Face Collection: [SmolLM2](https://huggingface.co/collections/