Type something to search...

Pre training

Qwen2.5:重新定义大型语言模型的效率

Qwen2.5:重新定义大型语言模型的效率

更智能地扩展和更好地学习与强化学习 语言模型的新纪元:介绍 Qwen2.5 基于大型语言模型(LLMs)的突破,Qwen2.5 处于提高效率和先进学习的最前沿。忠于其指导原则——“更聪明地扩展,更好地学习,通过强化学习”——Qwen2.5 被设计用来解决模型性能、与人类偏好的对齐以及成本效益等紧迫问题。 无论您是在探索基本的问答功能,还是在推动复杂的

阅读更多
SmolLM2:Qwen2.5 和 Llama 3.2 的最佳替代品

SmolLM2:Qwen2.5 和 Llama 3.2 的最佳替代品

而且它是完全开放的! Hugging Face 加大了对 SmolLM 计划的投入。 他们发布了 SmolLM2:1.7B、360M 和 135M 模型,训练于 11T 令牌(相比 SmolLM 的 1T)。他们发布了基础版和指导版:Hugging Face Collection: [SmolLM2](https://huggingface.co/collections/

阅读更多