Pre training

Qwen2.5: Redefining Efficiency in Large Language Models

Rifx.Online
Programming , Machine Learning , Natural Language Processing
27 Dec, 2024

Scaling Smarter and Learning Better with Reinforcement Learning A New Era of Language Models: Introducing Qwen2.5 Building on the breakthroughs in large language models (LLMs), **Qwe

SmolLM2: Very Good Alternatives to Qwen2.5 and Llama 3.2

Rifx.Online
Technology , Machine Learning , Data Science
10 Nov, 2024

And it's fully open! Hugging Face has doubled down on their SmolLM initiative. They released SmolLM2: 1.7B, 360M, and 135M models trained on 11T tokens (against 1T for SmolLM). They release