Open source

不可思议！DeepSeek-R1开源模型超越GPT-4的秘密！

Rifx.Online
Programming , Machine Learning , Open Source
20 Jan, 2025

如果你一直关注AI领域，你就会知道，构建最强大、具备推理能力的模型的竞争一直由OpenAI、Anthropic和Google等大公司主导。但请保持冷静，因为游戏规则刚刚改变。中国AI公司DeepSeek发布了一颗重磅炸弹：DeepSeek-R1，一个完全开源的推理模型，不仅与OpenAI的O1竞争——它的表现让人大吃一惊。最棒的是？它完全在MIT许可证下开源。没错，你没看错。

DeepSeek-R1-Lite-Preview：人工智能推理的新时代

Rifx.Online
Machine Learning , Natural Language Processing , Data Science
20 Jan, 2025

人工智能（AI）在突破界限方面并不陌生，但偶尔会出现一些创新，让我们停下脚步，仔细关注。其中一个创新就是 DeepSeek-R1-Lite-Preview，这是由中国AI实验室 DeepSeek 开发的先进推理AI模型。该模型不仅提升了推理能力的标准，还在基准测试中取得了令人印象深刻的成绩，使行业巨头如OpenAI也感受到了压力。在本文中，我们将更深入地了解De

Sky-T1-32B-预览：开源 LLM 性能优于 OpenAI-o1

Rifx.Online
Programming , Machine Learning , Natural Language Processing
19 Jan, 2025

UC Berkeley的Sky-T1–32B-预览详情所以，首个大型生成性AI发布来了，UC Berkeley开源的LLM Sky-T1–32B在数学和编码基准测试中超越了OpenAI的o1。什么是 Sky-T1–32B-Preview？它是一个 32-亿-参数推理模型，旨在在数学推理和编码任务中表现出色。关键特性 1\

DeepSeek V3：超6710亿参数挑战ChatGPT，如何颠覆AI市场？

Rifx.Online
Natural Language Processing , Machine Learning , Ethics
29 Dec, 2024

Ali Shaker- 中国初创公司DeepSeek凭借其大型语言模型DeepSeek V3在全球AI界引起了广泛关注。该模型拥有6710亿参数，声称能够与OpenAI的GPT-4、Meta的Llama 3.1和Claude 3.5 Sonnet等重量级竞争对手抗衡。更引人注目的是

人类学的 MCP 将让你大开眼界

Rifx.Online
Programming , Technology , Machine Learning
06 Dec, 2024

相信我，这不是点击诱饵，MCP将彻底改变AI交互的方式 AI技术正在快速发展。你可能在等待最新的模型，如GPT-5、Gemini 2或Claude 4，但有一件重要的事情需要知道——今天AI的真正力量不仅仅在于拥有最新的模型。而在于我们如何将这些AI模型与周围的世界连接起来。在于给予它们正确的工具、数据和上下文，以帮助它们更好地理解。这就是Anthropic的***模型上下

Mojo，比 Python 快 90,000 倍，终于开源了！

Rifx.Online
Programming , Machine Learning , Data Science
10 Nov, 2024

2024年3月29日，Modular Inc.宣布开源Mojo的核心组件。 Mojo是一种专门为编写人工智能软件而设计的编程语言，去年八月正式发布。自那时以来，它已经吸引了超过175,000名开发者和50,000个组织。人工智能模型通常使用多种编程语言编写。开发者通常使用Python实现神经网络的最简单部分，因为它易于学习，但相对较慢。其余代码通常用C++编写，虽然速度更快，但学习起来更复

阿里巴巴开源 Qwen：它如何彻底改变人工智能以及如何使用它

Rifx.Online
Programming , Machine Learning , Natural Language Processing
26 Oct, 2024

阿里巴巴最近在人工智能领域引起了轰动，在2024年 Apsara 大会上开源了其 Qwen 2.5 模型。Qwen 拥有超过 100 个模型，涵盖语言、视觉、音频和代码等多种模态，使其成为最全面的开源人工智能解决方案之一。此次发布通过提供多样化应用的工具，赋能开发者，从文本到视频生成到实时问答。阿里巴巴 Qwen 模型的关键特性多模态能力：Qwen 模型处

Google: Gemma 2 9B

Text 2 text

Gemma 2 9B by Google 是一个先进的开源语言模型，在其尺寸类别中设定了效率和性能的新标准。它旨在支持各种任务，使开发者和研究人员能够构建创新应用，同时保持可访问性、安全性和经济性。有关更多详细信息，请参见 [launch announcement](https://blog.google/technology/developers/googl ...

Google 8K context $0.06/M input tokens $0.06/M output tokens

Google: Gemma 2 9B (free)

Text 2 text

Gemma 2 9B by Google 是一个先进的开源语言模型，在其尺寸类别中设定了效率和性能的新标准。该模型旨在支持多种任务，使开发者和研究人员能够构建创新应用，同时保持可访问性、安全性和成本效益。有关更多详细信息，请参阅发布公告。 ...

Rifx.Online 4K context $0 input tokens $0 output tokens

OpenChat 3.5 7B

Text 2 text

OpenChat 7B 是一个开源语言模型库，采用“C-RLFT（条件强化学习微调）”策略进行了微调，该策略受到离线强化学习的启发。它在没有偏好标签的混合质量数据上进行了训练。对于在 Mistral 7B 上微调的 OpenChat，请查看 OpenChat 7B。对于在 Llama 8B 上微调的 Op...

Openchat 8K context $0.055/M input tokens $0.055/M output tokens

OpenChat 3.5 7B (free)

Text 2 text

OpenChat 7B 是一个开源语言模型库，经过“C-RLFT（条件强化学习微调）”的精细调优——这是一种受离线强化学习启发的策略。它是在没有偏好标签的混合质量数据上进行训练的。对于在 Mistral 7B 上微调的 OpenChat，请查看 OpenChat 7B。对于在 Llama 8B 上微调的...

Rifx.Online 8K context $0 input tokens $0 output tokens