Deepseek

不可思议！DeepSeek-R1开源模型超越GPT-4的秘密！

Rifx.Online
Programming , Machine Learning , Open Source
20 Jan, 2025

如果你一直关注AI领域，你就会知道，构建最强大、具备推理能力的模型的竞争一直由OpenAI、Anthropic和Google等大公司主导。但请保持冷静，因为游戏规则刚刚改变。中国AI公司DeepSeek发布了一颗重磅炸弹：DeepSeek-R1，一个完全开源的推理模型，不仅与OpenAI的O1竞争——它的表现让人大吃一惊。最棒的是？它完全在MIT许可证下开源。没错，你没看错。

DeepSeek R1

Text 2 text

DeepSeek-R1 来了！ ⚡ 性能与 OpenAI-o1 相当 📖 完全开源的模型和技术报告 🏆 MIT 许可证：自由提炼和商业化！ ...

DeepSeek 62.5K context $0.55/M input tokens $2.19/M output tokens

Smolagents + Web Scraper + DeepSeek V3 Python = 强大的人工智能研究代理

Rifx.Online
Programming , Natural Language Processing , Chatbots
19 Jan, 2025

在这段视频中，我将快速演示如何使用 Smolagents、Web Scraper 和 DeepSeek V3 创建一个多代理聊天机器人，为您的业务或个人使用提供强大的代理聊天机器人。如果您关注 AI 社区，您可能已经注意到许多关于 Nvidia 的病毒视频，其中宣布的 AI 代理价值十亿美元，或者您可能听说过 Zark 说我们明年不会招聘中级工程师。我问自己，这怎么会发生？当我开

Bolt DIY + Deepseek V3 + Gemini 2.0：免费人工智能编码器

Rifx.Online
Programming , Technology/Web , Generative AI
09 Jan, 2025

嘿，你听说过 Bolt DIY 吗？它超级酷，我敢打赌你会喜欢它。想象一下，在你的浏览器中有一个智能 AI 助手，可以帮助你编写全栈应用程序。最棒的是？它是免费的，灵活性超高。让我来解释一下它是如何工作的。什么是 Bolt DIY？所以，Bolt DIY 是一个开源工具（它以前被称为 oTToDev，如果你听说过的话）。它允许你直接在浏览器中构建全栈应用

探索 DeepSeek 第 3 版：技术概览

Rifx.Online
Programming , Machine Learning , Natural Language Processing
09 Jan, 2025

DeepSeek 版本 3 的发布在 AI 社区引发了相当大的兴奋，得益于其卓越的能力和成本效益。作为一个在中国开发的先进开放权重大型语言模型 (LLM)，它利用专家混合 (MoE) 架构来优化性能，在处理过程中仅激活其 6710 亿参数中的 370 亿。多头潜在注意力 (MLA)、FP8 混合精度和多令牌预测等创新进一步提升了其效率和有效性。DeepSeek V3 在 MMLU-Pro、M

DeepSeek V3

Text 2 text

# New # Hot

1. 介绍我们推出了 DeepSeek-V3，这是一款强大的混合专家 (MoE) 语言模型，拥有 671B 的总参数，其中每个令牌激活 37B。为了实现高效推理和具有成本效益的训练，DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构，这些架构在 DeepSeek-V2 中得到了充分验证。此外，DeepSeek-V3 首创了一种无辅助损失的 ...

DeepSeek 62.5K context $0.14/M input tokens $0.28/M output tokens

DeepSeek V3：超越竞争对手的开源大语言模型技术解析

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
27 Dec, 2024

优于 Claude 3.5 Sonnet、GPT-4o、Llama3.1 405B 年末将至，刚刚，中国的 DeepSeek 发布了其开源模型 DeepSeek-v3，该模型在性能上超越了所有主要竞争者，包括 Claude3.5 Sonnet、GPT-4o、Qwen2.5 Coder 等等。该模型的表现如同怪兽，显然，我们可以说 DeepSeek-V3 是迄今