Type something to search...

Open source

不可思议!DeepSeek-R1开源模型超越GPT-4的秘密!

不可思议!DeepSeek-R1开源模型超越GPT-4的秘密!

如果你一直关注AI领域,你就会知道,构建最强大、具备推理能力的模型的竞争一直由OpenAI、Anthropic和Google等大公司主导。但请保持冷静,因为游戏规则刚刚改变。中国AI公司DeepSeek发布了一颗重磅炸弹:DeepSeek-R1,一个完全开源的推理模型,不仅与OpenAI的O1竞争——它的表现让人大吃一惊。最棒的是?它完全在MIT许可证下开源。没错,你没看错。

阅读更多
DeepSeek-R1-Lite-Preview:人工智能推理的新时代

DeepSeek-R1-Lite-Preview:人工智能推理的新时代

人工智能(AI)在突破界限方面并不陌生,但偶尔会出现一些创新,让我们停下脚步,仔细关注。其中一个创新就是 DeepSeek-R1-Lite-Preview,这是由中国AI实验室 DeepSeek 开发的先进推理AI模型。该模型不仅提升了推理能力的标准,还在基准测试中取得了令人印象深刻的成绩,使行业巨头如OpenAI也感受到了压力。 在本文中,我们将更深入地了解De

阅读更多
Sky-T1-32B-预览:开源 LLM 性能优于 OpenAI-o1

Sky-T1-32B-预览:开源 LLM 性能优于 OpenAI-o1

UC Berkeley的Sky-T1–32B-预览详情 所以,首个大型生成性AI发布来了,UC Berkeley开源的LLM Sky-T1–32B在数学和编码基准测试中超越了OpenAI的o1。 什么是 Sky-T1–32B-Preview? 它是一个 32-亿-参数推理模型,旨在在数学推理和编码任务中表现出色。 关键特性 1\

阅读更多
DeepSeek V3:超6710亿参数挑战ChatGPT,如何颠覆AI市场?

DeepSeek V3:超6710亿参数挑战ChatGPT,如何颠覆AI市场?

Ali Shaker- 中国初创公司DeepSeek凭借其大型语言模型DeepSeek V3在全球AI界引起了广泛关注。该模型拥有6710亿参数,声称能够与OpenAI的GPT-4、Meta的Llama 3.1和Claude 3.5 Sonnet等重量级竞争对手抗衡。更引人注目的是

阅读更多
人类学的 MCP 将让你大开眼界

人类学的 MCP 将让你大开眼界

相信我,这不是点击诱饵,MCP将彻底改变AI交互的方式 AI技术正在快速发展。 你可能在等待最新的模型,如GPT-5、Gemini 2或Claude 4,但有一件重要的事情需要知道——今天AI的真正力量不仅仅在于拥有最新的模型。 而在于我们如何将这些AI模型与周围的世界连接起来。 在于给予它们正确的工具、数据和上下文,以帮助它们更好地理解。 这就是Anthropic的***模型上下

阅读更多
Mojo,比 Python 快 90,000 倍,终于开源了!

Mojo,比 Python 快 90,000 倍,终于开源了!

2024年3月29日,Modular Inc.宣布开源Mojo的核心组件。 Mojo是一种专门为编写人工智能软件而设计的编程语言,去年八月正式发布。自那时以来,它已经吸引了超过175,000名开发者和50,000个组织。 人工智能模型通常使用多种编程语言编写。开发者通常使用Python实现神经网络的最简单部分,因为它易于学习,但相对较慢。其余代码通常用C++编写,虽然速度更快,但学习起来更复

阅读更多
阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴最近在人工智能领域引起了轰动,在2024年 Apsara 大会上开源了其 Qwen 2.5 模型。Qwen 拥有超过 100 个模型,涵盖语言、视觉、音频和代码等多种模态,使其成为最全面的开源人工智能解决方案之一。此次发布通过提供多样化应用的工具,赋能开发者,从文本到视频生成到实时问答。 阿里巴巴 Qwen 模型的关键特性多模态能力:Qwen 模型处

阅读更多

Gemma 2 9B by Google 是一个先进的开源语言模型,在其尺寸类别中设定了效率和性能的新标准。 它旨在支持各种任务,使开发者和研究人员能够构建创新应用,同时保持可访问性、安全性和经济性。 有关更多详细信息,请参见 [launch announcement](https://blog.google/technology/developers/googl ...

Google: Gemma 2 9B
Google
8K context $0.06/M input tokens $0.06/M output tokens

Gemma 2 9B by Google 是一个先进的开源语言模型,在其尺寸类别中设定了效率和性能的新标准。 该模型旨在支持多种任务,使开发者和研究人员能够构建创新应用,同时保持可访问性、安全性和成本效益。 有关更多详细信息,请参阅 发布公告。 ...

Google: Gemma 2 9B (free)
Rifx.Online
4K context $0 input tokens $0 output tokens

OpenChat 7B 是一个开源语言模型库,采用“C-RLFT(条件强化学习微调)”策略进行了微调,该策略受到离线强化学习的启发。它在没有偏好标签的混合质量数据上进行了训练。对于在 Mistral 7B 上微调的 OpenChat,请查看 OpenChat 7B。 对于在 Llama 8B 上微调的 Op...

OpenChat 3.5 7B
Openchat
8K context $0.055/M input tokens $0.055/M output tokens

OpenChat 7B 是一个开源语言模型库,经过“C-RLFT(条件强化学习微调)”的精细调优——这是一种受离线强化学习启发的策略。它是在没有偏好标签的混合质量数据上进行训练的。对于在 Mistral 7B 上微调的 OpenChat,请查看 OpenChat 7B。 对于在 Llama 8B 上微调的...

OpenChat 3.5 7B (free)
Rifx.Online
8K context $0 input tokens $0 output tokens