Type something to search...

Blog Posts

Mistral AI 推出 Ministral 3B 和 8B 模型 另外:Nvidia 推出优于 GPT-4 的 AI 模型

Mistral AI 推出 Ministral 3B 和 8B 模型 另外:Nvidia 推出优于 GPT-4 的 AI 模型

Plus: Nvidia推出的AI模型超越GPT-4 欢迎来到Get The Gist,在这里我们每个工作日分享最新的AI发展动态——新闻、创新和趋势——所有内容都在5分钟内轻松阅读!⏱ 在今天的版本中:Mistral AI推出了用于边缘计算的Ministral 3B和8B模型 Nvidia悄然推出的AI模型超越GPT-4 YouTube向

阅读更多
检索增强生成:方法、最新进展和优化策略

检索增强生成:方法、最新进展和优化策略

⭐ RAG 在知识密集型场景或需要持续更新知识的特定领域应用中尤其有用。最近,RAG 因其在对话代理中的应用而受到广泛关注。 📌 参考研究主要集中在当前的 RAG 方法及其不同组件、最新进展(SOTA)、应用、检索、生成、增强技术的评估上。 随着 RAG 系统从简单到高级再到模块化的演变,每个阶段都是为了应对特定用例的增强而出现的。 ![](https://images.wese

阅读更多
使用 Unsloth 对 LLama 3 进行微调

使用 Unsloth 对 LLama 3 进行微调

在本文中,我将向您展示如何使用 Unsloth 微调 LLM(Meta 的 Llama 3)。我还将提供使用您自己自定义数据集的方法。 注意: Unsloth 是一个加速 LLM 在 NVIDIA GPU 上微调的库(与传统方法相比,内存使用减少 40%)。与 Hugging Face 兼容,支持 Ll

阅读更多
Qwen2.5 1.5b:移动AI的未来?

Qwen2.5 1.5b:移动AI的未来?

本地测试和评估阿里云最新的LLM。使用llama-cpp-python和DIY提示目录。 在第一部分,我们共同探讨了阿里云团队发布的Qwen2.5模型系列的创新。 在生成式AI基准测试中,基准测试现在是主要的oracle:新的LLM的有效性需要通过多个评判。你打破的基准记录越多,你就越优秀。 这是赢得SOTA竞赛的方式。 好吧,我不同意。尽管我们需要里程碑和更好的性

阅读更多
在 LLM 代理框架之间进行选择

在 LLM 代理框架之间进行选择

定制代码代理与主要代理框架之间的权衡 代理正在迎来一个重要时刻。随着多个新框架和新的 投资 的涌入,现代 AI 代理正在克服 [不稳定的起源](https://arxiv.org/html/2405.

阅读更多
LLaVA 简介:一种多模式 AI 模型

LLaVA 简介:一种多模式 AI 模型

LLaVA是一个端到端训练的大型多模态模型,旨在理解和生成基于视觉输入(图像)和文本指令的内容。它结合了视觉编码器和语言模型的能力,以处理和响应多模态输入。 ![](https://images.weserv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1*mjzqL0BHzdPoN-Jjruh52A.pn

阅读更多
Google 发布 Gemma — 轻量级开源模型

Google 发布 Gemma — 轻量级开源模型

在短短一周内,世界见证了两家科技巨头带来的最具突破性的AI进展。OpenAI推出了令人惊叹的AI视频生成器Sora,而谷歌则揭晓了其[Gemini 1.5模型](https://generativeai.pub/google-releases-gemini-1-5-with-1m-context-window-

阅读更多
Llama 3.1 405B——如何免费使用

Llama 3.1 405B——如何免费使用

无需本地安装 Llama 3.1 405B 是Meta于2024年7月发布的最先进的AI模型——但你可以在哪里试用它?** LLama 3.1 有不同的版本,包括参数最多的4050亿模型以及较小的70B和8B模型。 试用70B和8B模型的最简单方法是在Groq上——你可

阅读更多
Claude 3.5 Sonnet V/S GPT-4O:哪一个更好

Claude 3.5 Sonnet V/S GPT-4O:哪一个更好

在2022年11月,OpenAI推出了ChatGPT,这一模型彻底改变了我们搜索和与信息互动的方式。次年3月,由前OpenAI员工创办的美国初创公司“Anthropic”推出了他们自己的AI模型“Claude”。自发布以来,这两家AI公司一直在竞争,以通过其AI模型为客户提供最佳的功能和体验。最近,OpenAI推出了“GPT-4o”,这是一个令人惊叹的模型,能够出色地处理文件、语音和视频数据

阅读更多
o1-preview 与 claude-3.5-sonnet:比较顶级法学硕士

o1-preview 与 claude-3.5-sonnet:比较顶级法学硕士

今天(2024年9月12日),OpenAI 发布了其最新的语言模型 o1-preview。这个先进的模型经过设计,能够在生成响应之前投入更多时间进行处理,使其能够更好地应对复杂任务,并在科学、编码和数学等领域解决具有挑战性的问题。 在这篇博客文章中,我们将深入分析 o1-preview,并将其与之前被认为是最先进模型之一的 Claude 3.5 Sonnet 进行比较。 比较方

阅读更多
Claude 3.5 Sonnet(新):利用计算机控制能力开拓人工智能的未来

Claude 3.5 Sonnet(新):利用计算机控制能力开拓人工智能的未来

Anthropic于2024年10月22日发布了最新的AI模型Claude 3.5 Sonnet。此次发布引入了革命性的计算机控制能力,并在多个基准测试中实现了显著改进,为AI行业设定了新标准。 革命性的计算机控制:新前沿 Claude 3.5 Sonnet 的突出特点是其能够像人类一样与计算机进行交互。这一突破性的能力使得 AI 可以:使用鼠标和键盘输入导航桌面界面

阅读更多
阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴最近在人工智能领域引起了轰动,在2024年 Apsara 大会上开源了其 Qwen 2.5 模型。Qwen 拥有超过 100 个模型,涵盖语言、视觉、音频和代码等多种模态,使其成为最全面的开源人工智能解决方案之一。此次发布通过提供多样化应用的工具,赋能开发者,从文本到视频生成到实时问答。 阿里巴巴 Qwen 模型的关键特性多模态能力:Qwen 模型处

阅读更多
新崛起红星:Qwen2.5来了

新崛起红星:Qwen2.5来了

一起测试新生的阿里云生成式AI Qwen2.5,使用Python和llama-cpp 在没有太多宣传和预期公告的情况下,阿里云于9月19日发布了他们的旗舰模型系列Qwen2.5。 阿里云在Qwen上的革命性旅程再次展示了通过创新的强大领导力。 怎么做的?它们有什么特别之处?我们应该期待什么? 在本文中,我们将探讨新模型并检查其性能。作为后续,在下一篇文章中,我们将使用`l

阅读更多
在软件应用程序中使用 AutoGen 的实用指南

在软件应用程序中使用 AutoGen 的实用指南

更新:虽然这篇文章是在四个月前写的,但 AutoGen 自那时以来变化很大。对于我代码示例中可能过时的内容,我深感歉意。 如果您想了解 AutoGen,可以查看 文档、Colab 笔记本 和 [博客

阅读更多
使用 Ollama、Swarm 和 DuckDuckGo 构建本地 AI 新闻聚合器

使用 Ollama、Swarm 和 DuckDuckGo 构建本地 AI 新闻聚合器

使用OllamaSwarm和DuckDuckGo构建本地AI驱动的新闻聚合器 在当今快节奏的世界中,跟上特定领域最新新闻的步伐可能会很具挑战性。如果我们能够利用生成式AI和代理的力量,创建一个完全在本地机器上运行的个性化新闻聚合器呢?在本文中,我们将探讨如何使用Ollama的Llama 3.2模型、Swarm进行代理编排,以及DuckDuckGo进行网络搜索来构

阅读更多
Tags