
利用 Smolagents、Ollama 和 Deepseek-R1 在 Colab 上构建网络搜索人工智能代理
- Rifx.Online
- Programming , Technology/Web , Generative AI
- 28 Feb, 2025
来源:由 Dall-e 生成
介绍
对于非会员,请点击这里。
在这篇文章中,我们将使用smolagents、ollama和deepseek-R1在Colab笔记本中创建一个搜索网络并收集相关信息的代理,将其保存到Markdown文件中,从而基本上创建您自己的网络研究助手。此外,所有功能都可以在免费的Colab账户上完全使用。
代理的推理模型
让我们开始讨论我们的推理模型。我们使用的是 Deepseek R1-Distill-Gwen-14B——一个基于 Deepseek R1 671B(原始 R1)生成数据训练的 Qwen 14B 的微调版本。其先进的推理能力使我们的代理能够生成结构化输出并快速解决错误。我们选择这个模型是因为它只需要 9 GB 的 VRAM,而我们的 Colab 笔记本提供 16 GB——这是我们助手代理提供简明和必要报告的绝佳配置。
在 Colab 上安装 Ollama
现在我们已经选择了模型,让我们看看如何在 Colab 上使用 Ollama 运行它。这非常简单——我们只需要在 Colab 中运行两行代码来配置 Ollama,并准备下载我们想要的任何模型。首先,让我们安装 colab-xterm,它为我们提供一个终端来安装和运行 Ollama:
source: by author
安装后,在一个单元格中运行 %xterm。这将打开一个终端,显示您需要执行的带注释命令:
source: by author
太好了!现在我们在 Colab 中安装了 Ollama,并且 Deepseek-R1 14B 模型已准备好使用。
Smolagents:构建代理的简单库
在 Autogen 和 Crewai 之后,我们现在有了一个更简单但同样强大的库——smolagents。它的主要优势包括:
- 简单性与灵活性 — Smolagents 保持抽象最小化,同时允许您使用任何 LLM,无论是来自 Hugging Face 的 Hub 还是来自 OpenAI 和 Anthropic 等外部提供商。
- 代码与工具调用代理 — 它支持生成和执行 Python 代码的代理(代码代理)以及发出结构化类似 JSON 的工具调用的代理(工具调用代理)。这使得集成诸如网络搜索、图像生成或自定义工具等功能变得简单。
现在,让我们初始化代理的 Ollama 模型,但首先安装 smolagents。
source: by author
我们的模型现在准备好了,让我们创建一个工具,在报告准备好时保存 markdown 文件。
source: by author
在 smolagents 中,创建一个工具非常简单。我们需要的只是 @tool 装饰器,以及一个定义良好的函数,其中包括 清晰的描述 和 “Args” 输入模式。这个结构帮助 LLM 理解如何有效地使用工具。
使用创建的工具运行代理
现在,让我们使用我们创建的工具来运行我们的代理,看看它是否能够成功使用它。
默认情况下,smolagents 提供了一个内置的 toolbox,可以在初始化时通过参数 add_base_tools=True 添加到您的代理中。这包括:
- DuckDuckGo Web Search — 使用 DuckDuckGo 浏览器进行网页搜索。
- Python Code Interpreter — 在安全环境中执行 LLM 生成的 Python 代码。 (注意:此工具仅在 add_base_tools=True 时添加到 ToolCallingAgent,因为基于代码的代理已经能够本地执行 Python。)
- Transcriber — 基于 Whisper-Turbo 的语音转文本管道,将音频转换为文本。
现在,让我们看看我们的代理在行动中!
source: by author
经过 3 分钟,输出为:
source: by author
代理正在逐步研究并将结果保存在 RTX_5090_Report.md 中。
最终输出是一个 markdown 格式的文件:
NVIDIA GeForce RTX 5090 报告
介绍
NVIDIA GeForce RTX 5090 是迄今为止最强大的消费级 GPU,旨在满足游戏和创意工作的需求。该产品于 2025 年 1 月推出,采用了 Blackwell 架构和 DLSS 4 技术,带来了前沿的功能。
规格
- 架构: Blackwell
- CUDA 核心: 21,760
- 内存: 32GB GDDR7
- 光线追踪核心: 318 TFLOPS
- 张量核心 (AI): 第五代,具有 3,352 AI TOPS
- 内存总线: 512-bit
- 发布日期: 2025年1月30日
定价分析
- 官方价格: $1,999 USD / £1,939 GBP / €2,099 EUR — 零售商价格: 由于需求旺盛和库存有限,价格显著上涨。一些零售商的GPU售价超过 $1,999 USD / £1,939 GBP / €2,099 EUR — 零售商价格: 由于需求旺盛和库存有限,价格显著上涨。一些零售商的GPU售价超过 MSRP 的 $1,400。
市场供应情况
RTX 5090 可通过主要零售商如 Best Buy、Newegg、Amazon 等购买。然而,它的发布遭遇了巨大的需求,导致库存短缺和黄牛问题。
结论
RTX 5090 在 GPU 技术上代表了一个重要的飞跃,为游戏和人工智能应用提供了无与伦比的性能。尽管由于当前市场条件价格较高,但它为未来的 GPU 设定了新的基准。
感谢阅读
- 鼓掌 👏 50 次 如果这让你对人工智能有了新的认识。
- 订阅 以获取更多人工智能见解。
- 在下方评论 你迫切想问的问题 — 我会全部回答!