Type something to search...

Programming

不可思议!DeepSeek-R1开源模型超越GPT-4的秘密!

不可思议!DeepSeek-R1开源模型超越GPT-4的秘密!

如果你一直关注AI领域,你就会知道,构建最强大、具备推理能力的模型的竞争一直由OpenAI、Anthropic和Google等大公司主导。但请保持冷静,因为游戏规则刚刚改变。中国AI公司DeepSeek发布了一颗重磅炸弹:DeepSeek-R1,一个完全开源的推理模型,不仅与OpenAI的O1竞争——它的表现让人大吃一惊。最棒的是?它完全在MIT许可证下开源。没错,你没看错。

阅读更多
AI自动化时代来临!如何将SEO工作流提升至前所未有的效率?

AI自动化时代来临!如何将SEO工作流提升至前所未有的效率?

利用AI自动化10个创收的SEO工作流程 搜索引擎优化(SEO)已经从一种营销策略演变为一种基本的商业必要性。 然而,作为一个在网页开发和数据科学领域工作多年的从业者,我亲眼目睹了传统SEO的复杂与繁琐。 在手动任务上花费的无数小时让我开始思考:我们真的可以利用AI来彻底改变这个过程吗? SEO工作负载的现实 每个数字营销人员都知道这个流程。你开始一天的工作时进行关键

阅读更多
如何用Cursor颠覆你的iOS开发之旅

如何用Cursor颠覆你的iOS开发之旅

最近,关于 AI 的讨论和热议很多,关于它是否能改善你的开发工作流程。我想谈谈 AI 及其在 Cursor 中的实现是如何显著提高我的速度和效率的。 简而言之,Cursor 是 VSCode 的一个分支,内置了许多代码编辑的 AI 辅助功能。如果你在 VSCode 中使用过 Copilot,你可能知道我在说什么。嗯,想象一下 Copilot

阅读更多
使用代理为 NPC 注入活力 | 作者:MichaelT Shomsky | 2024年12月 | Medium

使用代理为 NPC 注入活力 | 作者:MichaelT Shomsky | 2024年12月 | Medium

大纲模拟2D社会 创建一个2D俯视视角的平台游戏 设置具有个人历史的非玩家角色 开始一个框架,以允许NPC在2D可玩空间中自我行为 Github仓库 结果/结论模拟二维社会 模拟世界对我来说非常重要,以至于在我本科时,我为一个物理小组模拟了聚合物,并为我的导师小组编写了自由空间中的光传播代码。这种“想要模拟”的愿望无疑受到我荣誉工程课程的指导;因

阅读更多
使用 Autogen 0.4 构建我自己的概念验证代理

使用 Autogen 0.4 构建我自己的概念验证代理

Autogen 0.4 — 使用代理创建和执行 Python 代码 我的目标是看看我是否可以让代理团队完成我的一些工作,并且我可以将工作委托给代理。目前这只是一个实验。需要更多的工作来创建一个可在生产规模使用的稳定版本。 概述创建一个由代理执行各种任务的协调 首先创建一个可以由代理执行的 Python 脚本 然后执行脚本并存储输出 基于之前的输出创建预测

阅读更多
《如何用CrewAI让NPC活灵活现?惊爆游戏体验的秘密!》

《如何用CrewAI让NPC活灵活现?惊爆游戏体验的秘密!》

大纲使用 CrewAI 过滤对话并允许 NPC 选择任务 CrewAI 代理 游戏代码和数据文件 Github 仓库 结果/结论背景 之前我在我的文章 使用智能体为NPC注入生命 中讨论了我对模拟二维社

阅读更多
使用 CrewAI 自动分析 CSV

使用 CrewAI 自动分析 CSV

在本博客中,我们将探讨如何使用CrewAI自动化分析CSV数据集的过程。我们将构建一个工作流程,其中包括用于数据集上下文推断、数据清理、可视化和报告的代理,并最终形成一个精美的Markdown报告。 1. 初始化环境 我们首先导入必要的库,并为工作流程初始化工具和环境。 import os import pandas as pd import char

阅读更多
构建更智能的 API:CrewAI 与 FastAPI 集成指南

构建更智能的 API:CrewAI 与 FastAPI 集成指南

目录 · 1. 引言 ∘ 客户支持代理 ∘ 个人财务顾问 ∘ 医疗助手 ∘ 学习伴侣 ∘ 项目管理助手 ∘ 创意合作伙伴 ∘ 智能家居管理器 ∘ 网络安全助手· 2. 搭建基础· 3. 理解 CrewAI ∘ 1. AI 代理 ∘ 2. 工具 ∘ 3. 过程 ∘ 4. 任务· 4. 使用 CrewAI 设置 Fast API· 结论· 了解更多 1. 引言 在2025

阅读更多
使用 CrewAI 为 NPC 注入生命--初步对话分析

使用 CrewAI 为 NPC 注入生命--初步对话分析

对话分析使用输出来自:使用代理通过 CrewAI 为 NPC 赋予生命 分析模拟1:软件工程师、计算机科学家、计算机工程师的群体 结论 支持分析方法提取的特征 拆

阅读更多
代理混合搜索如何创建更智能的 RAG 应用程序

代理混合搜索如何创建更智能的 RAG 应用程序

By Ryan Michael 如果您正在构建一个 [retrieval-augmented generation (RAG)](https://www.datastax.com/guides/what-is-retrieval-augmented-generation?utm

阅读更多
利用人工智能代理团队进行负责任的软件开发

利用人工智能代理团队进行负责任的软件开发

软件开发长期以来依赖于手动操作和孤立的工具链来构建产品。我们逐渐引入自动化来处理持续集成 (CI) 流程中的重复任务,并使用像 ReSharper 和 CodeRush 这样的代码生成工具来加速编码中的重复任务。然而,随着 AI 的发展,我们可以获得工具来帮助从提示中创建小型 POC,现在我们可以想象一个未来,在这个未来中,“自主 AI” 系统将在我们的软件开发生命周期 (SDLC) 中

阅读更多
探索 GitHub Copilot 工作区:改变开发游戏规则的早期见解

探索 GitHub Copilot 工作区:改变开发游戏规则的早期见解

(免责声明:本文撰写于 GitHub Copilot Workspace 成为主流之前。发布时,Copilot Workspace 处于技术预览阶段,已上线大约三周。) 当 GitHub 在 2024 年 10 月的 GitHub Universe 事件中宣布 “GitHub Copilot Workspace” 时,我不禁将其视为改善 IDE 中开发者体验的下一步

阅读更多
企业就绪的 Java 和 Spring Boot 人工智能代理:综合指南

企业就绪的 Java 和 Spring Boot 人工智能代理:综合指南

最新一波 AI 代理——包括 Auto-GPT、BabyAGI、AgentGPT、Jarvis (HuggingGPT) 以及 LangChain 等框架——展现了在规模化自动化和决策制定方面的巨大潜力。然而,这些解决方案大多以 Python 为中心,使得企业 Java 开发者渴望寻找同样 强大、可扩展 和 实时 能力的代理。本文详细介绍了如何将基

阅读更多
开发人员 2025 年人工智能入门路线图

开发人员 2025 年人工智能入门路线图

在我上一篇文章中,我写了关于初学者学习 AI 的路径,试图揭开其工具和日常任务应用的神秘面纱。 这次,我们将大幅度转向。 想象一下,完全独立构建、部署甚至货币化 SaaS 应用程序,但你不知道从哪里开始。本文主要面向寻找指南或课程的初级开发者,将介绍一些关键概念、工具和策略,帮助你入门。 和往常一样,我将文章组织成几个大类别和主题,这些内容并不需要按顺序阅读,所以如果你已经熟悉某些

阅读更多
10 个强大的 Perplexity AI 提示,让您的营销任务自动化

10 个强大的 Perplexity AI 提示,让您的营销任务自动化

在当今快速变化的数字世界中,营销人员总是在寻找更智能的方法来简化他们的工作。想象一下,有一个个人助理可以为您创建受众档案,建议营销策略,甚至为您撰写广告文案。这听起来像是一个梦想? 多亏了像 Perplexity 这样的 AI 工具,这个梦想现在成为现实。通过正确的提示,您可以将 AI 转变为您的 个人营销助理。在本文中,我将分享 10 个强大的提示,帮助您自动

阅读更多
Sky-T1-32B-预览:开源 LLM 性能优于 OpenAI-o1

Sky-T1-32B-预览:开源 LLM 性能优于 OpenAI-o1

UC Berkeley的Sky-T1–32B-预览详情 所以,首个大型生成性AI发布来了,UC Berkeley开源的LLM Sky-T1–32B在数学和编码基准测试中超越了OpenAI的o1。 什么是 Sky-T1–32B-Preview? 它是一个 32-亿-参数推理模型,旨在在数学推理和编码任务中表现出色。 关键特性 1\

阅读更多
LangGraph:调用代理的工具

LangGraph:调用代理的工具

本文假设读者对 LangGraph / 多代理设计有基本的了解。在此基础上,让我们尝试理解实现工具调用代理的基本原理。 对生成式 AI 感兴趣的人应该对函数调用/工具调用等概念有所了解。这个概念非常简单,模型可以借助一个或多个工具根据用户的提示生成推理。工具就是作为催化剂的函数,帮助模型提供所需的信息以便进行更好的推理。此外,工具可以是内置工具或自定义定义的工具。 在我寻找实现多代理

阅读更多
Cline v3.1:Cursor 和 Windsurf 的高性价比替代品

Cline v3.1:Cursor 和 Windsurf 的高性价比替代品

如果你在寻找一种可以替代像 Cursor 或 Windsurf 这样的 AI 编码器的工具,因为它们价格昂贵且需要下载软件。 那么在这篇文章中,让我们讨论一些可能解决我们问题的东西。 我说的是…… Cline v3.1 这不仅仅是另一个工具;它是一个改变游戏规则的工具,将 Visual Studio Code (VS Code) 转变为一个完全自主的 AI 编码代理——免费!

阅读更多
💸 利用人工智能每分钟赚 5 美元:懒人轻松赚钱指南 💻

💸 利用人工智能每分钟赚 5 美元:懒人轻松赚钱指南 💻

轻松收入:AI如何让“悠闲”一代的生活更轻松 🦥 辛苦工作的时代已经过去。如今,懒人(没错,你没听错)正在利用数字革命赚取收益。如果你曾梦想在不费吹灰之力的情况下赚钱,人工智能(AI)就是你的黄金票据。 不需要华丽的学位,不需要10小时的工作日,绝对没有压力。只需聪明、简单的步骤,就能将你的沙发变成指挥中心。🛋️✨ 为什么懒惰是新的聪明 🤓 面对现实吧——我们中的

阅读更多
如何利用交互式画布构建实时双子座 2.0 学习助手

如何利用交互式画布构建实时双子座 2.0 学习助手

Gemini 开发教程 V5 在本教程中,我们将继续使用 Gemini 2.0 及其多模态 Live API 构建迷人的实时聊天应用程序。这次我们将基于绘图画布构建一个具有实时语音和文本交互的学习助手。 您可能已经看过 OpenAI 的旧视频 https://youtu.be/_nSmkyDNulk,演示了 got-4o 如何通过提出引导性问题和提供提示来帮助学生在 Kh

阅读更多
Smolagents + Web Scraper + DeepSeek V3 Python = 强大的人工智能研究代理

Smolagents + Web Scraper + DeepSeek V3 Python = 强大的人工智能研究代理

在这段视频中,我将快速演示如何使用 Smolagents、Web Scraper 和 DeepSeek V3 创建一个多代理聊天机器人,为您的业务或个人使用提供强大的代理聊天机器人。 如果您关注 AI 社区,您可能已经注意到许多关于 Nvidia 的病毒视频,其中宣布的 AI 代理价值十亿美元,或者您可能听说过 Zark 说我们明年不会招聘中级工程师。 我问自己,这怎么会发生?当我开

阅读更多
在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能(AI)的快速发展改变了企业的运作方式,使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计,AI工具帮助专业人士节省时间,提高生产力,专注于创造力。以下是按功能分类的100个AI工具的全面列表,以及它们在现实世界中的使用实例。 1. 研究工具 研究可能耗时,但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

阅读更多
2025 年十大企业技术趋势:平台工程和人工智能代理引领潮流...

2025 年十大企业技术趋势:平台工程和人工智能代理引领潮流...

在预测2025年十大最重要的企业软件技术时,有三个关键要求:它需要真实: 只有在生产环境中展示出其价值的技术才被视为“真实”,并将被纳入此列表。 它需要可访问: 一项技术要成为趋势,必须能够被广泛的企业所接触。仅被少数大型组织利用的技术不符合条件。 它需要有强大的商业影响: 顶尖技术趋势需要在商业层面上产生影响。这通常意味着提升人类生产力、应

阅读更多
为什么人工智能代理是好软件

为什么人工智能代理是好软件

为什么(设计良好的)自主系统能如此有效 大约一个月前,我写了以下关于自主 AI 如何能够促进 AI 系统更好软件设计原则的文章。 这篇文章将更深入地探讨和扩展我在那篇文章中讨论的想法。我想这将是结束我们关

阅读更多
模块化人工智能中的代理协调:设计不断发展的系统

模块化人工智能中的代理协调:设计不断发展的系统

虽然头条新闻聚焦于越来越大的语言模型和计算突破,但一种更为安静的演变正在塑造我们构建 AI 系统的方式。 这一转变并非关于规模——而是关于交响乐。 传统的单体 AI 架构,尽管无疑强大,但正面临实际限制。这些 AI 系统旨在在单一模型中处理多样化任务,但在面对真实企业环境的复杂性时,往往会出现问题。随着组织在多个领域和工作流程中部署 AI,单体系统的挑战变得显而易见:僵化的架构抵制修

阅读更多
扎克伯格预测:到 2025 年,人工智能将像工程师一样编码

扎克伯格预测:到 2025 年,人工智能将像工程师一样编码

在技术以惊人速度发展的时代,Meta的创始人马克·扎克伯格做出了一个大胆的预测:到2025年,人工智能将像中级工程师一样进行编码。这一声明在科技巨头和初创企业的走廊中回响,描绘了一个未来的图景,在这个图景中,人工智能不仅仅是开发者工具箱中的一个工具,而是工程团队的全职成员。 AI在编码中的曙光 设想一个世界,在这个世界里,编码的琐碎任务由一个与普通中级工程师同样出色的AI系统来

阅读更多
6 个优秀到让人觉得违法的人工智能代理

6 个优秀到让人觉得违法的人工智能代理

AI 代理是未来,因为它们可以用 100% 的准确性和快速的速度 替代所有的手动工作。 它们甚至在复杂任务上也在不断进步,比如 编码应用程序、市场营销、制作视频和其他创意工作。 如果你现在不使用 AI 代理,你可能会落后。记住这句话: AI 不会取代你,使用 AI 的人会。 这就是为什么我带来了一些 AI 代理,它们将帮助你成为你所在行业或当前工作的 前 1%

阅读更多
为结构化和非结构化数据构建图形 RAG。

为结构化和非结构化数据构建图形 RAG。

RAG 架构迄今为止是解决 LLM 缺乏上下文化的最适应和复杂的解决方案。通过 RAG,几乎不需要微调,就在很大程度上解决了使用未训练知识库的 LLM 所面临的问题。 尽管向量 RAG 可以建立上下文化,但其能力是有限的。在复杂的关系和高度互联的数据中,向量 RAG 的召回率并不令人印象深刻。其主要原因之一是构成知识库的简单向量嵌入,仅考虑几何接近性。 另一方面,图形天生结构化,以捕

阅读更多
使用 Autogen 进行代理人工智能金融分析:比特币和特斯拉哪个更好?

使用 Autogen 进行代理人工智能金融分析:比特币和特斯拉哪个更好?

你是否曾经想过,NVidia 和特斯拉,哪个投资更好?但是如果你懒得自己去分析,或者甚至不知道该如何开始呢? 这是个严肃的问题,我知道。如果我们能让 ChatGPT 来完成这个任务,那该多好,但如果你已经尝试过——你就知道它并不擅长这方面。你可以让它制定计划,但让它在多个步骤中坚持执行就很难。而且它在会计方面也不太擅长,所以分析财务数据并不是它的强项。有没有办法解决这个问题,还是说没有

阅读更多
Swark 简介:从代码自动生成架构图

Swark 简介:从代码自动生成架构图

软件架构很难做到正确。团队之间的脱节、不清晰的图表以及耗时的流程常常导致挫折和次优的设计决策。随着工程团队采用去中心化的协作架构方法,风险变得更高。 在我之前的文章 “软件架构很难” 中,我深入探讨了这些挑战,强调了困扰许多团队的沟通和图表标准中的关

阅读更多
使用自定义工具构建和服务 RAG 代理:完整指南

使用自定义工具构建和服务 RAG 代理:完整指南

目标 本文的目标是演示如何使用 LangGraph 和 LangChain 创建一个大型语言模型(LLM)代理,该代理将在一组文档上执行检索增强生成(RAG)。此外,我们将探讨如何构建一个工具,以便进行 API 调用,从而使 LLM 能够从外部来源获取实时知识。最后,我们将使用 Flask API(FastAPI)在本地提供此代理,并使用本地 PostgreSQL 数据库服务器存

阅读更多
使用哪种人工智能代理框架?LangChain?AutoGen?9 种常用框架说明!

使用哪种人工智能代理框架?LangChain?AutoGen?9 种常用框架说明!

开发 AI 代理涉及选择合适的框架,以满足项目的需求,无论是基本任务、二次开发还是企业级集成。本指南探讨了多个框架——Coze、Dify、FastGPT、MetaGPT、AutoGen、Spring AI、Swarm、LangChain 和 LangGraph——以提供对它们的工作原理和使用案例的详细见解。 1. Coze Coze 是一个轻量级且用户友好的框架,旨在以尽可能少的

阅读更多
HuggingFace smolagents:迄今为止最好的多代理框架?

HuggingFace smolagents:迄今为止最好的多代理框架?

比较 Autogen、Langraph、CrewAI、Magentic-One 等 正如你在多个地方所读到的,2025 年是 AI Agents 的年份。马克·扎克伯格甚至公开表示,Meta 将会有中高级工程师担任 AI Agents。 从过去几次发布中可以清楚看出,微软现在拥有 3 个多智能体编排框架(AutoGen、Magentic-One、Tiny-Troupe),Op

阅读更多
2025 年构建人工智能驱动的推荐系统!

2025 年构建人工智能驱动的推荐系统!

本博客深入探讨部署 AI 驱动的个性化引擎的复杂性,重点介绍如何利用 AI 和机器学习技术进行实时、高度针对性的推荐。无论您是在电子商务、媒体还是其他行业,理解这些系统对于保持竞争力至关重要。 AI驱动的个性化引擎介绍 AI驱动的个性化引擎改变了企业与客户互动的方式。通过利用先进的算法,这些系统分析用户行为和偏好,以提供量身定制的体验。这种个性化增强了用户参与度,提高了转化率

阅读更多
我如何使用 Figma 的新人工智能在 48 小时内设计并构建一个可运行的移动应用程序

我如何使用 Figma 的新人工智能在 48 小时内设计并构建一个可运行的移动应用程序

本周,我挑战自己尽可能多地使用 Figma 的新 AI 功能来完成我的产品设计和开发过程——从用户研究和分析到生成我的 UI 设计,原型制作,然后将所有内容转化为一个真实的工作应用——我尝试在 仅仅 48 小时 内完成这一切。以下是发生的事情…… 问题 上周,我和我的会计见面,他指出我记账的方式并不是“最佳的”。我心想:“我希望有一种简单的方法来查看我的资金流入,并将其

阅读更多
使用 PydanticAI 创建人工智能代理 CRUD 应用程序:逐步进行

使用 PydanticAI 创建人工智能代理 CRUD 应用程序:逐步进行

很高兴再次回到 Skolo Online!在我们2025年的第一篇教程中,我们将深入探讨 PydanticAI。在本文中,我们将涵盖以下内容:如何开始使用 Pydantic AI — “你好,世界”教程 设置 PostgreSQL 数据库 更复杂的 PydanticAI 实现,其中两个代理协同工作以执行用户请求。代理 1 理解用户意图,代理 2 执行该意图。最后,我们

阅读更多
使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

Pydantic是Python生态系统中的一大力量,拥有超过2.85亿次的月下载量,一直是Python项目中稳健数据验证的基石。现在,它的创造者们正在前往AI的前沿领域,推出Pydantic AI,这是一个旨在构建由生成式AI驱动的生产级应用程序的框架。在本文中,我们将深入探讨Pydantic AI的独特之处、其关键特性以及与其他智能体框架的比较。 Pyd

阅读更多
使用 LangGraph 构建 RAG 研究多重代理

使用 LangGraph 构建 RAG 研究多重代理

❓引言 — 天真的 RAG 与 代理 RAG 🧠 项目概述 📊 结果 🔚 结论在本文中,我们介绍了一个实用项目,使用 LangGraph 开发了一个 RAG 研究多代理 工具。该工具旨在解决需要 多个来源 和 迭代步骤 才能得出最终答案的 复杂问题。它采用 混合搜索 和 Cohere **重新排序步

阅读更多
简化的人工智能代理:人工智能代理如何利用领域知识回答问题

简化的人工智能代理:人工智能代理如何利用领域知识回答问题

揭秘企业AI代理如何利用领域知识定制回答客户问题,并严格限制答案在领域知识范围内。 背景 你是否曾想过,今天最先进平台上的尖端 AI 代理是如何运作的?例如,在上面的截图中,我向 wealthsimple.com 的 AI 代理询问利率问题,它提供了特定于 Wealthsimple 产品的答案,并将其限制在 Wealthsimple 产品范围内。它没有告诉我美国银行的现

阅读更多
使用 LLM 执行分析查询

使用 LLM 执行分析查询

实用方法:使用 LLM 进行数据探索与分析 考虑以下场景。您有一个包含 500 万行和 20 列的 CSV 文件。该 CSV 文件包含客户的交易记录,例如销售日期、单价、数量、客户姓名、地址等。基于这些数据,您希望 LLM 能帮助回答以下问题:客户 A 在某一天购买了什么? 某个月的总销售额是多少? 列出某一年每个月的销售额。LLM的局限性 如果你尝

阅读更多
文档智能的多代理革命:Sema4.ai 的

文档智能的多代理革命:Sema4.ai 的

本文由 Sunil Govindan 共同撰写,他对 AI 驱动的文档处理提供了见解和专业知识。Sema4.ai 文档智能多代理系统 自去年年底将文档智能(DI)作为 Sema4.ai 企业代理平台的一部分推出以来,我们看到企业对转变其以文档为中心的工作流程产生了极大的兴趣。从数小时到数秒。从手动

阅读更多
如何开发具有自动互联网搜索功能的免费人工智能代理

如何开发具有自动互联网搜索功能的免费人工智能代理

使用 Groq 的免费 API 和 LangGraph 开发一个 AI 代理,以回答用户的问题并根据问题自动调用互联网搜索 如果您不是 Medium 会员,您可以通过此链接阅读完整故事。 生成性人工智能中的代理 AI 方法正在取得进展,并发现多个潜在应用。AI 代理就像数字助手,可以代表用户执行多项任务。它们可以理解用户的问题、整体目标,推理并决定选择最佳行动,并相互沟通

阅读更多
使用 Python 构建您自己的个性化健身 RAG 代理!

使用 Python 构建您自己的个性化健身 RAG 代理!

AI代理 | RAG代理 | Python | DSPy | 健身代理 | 初学者友好 完整且适合初学者的指南:使用 Python 构建您完全个性化的健身 RAG 代理***还不是会员?请随时访问完整文章 [这里](https://readmedium.com/69fe37b803f6?source=friends_link&sk=13d4674246ba

阅读更多
打造你的专属AI API!深入浅出Spring Boot与Google Gemini的完美融合!

打造你的专属AI API!深入浅出Spring Boot与Google Gemini的完美融合!

创建一个智能网络服务,利用生成式 AI 的力量回答问题 在本教程中,我们将整合 Spring Boot 和 Spring AI/Gen AI,构建一个利用 Google’s Gemini 生成式 AI 模型的网络服务。我们的目标是创建一个简单的网络服务,能够基于生成式 AI 的能力智能地回答用户问题。借助 Gemini 的强大功能,我们可以利用尖端 AI 提

阅读更多
惊人进化!用Gemini 2.0与LangGraph构建您的多工具自主代理!

惊人进化!用Gemini 2.0与LangGraph构建您的多工具自主代理!

一个实用的教程,包含完整代码示例,用于构建和运行多工具代理 大型语言模型(LLMs)非常出色——它们可以记忆大量信息,回答常识性问题,编写代码,生成故事,甚至修正你的语法。然而,它们并非没有局限性。它们会幻觉,知识截止日期可能从几个月到几年不等,并且仅限于生成文本,无法与现实世界互动。这限制了它们的实用性,尤其是在需要实时数据、来源引用或超出文本生成功能的任务中。这

阅读更多
构建惊艳的文本分析管道!LangGraph的奇妙能力揭秘!

构建惊艳的文本分析管道!LangGraph的奇妙能力揭秘!

在本文中,我将向您介绍 LangGraph,这是一个用于构建基于图的工作流的应用程序的令人难以置信的框架,这些工作流在其他情况下将是不可行的。我将分享我对 LangGraph 的经验,它的重要特性,并最终创建一个文本分析管道,以展示 LangGraph 的能力。 理解 LangGraph 本质上,LangGraph 是围绕图形工作流程的概念构建的,其中每个节点作为特定的过程或

阅读更多
利用模态微调 LLaMA-3 实现文本到 SQL 的生成:综合指南

利用模态微调 LLaMA-3 实现文本到 SQL 的生成:综合指南

微调大型语言模型(LLMs)传统上是一项复杂的工作,需要大量的基础设施设置和管理。然而,借助Modal的云平台和Axolotl的微调框架,您现在可以直接从本地机器对强大的模型如LLaMA-3进行微调,而无需处理基础设施的复杂性。 在本指南中,我们将通过使用Modal的远程GPU功能和Axolotl的先进训练优化,逐步演示如何对LLaMA-3 8B进行SQL查询生成的微调。 ![](htt

阅读更多
能将 Docker 容器大小减少 80% 的人工智能工具

能将 Docker 容器大小减少 80% 的人工智能工具

如何通过 Docker Shrink 优化容器并节省时间和金钱 在容器化应用主导的现代范式中,有效处理 Docker 容器是开发人员和组织面临的主要问题之一。这导致了大型 Docker 镜像,从而造成更高的存储费用、较长的构建时间以及生产环境中的其他问题。 Docker Shrink 是解决这些问题的新方案,它是一个创新工具,利用人工智能来解决这些问题。作为一个亲身经历过大型 D

阅读更多
用于情感分类的传统人工智能与生成式人工智能

用于情感分类的传统人工智能与生成式人工智能

5种文本分类的方法(即使没有训练数据) 介绍 本文重点讨论来自Flipkart客户评论数据集的产品评论情感分析。 情感分析是自然语言处理(NLP)中的一项关键任务,

阅读更多
利用来自 Hugging Face 的 SmolAgents 库构建多代理供应链模拟

利用来自 Hugging Face 的 SmolAgents 库构建多代理供应链模拟

“smolagents — 一个构建优秀智能体的小型库” 供应链管理是一个复杂的领域,其中多个实体需要有效协调,以便将产品交付给最终消费者。现代供应链是一个复杂的网络,涉及供应商、制造商、分销商和零售商。对这些网络的仿真可以帮助我们理解瓶颈、优化操作并提高效率。 在本

阅读更多
如何用Pydantic AI与Google Gemini构建强大的SWOT分析代理?惊人架构揭秘!

如何用Pydantic AI与Google Gemini构建强大的SWOT分析代理?惊人架构揭秘!

在当今快节奏的世界中,快速收集和综合信息变得至关重要。我构建了一个 AI 代理,以现代技术栈提供战略洞察。本文将带您了解这一过程,突出技术和设计选择,并演示您如何在 Google Cloud 上构建它。 一个 AI 代理 是一种能够感知其环

阅读更多
用Google Gemini 2.0 API构建RAG!推荐系统的未来在哪里?

用Google Gemini 2.0 API构建RAG!推荐系统的未来在哪里?

LangChain与Vertex AI RAG引擎在亚马逊产品数据上的比较 谷歌在人工智能竞赛中似乎一直处于落后,但在2025年之前发布的Gemini 2.0让人感觉他们终于在某种程度上赶上了。我起初不确定会有什么期待,但在试用后,我对其能力感到由衷的印象深刻。它甚至让我怀疑像ChatGPT、Claude或Llama这样的工具是否仍然必要。**Gemini实时[

阅读更多
OpenAI的结构化输出:如何用JSON实现安全与灵活性的完美平衡?

OpenAI的结构化输出:如何用JSON实现安全与灵活性的完美平衡?

过去,在使用OpenAI的JSON模式时,模型输出与指定和预定义的JSON架构不匹配并没有保证。在我看来,这确实使得这个功能在生产环境中不可靠,因为一致性非常重要…… 然而,这一切随着OpenAI所称的结构化输出而改变,他们将其描述为[JSON模式](https://cobusgreyling.medium.com/now-you-can-set-gpt-output-to

阅读更多
打造你的智能Bluesky机器人!利用Langflow、TypeScript和Node.js畅游新世界!

打造你的智能Bluesky机器人!利用Langflow、TypeScript和Node.js畅游新世界!

作者 Phil Nash Bluesky 是一个建立在 AT Protocol 上的社交网络:一种开放的、去中心化的构建社交应用程序的方式。AT Protocol

阅读更多
AI智能代理:如何让团队合作更高效?探索多智能体系统的奇妙之旅!

AI智能代理:如何让团队合作更高效?探索多智能体系统的奇妙之旅!

注意:本文适用于正在构建数字产品的产品经理、产品设计师和工程师,特别是在AI领域,目标是构建多AI代理系统,以优化产品和业务的价值,同时通过AI对话解决复杂的用户问题。 当你查看界面时,构建AI对话似乎很简单,包括AI与用户之间的双向互动,以及供用户提问的输入占位符。但在这背后,对于产品开发团队来说,这是一个巨大的挑战。发现用户期望、改进并不断迭代,以便每天更清晰地提供价值,需要许多步

阅读更多
精细调优大语言模型:揭开HuggingFace的神秘面纱!如何克服GPU内存束缚?

精细调优大语言模型:揭开HuggingFace的神秘面纱!如何克服GPU内存束缚?

每次大型语言模型 (LLMs) 的新公告往往将性能推向新的高度,常常超越之前的基准(例如,巨量多任务语言理解或 MMLU)。这一进展激发了许多应用程序的出现,利用最大的和最优秀的模型。在我们之前的帖子中,我们讨论了 LLMs 的规模法则,并解释

阅读更多
2025 年让你致富的 6 款最佳人工智能工具

2025 年让你致富的 6 款最佳人工智能工具

→ 在人工智能与技术领域 是时候利用人工智能开始你的事业,否则以后会后悔! 不管你喜欢与否, 机器人正在到来。 [根据高盛的说法,](https://www.forbes.com/sites/jackkelly/2023/03/31/goldman-sachs-predicts-300-million-jobs-will-be-lost-or-d

阅读更多
利用 Gemini 2.0 多模态实时 API 构建实时屏幕共享助手

利用 Gemini 2.0 多模态实时 API 构建实时屏幕共享助手

Gemini 开发教程 V3 在 Gemini 2.0 系列的最后几期教程中,我们建立了一个自托管的实时语音和视频聊天机器人的核心功能,并为其添加了功能调用特性,以便它能够调用外部工具和 API。这些都是具有快速响应、人性化互动和增强推理能力的实用应用,得益于 Gemini 2.0 多模态实时 API。 在本教程中,我们将重点关注模型的另一个实用应用,您可能已经在 Googl

阅读更多
Bolt DIY + Deepseek V3 + Gemini 2.0:免费人工智能编码器

Bolt DIY + Deepseek V3 + Gemini 2.0:免费人工智能编码器

嘿,你听说过 Bolt DIY 吗? 它超级酷,我敢打赌你会喜欢它。 想象一下,在你的浏览器中有一个智能 AI 助手,可以帮助你编写全栈应用程序。 最棒的是?它是免费的,灵活性超高。 让我来解释一下它是如何工作的。 什么是 Bolt DIY? 所以,Bolt DIY 是一个开源工具(它以前被称为 oTToDev,如果你听说过的话)。 它允许你直接在浏览器中构建全栈应用

阅读更多
GPT-4o Python 疯狂制图:即时数据可视化提示

GPT-4o Python 疯狂制图:即时数据可视化提示

来自联合国人口预测数据集的无代码可视化实操 GPT-4o 的自动数据可视化生成工具越来越先进。 您可以上传多个 CSV(和 XSLX)文件,并要求 GPT-4o 查看它们并为您提供文件中的结构和数据值列表。 然后,您可以提示这个 LLM 创建 Python 代码来清理数据,并提供图表和地图的数据可视化。 这非常有用。让我来给您演示一下它是如何工

阅读更多
2025:人工智能代理年--利用 CrewAi 和 Gemini 1.5 构建多代理系统

2025:人工智能代理年--利用 CrewAi 和 Gemini 1.5 构建多代理系统

正如许多专家预测的那样,2025年将成为自主人工智能的年份。这个新兴领域有望通过引入高度自主的系统来重新定义我们与技术的互动,这些系统能够在最小的人类干预下做出决策并执行复杂任务。受到这一理念的启发,我开始构建一个多智能体系统,该系统不仅执行特定任务,还能根据用户定义的主题创建有意义的内容。 在这篇文章中,我将带您了解我构建的系统、我面临的挑战,以及自主人工智能所蕴含的激动人心的未来。

阅读更多
使用开源模型构建医疗聊天机器人:通过人工智能改变医疗保健

使用开源模型构建医疗聊天机器人:通过人工智能改变医疗保健

人工智能正在改变医疗保健,聊天机器人提供快速可靠的医疗信息。随着我对生成式人工智能的了解不断加深,我希望构建一个完全100%开源的医疗聊天机器人。我的目标是让这个医疗机器人能够通过丰富的医学文献回答医疗问题。然而,我面临了一些挑战和突破,稍后将进行讨论。我采取了以下步骤来实现这个项目。 步骤 1:环境和需求设置 首先,我在我的GitHub上创建了一个新的代码库,并将其克隆到我

阅读更多
Crawl4AI:释放高效网络抓取功能

Crawl4AI:释放高效网络抓取功能

在当今数据驱动的世界中,高效收集和处理信息的能力对于人工智能(AI)应用的成功至关重要。随着人工智能的不断发展,对结构化数据以训练大型语言模型(LLMs)的需求前所未有地高。 引入 Crawl4AI,一个创新的开源 Python 库,旨在简化网页爬取和数据提取,使其成为开发者和人工智能爱好者不可或缺的工具。本文将探讨 Crawl4AI 的功能、特性和使用案例,强调它如何使用户能够利

阅读更多
探索 DeepSeek 工件:革新前端代码生成

探索 DeepSeek 工件:革新前端代码生成

人工智能领域充满了创新,其中一个突出的工具是 DeepSeek V3。因其在 LLM 排行榜上名列前茅而闻名,这个开放权重模型在 AI 社区中因其价格实惠和卓越表现而获得了显著关注。虽然 DeepSeek V3 备受赞誉,但它的兄弟

阅读更多
探索 DeepSeek 第 3 版:技术概览

探索 DeepSeek 第 3 版:技术概览

DeepSeek 版本 3 的发布在 AI 社区引发了相当大的兴奋,得益于其卓越的能力和成本效益。作为一个在中国开发的先进开放权重大型语言模型 (LLM),它利用专家混合 (MoE) 架构来优化性能,在处理过程中仅激活其 6710 亿参数中的 370 亿。多头潜在注意力 (MLA)、FP8 混合精度和多令牌预测等创新进一步提升了其效率和有效性。DeepSeek V3 在 MMLU-Pro、M

阅读更多
掌握 CrewAI:第 6 章--记忆基础 | 作者 Okan Yenigün | 2025 年 1 月 | 中

掌握 CrewAI:第 6 章--记忆基础 | 作者 Okan Yenigün | 2025 年 1 月 | 中

CrewAI中的内存类型 在CrewAI中,内存系统通过使AI代理能够记住、推理和从过去的互动中学习来增强其能力。 前一章: 该系统由几个关键组件组成:短期记忆:该组件暂时存储最近的互动和结果,使代理能够在进行中的任务中回忆相关信息。例如,它有助于通过回忆刚刚讨论过的内容来保持对话的一致性。使用RAG。 长期记忆:它作为过去互动中有价值的见解和学

阅读更多
掌握 CrewAI:第 5 章--训练、测试、回放和计划 | 作者:Okan Yenigün | 2025年1月 | 人工智能浅析

掌握 CrewAI:第 5 章--训练、测试、回放和计划 | 作者:Okan Yenigün | 2025年1月 | 人工智能浅析

训练、测试、重放与计划 在本章中,我们将探讨CrewAI的训练、测试、重放和计划功能。 上一章: 让我们为这篇文章创建一个新项目。 crewai create crew train_test_example这将创建一个模板项目。 训练 在训练过程中,我们使用人机协作技术。团队生成结果,我们对其提供反馈。通过迭代反馈,结果随着时

阅读更多
掌握CrewAI秘籍 2:如何用“Flows”打造智能化工作流?惊艳实用技巧大揭秘!

掌握CrewAI秘籍 2:如何用“Flows”打造智能化工作流?惊艳实用技巧大揭秘!

事件驱动的 AI 工作流 工作流允许我们协调任务并管理团队。 上一章:我们可以将多个团队和任务串联在一起,构建 AI 工作流。 工作流在不同任务之

阅读更多
揭秘Google Video Analyzer:如何用AI技术实现视频内容的高效分析!

揭秘Google Video Analyzer:如何用AI技术实现视频内容的高效分析!

人工智能工具的进步正以惊人的速度发展,而Google AI Studio的Video Analyzer正是这一创新的证明。如果你对视频分析感兴趣,这个工具及其基础框架是探索人工智能在处理和理解视频内容方面能力的绝佳方式。我在我之前的[文章](https://readmedium.com/googles-new-model-gemini-2-0-gemini-2-0-beats-claude-

阅读更多
揭秘CrewAI 4:三种流程的前所未有效率!你准备好提升你的AI协作能力了吗?

揭秘CrewAI 4:三种流程的前所未有效率!你准备好提升你的AI协作能力了吗?

顺序与层级流程 在CrewAI中,流程的概念对于管理AI代理之间的协作和任务执行至关重要。 上一章: 流程定义了协调代理执行任务以实现共同目标的工作流策略。 主要有三种流程类型:顺序流程 层级流程 协商流程(已规划,但尚未实施)首先,让我们创建一个新项目来处理流程 (openai >> gpt-4o-mini).

阅读更多
利用 Chrome 浏览器的设备上人工智能构建项目

利用 Chrome 浏览器的设备上人工智能构建项目

使用 Gemini-nano-in-Chrome 进行原型设计指南 在Chrome上使用实验性提示API构建具有AI功能的原型 设备端 / 边缘 AI 设备端 AI 是指直接在终端用户设备上运行的 AI 模型,例如智能手机、平板电脑或物联网设备,而不依赖于云计算或服务器来托管这些模型。 这在很多方面都很有用:由于模型在设备上,我们可以进行离线推理

阅读更多
揭秘:加密货币AI交易机器人,24/7不眠不休的交易奇迹!

揭秘:加密货币AI交易机器人,24/7不眠不休的交易奇迹!

加密AI交易机器人正在彻底改变交易者在加密货币市场中的导航方式,提供无与伦比的效率。 在不断发展的加密货币世界中,走在前沿通常需要创新工具。在Cryptokeek,我们理解利用尖端技术提升您的交易体验的重要性。其中一种创新就是使用加密AI交易机器人。这些自动化程序正在改变交易者与市场互动的方式。以下是您需要了解的所有信息。 为什么考虑加密货币AI交易机器人? 首先,加密货

阅读更多
微调 Llama-3 LLM 并将其部署为 CloudFlare 上的无服务器 API

微调 Llama-3 LLM 并将其部署为 CloudFlare 上的无服务器 API

两年前,我(像许多数据科学家一样)对构建网站一无所知。 我擅长构建机器学习模型,但完全不知道如何将这些模型实际部署到像 mywebsite.com 这样的域名上。机器学习工程师负责这个,对吧? 错了! 如果你想在竞争激烈的就业市场中脱颖而出,拥有公开可见的代码是展示你技能的绝佳方式。 在这篇文章中,我将向你展示我是如何构建一个基于 Llama 3 的聊天机器人,并通过 Cloud

阅读更多
掌握CrewAI秘籍 3:如何让你的AI代理获取知识,实现智能对话?

掌握CrewAI秘籍 3:如何让你的AI代理获取知识,实现智能对话?

知识 — CrewAI 在 CrewAI 中,“知识”是允许 AI 代理在执行任务时访问和利用外部信息源的系统。我们可以把它看作是为我们的代理提供了一个参考图书馆,以便在工作时咨询。文本来源:原始字符串、文本文件、pdf 等… 结构化数据:CSV、excel、json 等…上一章: 让我们创建一个新项目来使用“知识” (*openai >> gpt-4o

阅读更多
轻松打造高效研究助手!AutoGen与Panel UI结合的神奇旅程

轻松打造高效研究助手!AutoGen与Panel UI结合的神奇旅程

🎉 新年快乐,大家好!在开始之前,衷心感谢大家对我们之前故事的支持和反馈——这对我们意义重大!🙌 现在,让我们以一个有趣的项目开始新的一年。在人工智能和数据科学的世界中,打造智能和动态的代理可以为自动化研究工作流程带来重大变化。利用 AutoGen 和 Panel UI,您可以构建一个研究代理,与多个子代理协作,每个子代理都设计用于特定任务,如编码、规划或批评。✨ 让我

阅读更多
如何用AI简化Jira管理?揭秘定制AI Jira助手的惊艳新境界!

如何用AI简化Jira管理?揭秘定制AI Jira助手的惊艳新境界!

我如何使用 Google Mesop、Django、LangChain Agents、CO-STAR 和 Chain-of-Thought (CoT) 提示结合 Jira API 更好地自动化 Jira 这个项目的灵感来自于我为内部用户开发的一个网页应用上的 Jira 工单创建工具。我还在系统错误发生时添加了自动创建 Jira 工单的功能。 用户和系统错误通常会创建类似的工

阅读更多
2025年冲击AI领域!6个月掌握LLM的必经之路!

2025年冲击AI领域!6个月掌握LLM的必经之路!

作为一名从电子工程背景转型为专注于大型语言模型(LLMs)和生成式AI的数据科学家,我理解进入AI领域的挑战与兴奋。到2025年,行业格局与我开始旅程时有了显著变化。让我分享一个实用的学习路径,无论您是全新起步还是从其他领域转型。结合我自身的经历和行业经验,我将重点介绍在当今AI领域中最重要的技能和知识。 为什么在2025年关注大型语言模型(LLMs)? 当我开始转向人工智能领域时

阅读更多
揭秘PydanticAI:打造高效AI代理的终极利器!

揭秘PydanticAI:打造高效AI代理的终极利器!

PydanticAI 是一个 Python 代理框架,旨在减少使用生成式 AI 构建生产级应用程序的痛苦。 FastAPI 通过提供创新且人性化的设计,彻底改变了 web 开发,其基础是 Pydantic。 同样,几乎所有的代理框架和 Python 中的 LLM 库都使用 Pydantic,然而当我们开始在 [Pydantic

阅读更多
Wren AI:Uber如何利用Text-to-SQL每月节省14万个小时?揭秘你的企业也能获得的强大力量!

Wren AI:Uber如何利用Text-to-SQL每月节省14万个小时?揭秘你的企业也能获得的强大力量!

在数据驱动决策至关重要的世界中,企业正在争相寻找从庞大数据集中提取可操作洞察的最有效方法。Uber,作为实时物流和运输的全球领导者,最近分享了他们的内部Text-to-SQL平台 — QueryGPT(如果你还没有查看这篇文章,[请在这里查看](https://www.uber.com/en-

阅读更多
Wren AI 文本到 SQL:API - 好东西 | by D | Medium

Wren AI 文本到 SQL:API - 好东西 | by D | Medium

Wren AI 是一个 AI 管道应用程序,可以将自然语言用户查询转换为 SQL,也称为 文本到 SQL(也称为自然语言到 SQL 或 NL2SQL),使您能够与数据库进行对话。它同时提供 UI 和 API,允许您根据用户提示生成 SQL 查询,并使用这些查询检索数据。这大大简化了在您的 RAG/Agent 应用程序中处理结构化表格数据的过程。 查看他们的演示 [https:/

阅读更多
2025 年学习人工智能的最快方法

2025 年学习人工智能的最快方法

为什么短期有效时还要选择长期? 本博客旨在为您提供一条清晰的捷径,让您在AI领域入门的同时探索新的AI产品,以保持您的动力。我不会包含令人不知所措的建议,比如“嘿,您应该开始学习Python,因为它是最常见和流行的编程语言……”或任何图表,如下所示: 大多数搜索**“如何学习AI”**的人立刻会面临诸如ML和DL等术语,这可能会让人感到沮丧,并使AI看起来很困难。然而

阅读更多
将数据转化为解决方案:使用 Python 和人工智能构建智能应用程序

将数据转化为解决方案:使用 Python 和人工智能构建智能应用程序

一些金融分析师担心人工智能可能无法证明在该领域进行的大规模投资的合理性。虽然我理解他们的担忧,但我的看法有所不同。我既不是AI的乐观派,也不是悲观派——我相信AI有潜力推动创新、提升生产力,并带来可衡量的商业成果。 在我上一篇文章中,我探讨了大型语言模型(LLMs)如何用于结构化非结构化数据。这一次,我想更进一步:展示使用LLMs进行数据结构化的结果如何作为构建智能应用的基础。从而

阅读更多
使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

Pydantic 是 Python 生态系统中的一股强大力量,拥有超过 2.85 亿次的月下载量,一直是 Python 项目中稳健数据验证的基石。现在,它的创造者正在进军前沿的 AI 领域,推出 Pydantic AI,这是一个旨在构建由生成式 AI 驱动的生产级应用程序的框架。在本文中,我们将深入探讨 Pydantic AI 的独特之处、其关键特性,以及它与其他

阅读更多
关于人工智能船员的博客,写关于人工智能船员的博客 | 作者:Ryan A Ellis | Medium

关于人工智能船员的博客,写关于人工智能船员的博客 | 作者:Ryan A Ellis | Medium

介绍 这篇博客的目的是简要展示我使用 crewAI 框架构建的内容以及使其工作的组件。我想测试一下我从 DeepLearning.AI 的短期课程 Multi AI Agent Systems with crewAI 中学到的知识

阅读更多
掌握 CrewAI:利用多代理系统实现内容创作和营销工作流程自动化的综合指南 | 作者:Kshitij Kutumbe | Medium

掌握 CrewAI:利用多代理系统实现内容创作和营销工作流程自动化的综合指南 | 作者:Kshitij Kutumbe | Medium

CrewAI 是一个先进的框架,旨在以协调和高效的方式编排自主智能体。通过利用基于角色的智能体、任务和工具,CrewAI 使开发人员能够在内容创作、研究、客户服务等多个领域自动化复杂的工作流程。 完整代码链接: [https://github.com/kshitijkutumbe/Marketing\-AI\-Agent](https://github.com/kshitijkutu

阅读更多
多代理人工智能高手:用 CrewAI 构建内容写作人工智能系统 | 作者:Kshitij Kutumbe | Medium

多代理人工智能高手:用 CrewAI 构建内容写作人工智能系统 | 作者:Kshitij Kutumbe | Medium

在 AI 和语言模型的领域中,多代理系统涉及多个独立的参与者,每个参与者都由语言模型驱动,以结构化的方式进行协作。在本博客中,我们将深入探讨 Crew.AI,这是一个用于构建多代理应用的前沿框架。Crew.AI 使 AI 代理能够承担角色、共享目标,并协同工作,模拟一个协调良好的团队的动态。 架构 Crew.AI 的架构是模块化的,由多个关键组件组成,这些组件协同工作,创建一个

阅读更多
2024 年人工智能驱动的网络抓取:用 Python 构建价值百万美元的自动化工具

2024 年人工智能驱动的网络抓取:用 Python 构建价值百万美元的自动化工具

精通下一代网络爬虫:从零到英雄,结合 AI 集成、反检测策略和真实案例研究 | 完整指南与代码示例 🚀 介绍:自动化数据收集的力量 在当今数据驱动的世界中,网页抓取已经从一种简单的数据收集技术演变为开发者、数据科学家和企业的重要技能。无论您是在构建一个人工智能驱动的研究工具、监控市场趋势,还是为机器学习模型收集训练数据,掌握网页抓取都是您开启网络数据巨大潜力的门户。

阅读更多
OpenAIs Swarm(第二部分):使用 Ollama 和 Pydantic 的直接、本地优先方法

OpenAIs Swarm(第二部分):使用 Ollama 和 Pydantic 的直接、本地优先方法

一个简短的代码参考以供构建。 TLDR: 结合Ollama和Swarm框架,呈现了一种以本地为优先的构建智能AI代理的方法。 Ollama可以在本地运行大型语言模型,确保隐私和控制,而Swarm则提供了一个结构化的环境,用于设计和管理AI代理。 我们以第一性原理的编程方法强调简单性和高效性,避免使用带来不必要抽象的复杂框架,从而增加使用的tokens数量,并延迟首次tok

阅读更多
OpenAI的Swarm(第一部分):简短的参考实现

OpenAI的Swarm(第一部分):简短的参考实现

一个简短的代码参考,用于构建。 字数:1350 | 预计阅读时间:8分钟 目录简介:多智能体系统的挑战 OpenAI的群体框架概述 [环境设置](https://

阅读更多
Jupyter Agent 让我大开眼界。你未曾预见的人工智能革命。| 作者:Savvas Theocharous | 2024年12月 | 人工智能的进步

Jupyter Agent 让我大开眼界。你未曾预见的人工智能革命。| 作者:Savvas Theocharous | 2024年12月 | 人工智能的进步

易于获取,但难以置信。一旦你亲自体验过,你就会明白我在说什么! 我想我们都听说过 AI Agents。它正在进入主流,并且已经成为一个新兴的流行词。不过,我向你保证,在我自己尝试过 Jupyter Agent 之后,它的能力绝对不容小觑。 什么是 Jupyter Agent? [Jupyter Agent](https://huggingface.co/spaces/da

阅读更多
让AI为你写Python代码!六步解锁效率的奥秘!

让AI为你写Python代码!六步解锁效率的奥秘!

使用INSPIRe框架节省时间并获得竞争优势(ChatGPT-4 — Claude 3 — Gemini) AI不会取代你,但会取代那些更会写提示的人。 这是我告诉我在数据科学和软件工程领域的朋友们的话。有些人对此不以为然。“AI肯定无法生成多步骤的代码,”他们会说。其他人则大笑。“得了吧,这对初学者才有用!” 但不久之后,他们都开始寻求提示工程的建议。 到2022年底,L

阅读更多
微软开放源代码 MarkItDown:改变游戏规则的文件到文本转换库 🌐📊📚

微软开放源代码 MarkItDown:改变游戏规则的文件到文本转换库 🌐📊📚

一个强大的开源工具,简化文件处理并自动提取PDF、Word文档、图像、音频等中的内容。 📏🎓📦专业人士在从PDF、Word文档、图像或音频文件中提取有意义的内容时常常面临挑战。在多个格式中管理分散的内容可能耗时且具有干扰性。MarkItDown通过自动化文件到文本的转换来解决这一挑战,节省了数小时的工作时间,并提供干净、结构化的输出。 🗑️📅📊 这个

阅读更多
未来已来!OpenAI o3模型颠覆你对AI的所有想象!

未来已来!OpenAI o3模型颠覆你对AI的所有想象!

令人难以置信的奇迹,不仅仅是一个更先进的 AI 模型 OpenAI 以盛大的方式结束了他们为期 12 天的圣诞活动。在第一天,他们推出了他们的 [第一个推理 AI 模型 o1 的完整版本](https://www.thealgorithmicbridge.com/p/openai-announces-o1-model-

阅读更多
颠覆AI代理!如何借助Browser Use 实现网络互动的全新突破

颠覆AI代理!如何借助Browser Use 实现网络互动的全新突破

赋能AI代理无缝导航和与网站互动 🖥️🔗🤝在快速发展的人工智能领域,使AI代理能够像人类一样与网络互动是一项重要的进展。 Browser Use 是一个旨在促进这种互动的Python库,使AI代理能够自主导航网站、提取信息和执行任务。 浏览器使用的关键特性 🌟🔧📋视觉和HTML提取:使AI代理能够解释和提取网页中的信息,包括视觉内容和

阅读更多
揭开DeepSeek-V3的神秘面纱:如何以超低成本提升大语言模型的推理效率?!

揭开DeepSeek-V3的神秘面纱:如何以超低成本提升大语言模型的推理效率?!

介绍 DeepSeek-V3 已成为开源爱好者和企业用户的新重磅产品。该模型由一家中国的人工智能研究公司开发,致力于“开源精神 + 长期主义以实现包容性AGI”,旨在缩小封闭源巨头(如 GPT-4o 和 Claude-Sonnet-3.5\)与开源社区之间的差距。 DeepSeek-V3 采用 Mixture-of-Experts (MoE) 设

阅读更多
掌握Mastodon机器人!用Python轻松创建社交媒体助手的实用指南

掌握Mastodon机器人!用Python轻松创建社交媒体助手的实用指南

我最近在 Mastodon 上发布了一条帖子,在两分钟内被六个其他账户分享。出于好奇,我访问了这些账户的个人资料,发现至少其中一个是技术机器人——这些账户会根据标签(如 #datascience 或 #opensource)自动分享帖子。 Mastodon 目前作为 X(前身为 Twitter)的去中心化替代品正在迅速增长。在这样一个平台上,机器人如何能让我们的日常生活更轻松?风险又是什么

阅读更多
RooCline:AI开发的新利器,如何提升你的效率?

RooCline:AI开发的新利器,如何提升你的效率?

喜欢Cline但希望获得更高的速度和自主性?RooCline是流行的VS Code AI助手的强大分支,将Cline的所有优点进行了增强,提供了更高的性能、更多的功能和更大的灵活性。“RooCline最近主要在自我编写,偶尔有些人类的指导。”RooCline 有何不同之处?⚡️ 1. 增强功能智能通知:仅在需要关注时接收系统警报 多语言支持:

阅读更多
代理 RAG 系列:探索 LangGraph 高级工作流程

代理 RAG 系列:探索 LangGraph 高级工作流程

介绍 在上一篇文章中,我们介绍了Agentic RAG的概念,强调它如何通过集成自主代理能力来扩展传统的检索增强生成(RAG)框架。在本期中,我们深入探讨LangGraph,这是一个用于协调逻辑工作流程的创新框架。LangGraph使得创建具有复杂推理能力的多代理系统成为可能,是构建Agentic RAG架构的理想工具。 ![](https://wsrv.nl/?u

阅读更多
构建基于多代理的 自动递归--计划、执行、再计划流程

构建基于多代理的 自动递归--计划、执行、再计划流程

本博客包含以下三个部分:问题陈述 解决方案方法 结论与参考文献问题陈述 计划、执行与重新计划过程在智能体解决方案的领域并不新鲜。自去年以来,我们一直在实施这些基于智能体的计划-执行-重新计划过程。 因此,当我的一位同事讨论实施这些过程的挑战时,我感到很有趣,因为我认为这是一个讨论得很充分的问题。 但是在与他交谈时,我理解了他计划要做的场景的性质和复杂性,我认

阅读更多
构建多代理互联网研究助手

构建多代理互联网研究助手

…使用 OpenAI Swarm 和 Llama 3.2(100% 本地)。让我们使用 OpenAI Swarm 和 Llama 3.2(100% 本地)构建一个多智能体互联网研究助手: 动手教程,构建一个多智能体互联网研究助手应用程序,该应用程序:接受用户查询。 在网上搜索相关信息。 并将其转化为一篇精心撰写的文章。我们在这个应用中使用了三个智能体:

阅读更多
打造您的社交媒体内容机器:CrewAI 的方法

打造您的社交媒体内容机器:CrewAI 的方法

实施 CrewAI 的分步指南 介绍🚀 AI 协作的力量有太多可以提供的。CrewAI旨在使AI代理能够承担角色、共享目标,并在一个紧密的单位中运作——就像一个运转良好的团队。 无论您是在构建一个智能助手平台、一个自动化的客户服务团队,还是一个多代理研究团队,CrewAI为复杂的多代理交互提供了基础。 如果您想深入了解CrewAI:

阅读更多
使用 Gemini 2.0 提取任何文档 | 使用 ExtractThinker 提取文档智能

使用 Gemini 2.0 提取任何文档 | 使用 ExtractThinker 提取文档智能

在本文中,我们将探讨 Google 的 Gemini 2.0 模型如何与 [ExtractThinker](https://github.com/enoch3712/ExtractThinker

阅读更多
我如何利用人工智能在几秒钟内从任何网站提取信息

我如何利用人工智能在几秒钟内从任何网站提取信息

使用 Langchain、OpenAI、Bright Data 和 NextJS 构建一个免费的 AI 工具,用于抓取、提取和分析数据。 “有用”的数据是任何成功企业进行明智决策和战略规划的基础。然而,真正的挑战不仅仅在于抓取数据——而在于从收集到的数据中提取有价值的信息。这一步通常需要大量的时间和精力,成为了过程中的瓶颈。 在本文中,您将学习如何构建一个不仅能提取网页数据,

阅读更多
如何使用 Streamlit 和 Llama 3.2-Vision 构建自己的 OCR 助手

如何使用 Streamlit 和 Llama 3.2-Vision 构建自己的 OCR 助手

通过示例学习 OCR(光学字符识别)是一种帮助自动化将图像转换为文本的工具。你一定在手机上使用过它,因为现在它非常普遍。从数字化文档到自动化业务工作流程,OCR 是许多现代解决方案的核心。在本指南中,我们将引导您使用 Streamlit、Llama 3.2-Vision 和 Ollama 创建一个简单但强大的 OCR 助手,因为为什么不参与机器学习模型的竞争呢。有趣的是,不

阅读更多
具有大型语言模型(LLM)的多代理人工智能架构

具有大型语言模型(LLM)的多代理人工智能架构

端到端多智能体实现与LLMs 多智能体架构由多个自主智能体组成,它们协作以完成复杂任务。随着LLMs的最新进展,这种架构已获得显著的关注。 这些智能体能够独立做出决策并执行行动。智能体由大型语言模型(LLMs)驱动。 多智能体架构的工作方式是,你不必指定每一个步骤,我们可以给它们一个目标,它们可以自行确定行动顺序。 这些架构被广泛应用于机器人技术、虚拟助手、协作决策和多模态处

阅读更多
Qwen2.5:重新定义大型语言模型的效率

Qwen2.5:重新定义大型语言模型的效率

更智能地扩展和更好地学习与强化学习 语言模型的新纪元:介绍 Qwen2.5 基于大型语言模型(LLMs)的突破,Qwen2.5 处于提高效率和先进学习的最前沿。忠于其指导原则——“更聪明地扩展,更好地学习,通过强化学习”——Qwen2.5 被设计用来解决模型性能、与人类偏好的对齐以及成本效益等紧迫问题。 无论您是在探索基本的问答功能,还是在推动复杂的

阅读更多
人工智能代理框架终极指南:CrewAI vs LangGraph vs PhiData vs Relevance AI

人工智能代理框架终极指南:CrewAI vs LangGraph vs PhiData vs Relevance AI

AI代理开发的领域正在快速演变,多个框架相继出现,帮助开发者和企业构建复杂的AI解决方案。在本综合指南中,我们将深入探讨四个领先的框架:CrewAI、LangGraph、PhiData和Relevance AI。无论你是开发者、企业领导还是AI爱好者,了解这些框架的优势和差异对于做出明智的决策至关重要。 AI代理框架的兴起 随着AI不断改变我们的工作方式,构建和部署AI代理的

阅读更多
使用 Gemini 2.0 通过多模态实时 API 构建实时聊天应用程序

使用 Gemini 2.0 通过多模态实时 API 构建实时聊天应用程序

Gemini 开发教程 谷歌推出了 Gemini 2.0 及其预览模型 Gemini 2.0 Flash Experimental,您一定通过视频和文章了解过它。该模型在所有基准测试中大幅超越了其前身 Gemini 1.5 Pro,并且对所有人免费使用,但在 Google AI Studio 中有一些限制。如果您对 Gemini 2.0 有经验或看过关于 Google

阅读更多
你从未知道的 17 个令人惊叹的 GitHub 仓库

你从未知道的 17 个令人惊叹的 GitHub 仓库

Github 隐藏的宝石!! 立即收藏的代码库 学习编程相对简单,但掌握编写更好代码的艺术要困难得多。GitHub 是开发者的宝藏,那里“金子”是其他人分享的精心编写的代码。通过探索 GitHub,您可以发现如何编写更清晰的代码,理解高质量代码的样子,并学习成为更熟练开发者的基本步骤。 1. notwaldorf/emoji-translate *谁需

阅读更多
使用克劳德模型上下文协议(MCP)和外部工具的 6 个步骤

使用克劳德模型上下文协议(MCP)和外部工具的 6 个步骤

通过MCP集成GitHub和Brave Search来增强Claude桌面的功能 模型上下文协议 (MCP) 是由Anthropic开发的开放标准,使像Claude这样的AI模型能够安全地与各种数据源和工具进行交互。 ![](https://wsrv.nl/?

阅读更多
从自然语言到 SQL 生成的代理反射

从自然语言到 SQL 生成的代理反射

作者:Atul Varshneya, Toby Fotherby, Shweta Keshavanarayana 介绍 自然语言到 SQL (NL2SQL) 的转换有望为非技术用户普及数据访问。然而,这一过程充满了挑战。自然语言中的模糊性、数据库架构的变化、数据库中表的数量庞大以及 SQL 语法的复杂性常常导致不准确和/或低效的 SQL 查询生成。即使是先进的 AI 模型也难以

阅读更多
Anthropic 的 MCP:使用 Claude Desktop 设置 Git MCP Agentic 工具

Anthropic 的 MCP:使用 Claude Desktop 设置 Git MCP Agentic 工具

在本详细指南中,我将带您了解如何设置和使用Model Context Protocol (MCP) Git与Claude Desktop的集成。这种工具使Claude能够直接分析和与您的Git仓库进行交互,提供先进的代码分析和版本控制功能。我们将涵盖从基本设置到高级用例、故障排除和最佳实践的所有内容。让我们先了解一下MCP是什么以及它的重要性。 以下是我们在本综合指南中将要涵盖的内容:

阅读更多
用 Python 构建可投入生产的人工智能助理后台服务 - 第 1 部分

用 Python 构建可投入生产的人工智能助理后台服务 - 第 1 部分

— 学习构建生产就绪应用程序的最佳实践。 *免责声明 — 本文中的内容仅代表我个人观点,不代表我当前或过去雇主的观点。* 通过本综合教程的学习(请按照所有 4 个部分),您将能够使用以下架构中解释的框架开发后端服务: ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/

阅读更多
构建生产就绪的人工智能助理后台服务(Python)--第 2 部分

构建生产就绪的人工智能助理后台服务(Python)--第 2 部分

— 使用 LangGraph 构建多代理 RAG 系统 + 用授权密钥头保护您的应用程序 *免责声明 — 本文内容仅代表我个人观点,不代表我当前或过去雇主的立场。* 在上一部分([第 1 部分](https://readmedium.com/build-production-ready-ai-assistant-backend-service-in-python-part-

阅读更多
构建生产就绪的人工智能助理后台服务(Python)--第 3 部分

构建生产就绪的人工智能助理后台服务(Python)--第 3 部分

— 使用授权密钥保护您的应用程序 + 通过实际的 MongoDB 数据库和语义缓存能力提升后端吞吐量服务 *免责声明 — 本文中的内容仅代表我个人观点,与我当前或过去的雇主无关。* 回顾一下在 [第一部分](https://readmedium.com/build-production-ready-ai-assistant-backend-service-in-python

阅读更多
使用 AutoGen 构建人工智能个人助理 - 第 1 部分

使用 AutoGen 构建人工智能个人助理 - 第 1 部分

探索 AutoGen v0.4:构建具有 Gmail 和 Google Calendar 集成的 AI 助手 TL; DR 在这篇文章中,我构建了Aura的基础,这是一个个人AI助手,旨在使用AutoGen管理电子邮件和日历。以下是我所涵盖内容的快速概述:动机:Aura解决了生产力挑战,如收件箱过载、日程安排以及跟上技术趋势。 框架选择:选

阅读更多
使用自动生成的 MCP 服务器的 C++ RESTful 网络服务与 LLM 连接

使用自动生成的 MCP 服务器的 C++ RESTful 网络服务与 LLM 连接

这是一个 5 分钟的教程,介绍如何将 MCP (Model Context Protocol) 服务器添加到您现有的 Oat++ 应用程序,以便 LLMs 可以查询您的 API。 前提条件 在开始之前,您需要一个使用 Oat

阅读更多
Claude与Neo4j的动态数据交互与模型上下文协议应用

Claude与Neo4j的动态数据交互与模型上下文协议应用

赋予 LLM 知识图谱的能力,使用 Anthropic 的模型上下文协议 上周,Anthropic 发布了一个新的 模型上下文协议 (MCP),使得像 Claude 这样的 LLM 能够与外部数据源进行通信。 该协议允许本地应用程序,如 Claude.ai、Zed、R

阅读更多
🔌 Cline + MCP:VS Code 的人工智能助手获得代理超能力

🔌 Cline + MCP:VS Code 的人工智能助手获得代理超能力

“嘿,Cline,你能检查一下我们在 CI 中测试失败的原因吗?”到目前为止,AI 编码助手只能分析您手动共享的代码。但通过 Cline 最新的模型上下文协议(MCP)集成,您的 AI 助手现在可以调查问题、部署修复,并管理您整个开发工作流程——这一切都可以在 VS Code 中完成。“多亏了 Claude 3.5 Sonnet 的代理编码能力,Cline 可以逐步处理复杂的软

阅读更多
Crawl4AI:您的终极异步网络爬行伴侣 🕷️🤖

Crawl4AI:您的终极异步网络爬行伴侣 🕷️🤖

Crawl4AI 是一个 开源 Python 库,旨在简化网络爬虫并轻松提取网页上的有价值信息。无论您是将其集成作为 REST API,还是直接在您的 Python 项目中使用,Crawl4AI 都提供了一种 强大、灵活 和 完全异步 的解决方案,专为大型语言模型(LLMs)和人工智能应用量身定制。 介绍 Crawl4AI 旨在 **简化

阅读更多
使用 GPT-4o 创建 WhatsApp 人工智能代理

使用 GPT-4o 创建 WhatsApp 人工智能代理

如何使用 Meta API 构建您自己的 LLM 驱动的 Whatsapp 聊天机器人 在人工智能和商业管理领域,AI 代理与广泛使用的通信工具的整合是一个颠覆性的变化。想象一下,您可以通过 WhatsApp 直接与您业务的管理或个人助手 AI 进行实时数据请求、更新和任务自动化,这一切都通过熟悉的聊天界面实现。 在我们关于创建 AI 驱动的业务管理器系列的第三部分中,我将引

阅读更多
未来工程:数据、软件和人工智能的共同点

未来工程:数据、软件和人工智能的共同点

识别跨学科共性不仅增强招聘策略,还支持灵活的IT架构。 我注意到IT部门中存在过度专业化的趋势。然而,多年来我学到的一个重要教训是这种孤立专业化的负面影响。 虽然这主要是一个组织问题,但对供应商专业平台产品的盲目追求也[导致了我们企

阅读更多
从帖子到报告:利用 LLM 进行社交媒体数据挖掘

从帖子到报告:利用 LLM 进行社交媒体数据挖掘

如何指导LLMs过滤餐厅帖子并提取对业务增长至关重要的见解。 应用概述 我们正处于自动化的黄金时代,这得益于大型语言模型(LLMs)的崛起。从改变行业到解锁无尽的应用,LLMs彻底改变了我们与数据的互动方式,主要通过自然语言。 在本文中,我将向您展示如何指示LLM穿透社交媒体的噪音,提取最重要的信息。具体来说,我们将深入探讨如何挖掘Instagram上的餐厅帖子,以

阅读更多
Gemini 2.0 Flash + 本地多模式 RAG + 上下文感知 Python 项目:文档的简易人工智能/聊天

Gemini 2.0 Flash + 本地多模式 RAG + 上下文感知 Python 项目:文档的简易人工智能/聊天

在这个视频中,我将展示一个超级快速的教程,教你如何创建一个本地多模态 RAG、Gemini 2.0 Flash 和上下文感知响应,以便为你的业务或个人使用打造一个强大的代理聊天机器人——一个不需要强大笔记本电脑的聊天机器人。 年末时,大模型产品之间的竞争再次加剧。在我上一个视频中,我介绍了 LLama3.3\。 在12月11日,谷歌发布了 **Gemini 2.0 Flash。

阅读更多
我如何利用 ChromaDB 和 Chainlit 构建基于 Graph-RAG 系统的 LLM 应用程序

我如何利用 ChromaDB 和 Chainlit 构建基于 Graph-RAG 系统的 LLM 应用程序

一个端到端的应用,带有 GUI,并且仅用 3 个脚本将新知识存储在向量数据库中 大型语言模型(LLMs)和知识图谱是处理自然语言的宝贵工具。检索增强生成(RAG)作为一种强大的方法,能够通过上下文知识增强 LLM 的响应。上下文知识通常嵌入并存储在向量数据库中,用于创建上下文以增强提示。然而,这种方式下,知识被映射在一个概念空间中,但并没有真正组织起来。知识图谱捕捉了领域内数据点或实体

阅读更多
如何利用实时事件处理打造主动式代理

如何利用实时事件处理打造主动式代理

发现如何将流媒体数据库与大型语言模型结合起来,创建在您甚至未询问之前就能采取行动的智能代理。 由大型语言模型(LLMs)驱动的问答代理,如ChatGPT,已经成为我们日常生活中不可或缺的一部分,帮助我们解决各种问题——无论是编写代码、撰写论文还是回复电子邮件。但是,所有这些“神奇”的能力都有一个关键要求:我们必须向LLM提供高质量、精确描述的问题。 那么,是否有可能创建一个能

阅读更多
如何使用 Google DeepMind Gemini 2.0 Flash Live API 进行实时对话

如何使用 Google DeepMind Gemini 2.0 Flash Live API 进行实时对话

Google DeepMind 的 Gemini 2.0 Flash API 代表了实时 AI 驱动对话领域的重大突破。它使开发者能够构建能够无缝处理实时音频交互的应用程序,提供了语音输入和输出的无与伦比的集成。无论您是在创建客户服务聊天机器人、增强无障碍工具,还是开发互动 AI 导师,这个 API 都是一个强大的基础。在本博客中,我们将探讨 Gemini 2.0 Flash API

阅读更多
我刚刚试用了 OpenAI 的升级版 o1 模型。这项技术将重创华尔街

我刚刚试用了 OpenAI 的升级版 o1 模型。这项技术将重创华尔街

当我第一次尝试o1-preview模型时,发布于九月中旬,我并没有留下深刻的印象。与传统的大型语言模型不同,o1系列模型不会立即响应。它们会“思考”问题和可能的解决方案,这个过程非常漫长。 再加上使用该模型的费用异常高昂以及缺乏基本功能(如函数调用),我很少使用这个模型,尽管我已经展示了如何使用它来创建超越市场的交易策略。 然而,OpenAI刚刚发布了最新的o1模型。与其前身(o1-prev

阅读更多
文本到 SQL 的数据建模已死?Wren AI 如何连接现代商业智能与传统实践

文本到 SQL 的数据建模已死?Wren AI 如何连接现代商业智能与传统实践

数据建模在文本到SQL时代是否已经过时?Wren AI如何弥合现代商业智能与传统实践之间的差距 来自Wren AI团队的用户最常问的问题是:“我们可以直接将Wren AI的文本到SQL解决方案连接到我们的原始数据吗?现在AI可以处理一切,数据建模还有必要吗?”虽然现代AI驱动的工具如Wren AI确实改

阅读更多
MarkItDown:LLMs 项目必备的强大工具包,已通过 OpenAI 和 Gemini 2.0 测试

MarkItDown:LLMs 项目必备的强大工具包,已通过 OpenAI 和 Gemini 2.0 测试

MarkItDown 是微软开发的一款多功能工具,可以将各种文件格式转换为 Markdown,使其成为从事大型语言模型(LLMs)开发人员的必备工具。无论您想利用文档进行微调还是创建提示前言,这都是您不可或缺的工具。让我们看看如何在 OpenAI 和 Gemini 模型的实际应用中利用它。 核心能力 该 [toolkit](https://github.com/microso

阅读更多
OpenAI O3模型:人工智能的新进展与挑战

OpenAI O3模型:人工智能的新进展与挑战

在快速发展的人工智能领域,OpenAI最新的模型O3引起了广泛关注。O3声称具备增强的推理能力和在基准测试中的出色表现,被视为相较于其前身的一次重大进步。但这对开发者、企业和更广泛的人工智能领域意味着什么呢?让我们深入探讨细节、现实世界的影响以及社区反应,以理解O3的真正影响。 什么是 O3? O3 是 OpenAI 的第三代大型语言模型 (LLM),旨在超越其前身的能力。除了

阅读更多
OpenAI 的 Swarm 和 Ollama(第 3 部分):利用本地 LLM 逐步构建数学求解器

OpenAI 的 Swarm 和 Ollama(第 3 部分):利用本地 LLM 逐步构建数学求解器

一个简短的代码参考供构建使用。 作为一名热衷于AI教育的开发者,我一直对如何使复杂问题解决变得更加互动和吸引人充满兴趣。 最近,我开始了一项实验,旨在将OpenAI的Swarm框架与Ollama的本地LLM部署结合起来。 我的目标?创建一个智能的数学辅导员,既像耐心的老师一样平易近人,又像经验丰富的审阅者一样细致入微。 我为什么构建这个:不仅仅是另一个数学求解器

阅读更多
将任何文档转化为人工智能就绪的 Markdown:微软 MarkItDown + Azure OpenAI 指南

将任何文档转化为人工智能就绪的 Markdown:微软 MarkItDown + Azure OpenAI 指南

开发者的实用指南:使用微软最新的开源工具与 Azure OpenAI 集成,将 PDF、Office 文件和图像转换为干净的 Markdown 微软的 MarkItDown 是一款由 AutoGen 团队开发的新开源工具,可以将各种文档格式转换为 Markdown。虽然该工具可以独立工作,但将其与 Azure OpenAI 集成可以增强其功能,特别是在图像处理任务方面。

阅读更多
使用 Markdown 和 Gemini 为 RAG 解锁 PDF

使用 Markdown 和 Gemini 为 RAG 解锁 PDF

可以说,检索增强生成(RAG)为许多企业和组织带来了变革。通过将像 Gemini 这样的 LLM 的内置功能与您自己的信息相结合,您可以创造出真正具有变革性的强大体验。 尽管如此,创建一个能够很好处理复杂非结构化文档(如 PDF)的 RAG 应用程序仍然是一个挑战。 **本文提出了一种从

阅读更多
Claude MCP引领智能代理时代的变革与应用

Claude MCP引领智能代理时代的变革与应用

最近我们听到了很多关于 AI 代理的消息,我也在测试其中的许多工具。兴奋感实际上始于几年前,像 AutoGPT 和 CrewAI 这样的工具。虽然它们的方法各不相同,但通常涉及 LLM 之间的相互通信以及使用外部工具。这些 **“工具” 本质上是

阅读更多
克劳德 MCP 是真正的代理时代的开端吗?第二部分

克劳德 MCP 是真正的代理时代的开端吗?第二部分

在之前的博客文章中,我谈到了 MCP 以及它如何使 Claude 不仅仅是一个聊天机器人,而是一个真正强大的助手,可以与您的本地应用程序进行交互,例如文件系统、Google Drive、您的电子邮件程序等。 让我们将理论付诸实践,测试快速摘要工具,它可以从任何给定的 URL 生成摘要。 在本演示中,摘要工具在 localhost:3009 本地运行。我们将使用 Puppeteer MCP

阅读更多
浏览器使用 + LightRAG 代理,可使用 LLM 抓取 99% 的网站!..!

浏览器使用 + LightRAG 代理,可使用 LLM 抓取 99% 的网站!..!

在这个故事中,我将提供一个快速教程,展示如何使用浏览器使用、LightRAG和本地LLM创建一个强大的聊天机器人,以开发一个能够抓取您选择的任何网站的AI代理。此外,您可以询问有关您的数据的问题,这将为您提供该问题的回答。免责声明:本文仅用于教育目的。我们不鼓励任何人抓取网站,特别是那些可能有反对此类行为的条款和条件的网络属性。现有的RAG系统存在显著的局限性,包括依赖扁平数据表

阅读更多
AutoGen:智能自动化的代理开放源码框架

AutoGen:智能自动化的代理开放源码框架

AutoGen是微软提供的一个开源框架,用于构建能够通过对话模式协作完成任务的智能体。AutoGen简化了AI开发和研究,支持多种大型语言模型(LLMs)、集成工具和先进的多智能体设计模式。您可以在本地开发和测试智能体系统,然后根据需求将其部署到分布式云环境中。 该框架允许开发者通过多个智能体构建LLM应用,这些智能体可以相互对话以完成任务。AutoGen智能体是可定制的、可对话的,并

阅读更多
使用 crewAI 构建多代理 LLM 系统:分步指南

使用 crewAI 构建多代理 LLM 系统:分步指南

多智能体简介使用 crewAI 的多智能体系统正在改变我们处理复杂决策的方式。通过整合多个人工智能智能体,这些系统实现了自主决策,正在革新医疗、金融和交通等行业。在本博客中,我们将深入探讨多智能体系统的世界,探索其应用、优势以及 crewAI 在这一创新技术中的角色。什么是多智能体系统?多智能体系统(MAS)由多个自主智能体组成,这些智能体相互作用

阅读更多
利用长期持久内存和原子代理打造更智能的人工智能代理

利用长期持久内存和原子代理打造更智能的人工智能代理

任何 AI 助手中最有用的功能之一无疑是拥有 持久的长期记忆。无论目标是了解用户更多信息、根据用户偏好调整 AI 的行为,还是记住重要事件,为您的 AI 助手 / 代理 / … 提供某种形式的 长期持久记忆存储 是实现这一目标的核心需求之一。 在我们深入之前:我们将使用 [Atomic Agents](https://github.com/Bra

阅读更多
深入了解 LlamaIndex 工作流程:事件驱动的 LLM 架构

深入了解 LlamaIndex 工作流程:事件驱动的 LLM 架构

实践后的进展与不足 最近,LlamaIndex 在其某个版本中引入了一个新功能,称为 Workflow,为 LLM 应用提供了事件驱动和逻辑解耦的能力。 在今天的文章中,我们将通过一个实际的迷你项目深入探讨这个功能,探索新内容和仍然不足之处。让我们

阅读更多
构建一个能写入 Google 文档的研究助手(第 2 部分)

构建一个能写入 Google 文档的研究助手(第 2 部分)

可能对你的作业有所帮助的工具 ***本文是两部分系列的第二部分,我们使用 LangGraph 和 Tavily 构建一个简单的研究代理,该代理可以撰写和完善短文。为了跟踪它生成的计划、文章和评论,我们增加了以编程方式创建和编辑 Google Docs 的能力。在第一篇文章中,我们构建了代理。现在我们将构建文档连接。你可以在 [这里](https://github.com/rma

阅读更多
建立一个能写入 Google 文档的研究代理(第 1 部分)

建立一个能写入 Google 文档的研究代理(第 1 部分)

可能帮助您完成作业的工具 ***本文是两部分系列的第一部分,我们将使用 LangGraph 和 Tavily 构建一个简单的研究助手,该助手编写和完善短文。为了跟踪它生成的计划、文章和评论,我们添加了程序化创建和编辑 Google Docs 的功能。在本文中,我们将重点关注助手,将文档连接的内容留到第二篇文章。您可以在 [这里](https://github.com/rmart

阅读更多
解开复杂的人工智能任务:使用 Gemini 2.0、LangGraph 和 Grounded Responses 的多步骤代理

解开复杂的人工智能任务:使用 Gemini 2.0、LangGraph 和 Grounded Responses 的多步骤代理

如何构建不仅理解复杂请求而且能够执行必要步骤以满足这些请求的 AI? 本文探讨了一种强大的解决方案:由 Gemini 2.0 和 LangGraph 框架驱动的多步骤 AI 代理。这些代理协调复杂的工作流程,并通过基于实际数据的响应增强其推理能力,从 Google 搜索、BigQuery 和第三方 API 获取真实世界的数据。 今日的挑战 第一个重大突破是 LLM。想象一下一

阅读更多
利用 ClientAI 和 Ollama 构建本地人工智能任务规划器

利用 ClientAI 和 Ollama 构建本地人工智能任务规划器

在本教程中,我们将使用 ClientAI 和 Ollama 构建一个 AI 驱动的任务规划器。我们的规划器将把目标分解为可执行的任务,创建现实的时间表,并管理资源——所有这些都在您的机器上运行。

阅读更多
使用 Ollama 构建代码分析助手:本地 LLM 分步指南

使用 Ollama 构建代码分析助手:本地 LLM 分步指南

想要一个完全在本地机器上运行的 AI 驱动代码审查工具吗?在这个两部分的教程中,我们将使用 ClientAI 和 Ollama 来构建这样一个助手。 我们的助手将分析 Python 代码结构,

阅读更多
利用提示自动执行日常任务和工作流程的 5 大 MCP 服务器

利用提示自动执行日常任务和工作流程的 5 大 MCP 服务器

自从 Anthropic 将 Model Context Protocol (MCP) 引入 Claude 以来,它彻底改变了我们自动化重复任务的方式。从文件管理到社交媒体工作流程,MCP 服务器 让您能够将 Claude 连接到强大的工具,如 GitHub、Slack 和 Google Maps。这些集成帮助您节省时间、简化工作流程,专注于最

阅读更多
顶点人工智能 Gemini 2.0 Flash 开发人员入门指南

顶点人工智能 Gemini 2.0 Flash 开发人员入门指南

Gemini 2.0 已经到来,带来了为这个新代理时代构建的下一代能力。Gemini 2.0 Flash 现在可以通过 [Vertex AI Gemini API](https://cloud.google.

阅读更多
如何根据自己的数据微调 Llama-3.2:详细指南

如何根据自己的数据微调 Llama-3.2:详细指南

介绍 Meta发布的Llama-3.2系列在开源AI领域标志着一个重要的里程碑。到目前为止,该系列中下载量最多的模型是臭名昭著的meta-llama/Llama-3.2–11B-Vision-Instruct。不幸

阅读更多
使用语言模型生成合成数据:实用指南

使用语言模型生成合成数据:实用指南

在人工智能不断发展的领域中,数据仍然是推动创新的燃料。但是,当获取真实世界数据变得困难、昂贵,甚至不可能时,会发生什么呢? 合成数据生成应运而生——这是一种开创性的技术,利用语言模型创建高质量、逼真的数据集。考虑在不违反隐私法的情况下对医疗记录进行语言模型训练,或者在没有私人对话记录的情况下开发客户互动模型,或设计自动驾驶系统,其中收集稀有边缘案例的数据几乎是不可能的。合成数据弥补了数

阅读更多
多代理协调中的角色扮演与对话范例

多代理协调中的角色扮演与对话范例

在多智能体编排框架的设计中,出现了一个显著的二分法,即角色扮演与对话两种主要范式。这些范式代表了在多智能体交互和任务执行中实现协作效率的不同方法。在本文中,我们将探讨这些范式的性质及其影响、推动其发展的力量,以及其他丰富多智能体编排领域的新兴方法。 但这真的是一个简单的二元对立吗? 当然不是!角色扮演框架,以 [CrewAI](https://readmediu

阅读更多
LLM 代理:多代理自生聊天

LLM 代理:多代理自生聊天

代理是经过定制的语言模型,通过系统提示使其以特定方式行为。提示通常详细说明任务类型、预期的任务解决行为和约束条件。通常情况下,代理由人类用户调用,每次交互都需要进行调节。但是,当代理 LLM 与其他代理互动时会发生什么?当代理能够访问额外工具时,例如读取额外数据源或执行程序代码时,代理又会如何表现? 本文探讨了使用 Autogen 框架的多智能体对话。探讨了三个方面:首先,您将了解不同

阅读更多
Pydantic AI + Web Scraper + Llama 3.3 Python = 强大的人工智能研究代理

Pydantic AI + Web Scraper + Llama 3.3 Python = 强大的人工智能研究代理

在这个视频中,我将快速演示如何使用 Pydantic AI、Web Scraper 和 Llama 3.3 创建一个多代理聊天机器人,以便为您的业务或个人使用构建一个强大的代理聊天机器人。 在检索增强生成(RAG)和基于大型语言模型(LLM)的工作流中,结构化输出提高了准确性和清晰度,使数据更易于理解。 我们许多人都知道验证或转换数据为正确格式是多么令人沮丧。当处理接口数据时,您会

阅读更多
生成式人工智能用户体验--为企业开发创新使用案例

生成式人工智能用户体验--为企业开发创新使用案例

实用设计创新 一个用于设计创新且合适的企业生成式AI体验的框架 为了创建用户会采用和使用的创新生成式AI体验,我们需要确保这些体验能够提供适当的响应。为此,这些体验需要接受如何运作的业务培训,如何进行评估,公司的目标、流程和过程,如何在不同情境中讨论公司,以及如何将活动如计划和项目相互关联。 消费者使用场景往往简单且专注于满足个人需求。复制简历美化体验并不能帮助企业

阅读更多
如何将人工智能和数据科学融入企业战略

如何将人工智能和数据科学融入企业战略

数据科学咨询 内部咨询指南:如何成功举办为期两天的高管研讨会“我们的行业不尊重传统——它只尊重创新。” — *Satya Nadella,微软首席执行官,2014年致员工的

阅读更多
如何在克劳德桌面应用程序上使用 MCP 工具并自动执行日常任务

如何在克劳德桌面应用程序上使用 MCP 工具并自动执行日常任务

Model Context Protocol (MCP) 是一种新的标准,用于在 AI 助手(如 Claude)和数据所在系统之间建立安全连接。这包括 代码仓库(Github, Gitlab)、API(Google Maps, Youtube, Brave)、业务工具(Slack, Notion, Bluesky)甚至您自己计算机上的 **本地

阅读更多
我对 ChatGPT 的新 o1 和 o1 专业模式的真实看法(附测试)

我对 ChatGPT 的新 o1 和 o1 专业模式的真实看法(附测试)

注意:在本文中,我将尽量涵盖与事件相关的所有要点以及我的个人看法。几天前,OpenAI 开始了他们的“12 Days of OpenAI”活动,带来了令人兴奋的消息:发布了一个新的 ChatGPT 模型,称为 o1,以及一个包括强大 o1 Pro 模式的高级订阅计划 ChatGPT Pro。 这一公告展示了 AI 在思考、解决问题、处理图像以及帮助完成编码和数学等复杂

阅读更多
使用 Python 免费构建营销专家聊天机器人!

使用 Python 免费构建营销专家聊天机器人!

使用 Python 和 DSPY 构建的营销聊天机器人 构建您的营销专家助手,专门用于回答您所有的营销相关问题,使用 Python 和 DSPy。***还不是会员?请随意访问完整文章 [here](https://readmedium.com/build-a-marketing-expert-chatbot-using-python-for-free-5fe04e0

阅读更多
ChatGPT Pro 和完整 o1 模型:您不容错过的新功能

ChatGPT Pro 和完整 o1 模型:您不容错过的新功能

OpenAI 发布了新模型和新的无限订阅计划! 最近,OpenAI 发布了以下推文,表示在接下来的12天里,每天都会添加新功能!真是一段旅程!让我们一起关注

阅读更多
GPT 4o- with Canvas:让我们创建一个金融流应用程序!

GPT 4o- with Canvas:让我们创建一个金融流应用程序!

使用 GPT-4o 和 Canvas 以及 Streamlit 创建金融应用 ChatGPT 今年发布了多个模型,因此有很多可以探索和利用的内容。 在本文中,我们将探索 GPT 4o 和 Canvas 模型,并构建一个预测股票价格的 Streamlit 应用。听起来很有趣,对吧?我也很兴奋,因为我在写作过程中也会尝试,所以让我们一起探索吧。 GPT 4o- wit

阅读更多
使用 Llamaindex 和 AI ChatBot 构建可投入生产的 Agentic 人工智能聊天机器人的简单分步指南。

使用 Llamaindex 和 AI ChatBot 构建可投入生产的 Agentic 人工智能聊天机器人的简单分步指南。

介绍 在本文中,我们将了解如何使用 Llamaindex 和 Groq-Llama 3.3 构建一个端到端的代理型 AI 聊天机器人。 在本文的课程中,您将学习:拨开代理型 AI 和代理的神秘面纱:消除围绕代理型 AI 的炒作 了解 Llamaindex 中的 ReActAgent 和 FunctionCallingAgent 以及如何添加工具/函数 一个简

阅读更多
掌握 CrewAI:第 1 章 - 您的第一个智能工作流程

掌握 CrewAI:第 1 章 - 您的第一个智能工作流程

代理和任务的基础 CrewAI 是一个平台,允许我们创建和管理 AI 代理团队。它提供企业级和开源解决方案。在这篇博客文章中,我们将深入探讨开源 CrewAI,当然。 那么,代理到底是什么? 代理被建模以模拟人类在解决问题、执行任务和互动中的行为。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v

阅读更多
OpenAI 第 4 天:Canvas 向所有人开放,扩大协作式人工智能工具的使用范围 | 作者:Raju Singh | 2024 年 12 月 | Medium

OpenAI 第 4 天:Canvas 向所有人开放,扩大协作式人工智能工具的使用范围 | 作者:Raju Singh | 2024 年 12 月 | Medium

2024 年 12 月 10 日,OpenAI 继续其“12 天 OpenAI”活动,宣布全面发布 Canvas,这是一款专为写作和编程设计的协作工具,现在所有用户都可以使用。最初仅提供给 ChatGPT Plus 和 Team 订阅用户,Canvas 现在对免费用户开放,将先进的 AI 辅助功能带给更广泛的受众。 让我们看看第 4 天带来了什么。 第4天宣布了什么?

阅读更多
CrewAI:由人工智能代理组成的个人军队,为您协同工作

CrewAI:由人工智能代理组成的个人军队,为您协同工作

CrewAI框架是什么? AI协作的力量有太多值得提供的。CrewAI旨在使AI代理能够承担角色、共享目标,并以一个紧密合作的单位运作——就像一支运转良好的团队。无论您是在构建智能助手平台、自动化客户服务团队,还是多代理研究团队,CrewAI都为复杂的多代理交互提供了基础。 换句话说,CrewAI是一个代理框架,允许我们创建代理来帮助我们解决简单(优化)或复杂的任务(例如开发

阅读更多
克劳德的新款 3.5 Sonnet 性能超过了 OpenAI 的 O1-mini。我很震惊。

克劳德的新款 3.5 Sonnet 性能超过了 OpenAI 的 O1-mini。我很震惊。

Claude更新的3.5 Sonnet模型的并排比较 当OpenAI发布GPT-4o时,我充满期待……但很快就失望了。尽管GPT-4o比GPT-4更快且成本更低,但其表现明显不如前者。如果不考虑成本,原始的GPT-4(和Claude 3.5)显然是更好的模型。 今天,Anthropic发布了更新的3.5 Sonnet模型。像Reddit这样的在线社区对此赞不绝口,解释它比之前的版

阅读更多
更智能、更快速:OpenAI o1 和 o1 pro 模式

更智能、更快速:OpenAI o1 和 o1 pro 模式

就在12小时前,OpenAI推出了新的o1模型和带有专业模式的o1。如您所知,o1模型是首个在回答之前进行思考的模型系列,提供更详细和准确的响应,特别是在数学、编码和研究方面。 人们关注两件事:多模态性和解决难题,而这些新模型在这两个领域表现出色。[非会员链接。](https://readmedium.com/smarter-and-faster-openai-o1

阅读更多

利用 CrewAI 为自动化 EDA 构建人工智能代理协作框架

引言:数据探索的新纪元 在当今这个数据驱动的世界中,企业不断寻求从庞大的数据集中提取可操作的洞察。传统上,这项任务一直是熟练数据科学家的领域,他们花费大量时间探索和分析数据。但如果我们能够自动化这个过程呢?如果一个由人工智能驱动的系统能够对数据提出有见地的问题,彻底分析数据,并呈现详细报告——所有这些都只需最少的人为干预?这正是我们的项目旨在通过利用CrewAI代理框架来实现的目标。

阅读更多
CrewAI 的任务工具与代理工具:您必须知道的区别

CrewAI 的任务工具与代理工具:您必须知道的区别

在 CrewAI 中,工具本质上是代理可以利用的技能或功能,以执行各种操作。可以将其视为为您的 AI 代理提供一个装满专业工具的工具箱。这些工具在扩展 CrewAI 代理的能力方面至关重要,使他们能够承担广泛的任务并有效协作,例如访问互联网、查询数据库中的数据或运行 Python 代码。 CrewAI 提供了灵活性,您可以以多种方式为代理配备工具:**A) 代理

阅读更多
CrewAI 示例项目 - AI 技术博客

CrewAI 示例项目 - AI 技术博客

在本教程中,基于 AI 的博客写作助手为内容创作者开发,使用 CrewAI 平台。该项目的结构旨在自动提供和建议用户在创建技术博客文章时可能需要的基本和高级信息。这种方法旨在减轻内容创作者的工作负担,提高质量,并确保一致性。 目标开发一个人工智能驱动的系统,以加快用户创建技术博客文章的过程。 通过扫描谷歌上最受欢迎和最新的发展来创建博客文章。 通过提高内容质量来帮

阅读更多
CrewAI 和 Criteo API - 第 1 部分

CrewAI 和 Criteo API - 第 1 部分

介绍 本文是一个系列的第一篇,展示如何使用CrewAI和Criteo API。我们将看到如何获取凭证,使用这些凭证获取访问令牌,并使用该令牌调用端点以获取账户、零售商和品牌,所有这些都来自CrewAI团队。CrewAI 是一个 “最先进的框架,用于协调角色扮演的自主AI代理。通过促进协作智能,CrewAI使代理能够无缝协作,处理复杂任务。”***C

阅读更多
CrewAI 实例教程:使用人工智能代理自动创建 YouTube 频道(第 3/4 部分)

CrewAI 实例教程:使用人工智能代理自动创建 YouTube 频道(第 3/4 部分)

在上一篇文章中,我们探讨了我们打算构建的 AI 系统的前几个元素。本文将继续介绍剩余元素的 CrewAI 代码,以实现所需的 AI 系统。请查看本教程系列的[Git

阅读更多
LLM 代理:CrewAI 简介

LLM 代理:CrewAI 简介

由 LLM 驱动的代理框架承诺将自主任务解决提升到前所未有的水平。与其说是僵化的编程,不如说 LLM 反映任务、利用工具,并检查彼此的输出以创造性地解决任务。 这篇博客文章探讨了使用 CrewAI 框架开发的 LLM 代理。文章首先以纯 Python 和 YAML 文件的基本定义开始。然后展示了现有的预定义工具以及如何使用它们,还包括如何实现自定义工具。作为一个运行示例,开发了一个代理

阅读更多
利用 CrewAI Flows 实现人工智能工作流程自动化

利用 CrewAI Flows 实现人工智能工作流程自动化

CrewAI CrewAI 是一个尖端的 Python 框架,用于协调角色扮演和自主 AI 代理。通过构建“团队”由专业代理,我们可以自动化任务、生成创意文本格式,并以全新的方式访问信息。本文将指导您如何使用 CrewAI 的 Flow 功能创建简单项目。 流程 CrewAI 流程是一个强大的功能,旨在简化 AI 工作流程的创建和管理。流程允许开发人员与多个任务和团队协

阅读更多
如何使用 CrewAI 从任务和流程的角度思考问题

如何使用 CrewAI 从任务和流程的角度思考问题

自动化使用 CrewAI 中的代理、任务和工具需要了解的事项 技术研究: 我们在机器上有一些例行任务。我是新技术的热心学习者。这意味着 YouTube 是我收集技术主题视频的最爱去处,并以 2 倍速观看。 [(YT 链接收集的代码在这里)](https://github.com/insightbuilder/codeai_fusion/blob/main/crews_fl

阅读更多
如何使用 LangChain 和 CrewAI 构建人工智能驱动的 SQL 数据分析代理

如何使用 LangChain 和 CrewAI 构建人工智能驱动的 SQL 数据分析代理

在当今数据驱动的世界中,自动化数据提取、分析和报告的工作流程对于节省时间和提高效率至关重要。本教程将指导您使用 LangChain 和 CrewAI 构建一个 AI 驱动的 SQL 工作流程。通过集成强大的 Llama 3 模型、SQL 数据库工具和基于代理的自动化,您将学习如何创建一个无缝的管道,以处理数据库查询、分析结果和生成高管报告 — 所有这些都需要最少的手动干预。无论您是数据爱好者

阅读更多
选择合适的人工智能代理框架:LangGraph vs CrewAI vs OpenAI Swarm

选择合适的人工智能代理框架:LangGraph vs CrewAI vs OpenAI Swarm

对使用 3 种不同框架构建的相同 Agentic Finance 应用程序进行深入比较。 我们将涵盖的内容什么是代理? 深入了解我们如何定义代理,以及它们与AI管道和独立LLM的区别。 使用3个流行的代理框架构建的实践示例: LangGraph、CrewAI和OpenAI Swarm([完整代码](https://github.com/relari-a

阅读更多
OpenAI 的 O1 和 O1 Pro 模型:以推理为重点的人工智能新时代

OpenAI 的 O1 和 O1 Pro 模型:以推理为重点的人工智能新时代

近年来,人工智能取得了显著进展,大型语言模型从简单的文本生成器演变为能够处理高级推理任务的强大系统。像GPT-4o这样的模型展示了令人印象深刻的语言流利性和一般知识,但直到现在,它们在更具挑战性的问题解决场景中仍然面临困难——例如高级数学、复杂的编程难题和复杂的科学探究。 OpenAI新推出的O1模型系列旨在改变这一格局,强调深度推理。与之前主要关注速度和广泛覆盖的模型不同,O1在产生

阅读更多
OpenAI o1 和 ChatGPT Pro 已发布:智能人工智能工具的未来

OpenAI o1 和 ChatGPT Pro 已发布:智能人工智能工具的未来

OpenAI 发布了 OpenAI o1 模型,并推出了一个高级订阅层级 ChatGPT Pro,旨在为高性能专业使用提供支持。这些进展有望重新定义我们在个人、专业和组织层面与 AI 的互动方式。 什么是 OpenAI o1? [OpenAI o1](https:/

阅读更多
代码审查中的人工智能

代码审查中的人工智能

我们都知道,少量的上下文可以完全改变我们对 AI 模型的回答。这不仅限于 AI,人类的运作方式也是如此。同样的原则适用于编码。如果没有上下文,代码审查可能会偏离目标。传统的方法往往关注表面问题,而更深层次、更复杂的问题却被忽视。 这就是 基于 AI 的代码审查 的作用。通过引入先进的人工智能,这些审查可以对问题有更深刻的理解,将例行检查转变为战略资产。基于 AI 的代码审查者可以彻

阅读更多
从处方到语音:帮助服务老年人和视障人士的 Python 解决方案...

从处方到语音:帮助服务老年人和视障人士的 Python 解决方案...

学习如何构建一个结合OCR、计算机视觉和谷歌文本转语音的Fast API后端解决方案,以读取处方标签 在正常情况下,阅读处方药物上的标签不应该是一个具有挑战性的任务。通常,最重要的指示——剂量,通常会以粗体字打印,如:“每天需要时服用1.5片,分3次服用”另一方面,考虑到视觉障碍和/或老年患者的异常情况。他无法在没有帮助的情况下阅读他的处方标签。 作为

阅读更多
利用 LangGraph 和代理优化工作流程效率:关键功能、用例和集成...

利用 LangGraph 和代理优化工作流程效率:关键功能、用例和集成...

在生成式 AI 和大型语言模型(LLMs)的背景下,agents 和 LangGraph 是增强 LLM 功能的工具和框架,使它们能够以更灵活和结构化的方式执行任务、做出决策或与复杂工作流程进行交互。以下是每个概念的详细说明及其应用示例。 什么是 LLM 中的代理? 代理是与 LLM 一起工作的自主程序或组件,能够根据提示和用户输入执行任务、做出决策或与环境互动

阅读更多
人类学的 MCP 将让你大开眼界

人类学的 MCP 将让你大开眼界

相信我,这不是点击诱饵,MCP将彻底改变AI交互的方式 AI技术正在快速发展。 你可能在等待最新的模型,如GPT-5、Gemini 2或Claude 4,但有一件重要的事情需要知道——今天AI的真正力量不仅仅在于拥有最新的模型。 而在于我们如何将这些AI模型与周围的世界连接起来。 在于给予它们正确的工具、数据和上下文,以帮助它们更好地理解。 这就是Anthropic的***模型上下

阅读更多
使用人工智能提取和分析您的 Chrome 浏览器历史记录

使用人工智能提取和分析您的 Chrome 浏览器历史记录

有没有想过您的浏览历史对您说了什么?无论您是想了解自己的在线习惯,反思自己的工作效率,还是需要记录自己的活动,分析浏览历史都能提供有价值的见解。在本文中,我们将探讨如何提取您的 Chrome 浏览历史,并利用 AI 进行聚类和分析。我们将介绍一种无代码的方法以及一种更技术性的方式,适合那些熟悉命令行的用户。 为什么浏览历史? 在之前的帖子中,我讨论了使用 Logseq 或 Obsi

阅读更多
你准备好迎接人工智能的未来了吗?OpenAI 的 Swarm 可能会改变一切

你准备好迎接人工智能的未来了吗?OpenAI 的 Swarm 可能会改变一切

学习如何配置和个性化 OpenAI 的 Swarm 框架,以创建强大的、协作的多代理系统,满足您的独特需求并推动更智能的自动化 想象一个复杂问题不是由单一 AI 而是由一个团队的智能代理无缝协作解决的世界。OpenAI 的 Swarm 使这一愿景成为现实。它是一个开创性的框架,利用 LLM 的力量创建一个协作的系统,其中每个代理都有独特的角色。 无论是自动化耗时的工作流程、解决多

阅读更多
探索人工智能代理格局:深入分析 Autogen、CrewAI、LlamaIndex 和 LangChain...

探索人工智能代理格局:深入分析 Autogen、CrewAI、LlamaIndex 和 LangChain...

本文将为您提供清晰的可视化,帮助您在开发“代理应用程序”时选择适合您业务用例的框架或工具。 介绍 在快速发展的人工智能领域,一种新的范式正在出现,这种范式承诺将彻底改变我们与AI系统的互动和利用方式:AI代理。这些复杂的软件实体代表了从传统的单一目的AI模型到动态协作系统的根本转变,这些系统能够通过协调努力和专业知识解决复杂挑战。 本综合指南探讨了四个塑造AI代理未来的领先框架:A

阅读更多
Anthropic 的克劳德人工智能现在可以复制你的写作风格

Anthropic 的克劳德人工智能现在可以复制你的写作风格

我作为多个组织的AI大使已经工作了几个月,如果有一个问题是大多数用户不断询问的,那就是如何让AI聊天机器人像他们一样写作。基本上,他们希望像ChatGPT、Claude和Gemini这样的聊天机器人能够模仿他们的写作风格,这样他们就不必每次都给AI提供详细的指示。 我总是告诉用户,他们可以通过两种方式做到这一点:简单的方法: 创建一个自定义聊天机器人,添加指示,例如以

阅读更多
5 分钟内构建财务报告分析器:LlamaIndex + 毕马威会计师事务所案例研究

5 分钟内构建财务报告分析器:LlamaIndex + 毕马威会计师事务所案例研究

在当今快速变化的金融世界中,快速而准确地从冗长的报告中提取有意义的见解至关重要。随着生成性人工智能的出现,我们现在拥有强大的工具来自动化和增强这一过程。在本文中,我将带您了解如何使用LlamaIndex构建一个复杂的财务报告分析系统,以KPMG关于财务报告中人工智能的报告作为我们的测试案例。如果您对提高生产力和机器学习技能的实用技巧感兴趣,请随时订阅我们的[LinkedIn页面]

阅读更多
Langflow 1.1 发布

Langflow 1.1 发布

对代理管道的愉快邀请! 🚀 我们很高兴地分享 Langflow 1.1!此版本包含使 genAI 开发更加灵活、互动和愉快的更新。无论您是在构建语言模型管道、开发 RAG 系统,还是深入多代理编排,Langflow 1.1 都提供了强大的增强功能,让您的项目更上一层楼。让我们深入了解新内容吧! 全新视角:重新设计的用户界面 Langflow 1.1 引入了全新

阅读更多
掌握人工智能代理:CrewAI 和 Google Search API 实用指南

掌握人工智能代理:CrewAI 和 Google Search API 实用指南

你知道最近大家都在谈论 AI 代理吗?它们在各个行业层出不穷,承诺改变工作方式。但说实话,试图理解这一切是如何运作的,确实让人感到不知所措。我也曾有过这种感觉——在一片流行词汇、新技术和随之而来的行话中迷失,直到我看到了 CrewAI。亲身体验 CrewAI 让我觉得 AI 代理变得实用而不再令人畏惧。如果你和我一样,是个被 AI 热潮淹没的技术爱好者,我的 CrewAI 体验可能会帮助

阅读更多
使用 LangGraph 框架以多代理方式实施复杂的 LLM 应用程序

使用 LangGraph 框架以多代理方式实施复杂的 LLM 应用程序

将LangGraph添加到您的GenAI相关技能库中。这项技能可以立即使您能够创建复杂的AI系统。当然,前提是您需要了解LangChain的使用方法。介绍 LangGraph 是一个强大的工具,旨在使用大型语言模型 (LLMs) 创建有状态的多参与者应用程序。通过扩展 LangChain 库的功能,LangGraph 使得多个链(或参与者)能够在各种计算步骤中以循环方式进

阅读更多
构建人工智能代理,实现企业级软件开发自动化:实用视角

构建人工智能代理,实现企业级软件开发自动化:实用视角

Randy Zhang 和 Shamin Aggarwal Agentic AI 是一款基于大型语言模型(LLMs)的软件应用,通过模拟类人推理和决策来自动化任务。它在自动化小型和简单脚本的软件开发方面显示出了显著的能力 [1]。AI 代理能否用于自动化企业级软件开发?在大型复杂的软件开发环境中,我们会遇到什么样的挑战? 企业级软件项目通常是旨在满足复杂业务需求的大规模软件开发计划。这

阅读更多
实践:使用 LangGraph 构建代理工作流(Langchain-academy 的主要学习内容) | 第 1 部分

实践:使用 LangGraph 构建代理工作流(Langchain-academy 的主要学习内容) | 第 1 部分

介绍 Langchain 最近推出了一门令人印象深刻的课程,专注于 LangGraph 及其在开发强大的代理和多代理工作流中的关键特性。 在本系列中,我们将探索课程中的基本见解,并创建利用代理工作流的应用程序。在第一部分中,我们将涵盖 LangGraph 的基本概

阅读更多
使用光标人工智能实现简单的 YouTube 视频摘要应用程序

使用光标人工智能实现简单的 YouTube 视频摘要应用程序

介绍 Cursor AI 正在通过将先进的人工智能集成到熟悉的编码环境中,彻底改变软件开发。作为 Visual Studio Code (VS Code) 的一个分支,Cursor AI 保留了开发者所喜爱的用户友好界面和广泛的生态系统,同时通过 OpenAI 的 ChatGPT 和 Claude 等模型增强了功能。

阅读更多
阿里巴巴 QwQ:比 OpenAI-o1 更适合推理?

阿里巴巴 QwQ:比 OpenAI-o1 更适合推理?

32b 开源模型超越 o1 mini,并与 o1-preview 竞争 几天前,阿里巴巴发布了 Marco-o1,一个 7b 推理模型。现在,他们又发布了一个改进版本,称为 QwQ,甚至超越了 OpenAI-o1 mini,并与 o1-preview 持平。最棒的是什么? 它是开源的 什么是 Alibaba QwQ-32b-preview? QwQ-32B-

阅读更多
阿里巴巴 Marco-o1:OpenAI-o1 的开源替代品

阿里巴巴 Marco-o1:OpenAI-o1 的开源替代品

LLM用于开放式问题 OpenAI-o1 是一次革命性的发布,使 LLM 能够对复杂任务进行详细推理,例如数学或物理问题,而不仅仅局限于通用文本生成。 但 OpenAI-o1 是收费的 正如预期的那样,开源竞争者并不遥远,而再次是阿里巴巴(在 Qwen 系列之后)最近推出了 Marco-o1。 什么是 Alibaba 的 Marco-o1? Marco-o1

阅读更多
自动求职:人工智能一夜之间申请 1000 个职位,获得 100+ 个面试机会!

自动求职:人工智能一夜之间申请 1000 个职位,获得 100+ 个面试机会!

在当今快节奏和竞争激烈的就业市场中,寻找和获得理想工作既耗时又令人疲惫。这个过程通常涉及无休止的浏览职位列表、定制每一份申请以及重复填写表格——所有这些都可能导致求职疲劳和错失机会。这里有Auto_Jobs_Applier_AIHawk,您的AI驱动求职助手,旨在自动化申请过程,提供个性化推荐,并显著提高您获得心仪职位的机会。 本综合指南将带您了解有关Auto_Jobs

阅读更多
使用 Llama 3.2 构建强大的本地人工智能网络搜索助手:

使用 Llama 3.2 构建强大的本地人工智能网络搜索助手:

将大型语言模型与实时网络搜索相结合,以获取最新答案和上下文相关见解 👨🏾‍💻 GitHub ⭐️ | 👔 LinkedIn | 📝 [Medium](https://medium.com/@monsuraliran

阅读更多
比较人工智能编码平台:用于关键视觉生成系统的 Cursor、V0、Bolt.new 和 Windsurf

比较人工智能编码平台:用于关键视觉生成系统的 Cursor、V0、Bolt.new 和 Windsurf

随着基础模型(如VLMs,例如Minimax、Qwen-V)和尖端图像生成技术(如Flux 1.1)的快速发展,我们正进入一个创造性可能性的新纪元。结合像T5这样的模型以增强对潜在空间中文本提示的理解,这些工具使得生产广告级别的关键视觉(KVs)成为可能,且具有显著的真实感。在我们组织中,我们测试了结合这些模型生成高质量KVs的潜力。我的任务是开发一个KV生成系统,能够复制特定风格,利用

阅读更多
Codiums Windsurf:最佳光标对手

Codiums Windsurf:最佳光标对手

你知道在代码中平衡速度、效率和创新的挑战。Codium最新发布的Windsurf彻底改变了游戏。被称为“最佳Cursor竞争者”,这个新的集成开发环境(IDE)结合了速度、智能和无与伦比的API支持。无论你是深入复杂项目还是为你的初创公司优化代码,Windsurf都承诺成为一个改变游戏规则的工具。 现在,让我们来看看为什么*W

阅读更多
Anthropic 的模型上下文协议 (MCP) 是我们期待已久的互操作性标准吗?

Anthropic 的模型上下文协议 (MCP) 是我们期待已久的互操作性标准吗?

向Anthropic团队致敬!他们不断推出新功能,吸引了开发者社区的关注。首先是Artifacts,然后是Computer Use。现在,他们又推出了另一个突破性的新增功能:模型上下文协议(MCP)。 模型上下文协议(MCP)引入了一种标准化的方法,以实现AI应用程序、数据源和

阅读更多
微软 Magentic-One 代理框架介绍

微软 Magentic-One 代理框架介绍

一个可以执行复杂任务的多智能体系统 大约一周前,微软发布了一种名为 Magentic-One 的新智能体系统,旨在“解决复杂任务”,这似乎完全没有引起注意。在最近关于Anthropic计算机使用能力的热议中,微软似乎希望重新确立其在这一领域的信誉。 在本文中,我们将介绍Magentic-One,解释其能力,并讨论如何使用它来完成有用的工作。 根据微软自己的公告(文章

阅读更多
Magnetic-One 如何重新定义多代理人工智能系统

Magnetic-One 如何重新定义多代理人工智能系统

如果你像我一样,总是对 AI 的发展充满好奇,你会知道我们已经到了一个单一模型无法解决高度复杂任务的阶段。引入 Magnetic-One,微软研究院的多智能体 AI 系统,最近引起了广泛关注。我花了一些时间来探索它,相信我,这不仅仅是另一个流行词——它确实有真正的潜力。 以下是我对 Magnetic-One 突出的看法,它如何与我的问题解决方法相一致,以及最重要的,你如何让

阅读更多
使用 Magentic-One 多代理人工智能系统阅读文档和编码功能

使用 Magentic-One 多代理人工智能系统阅读文档和编码功能

Magentic-One 旨在通过利用多个具有专业能力的 AI 代理来简化复杂任务。我之前的一篇文章 也介绍了 Magentic-One。最近,我开始开发一个移动应用程序(名为“MotionLab”),

阅读更多
AI for BI:利用 CrewAI 和 OpenAI 构建商业信息报告

AI for BI:利用 CrewAI 和 OpenAI 构建商业信息报告

如何直接从CSV数据创建简单的BI报告 商业信息应用程序帮助企业将数据作为资源来做出关键决策,我们将利用AI构建一个这样的应用。 AI必将越来越多地在BI工具中发挥作用;更具体地说,基于LLM的应用程序将使BI应用能够创建可视化,通过数据分析提供洞察,并自动化商业报告。 因此,在本文中,我们将探讨LLM应用如何帮助创建商业信息。它不会是一个全面的BI应用;然而,它将直接从数

阅读更多
构建动态多代理工作流:利用 LangChain 和 LangGraph 实现人工智能协作

构建动态多代理工作流:利用 LangChain 和 LangGraph 实现人工智能协作

本文利用 LangChain 和 LangGraph 创建一个简单的多智能体系统。智能体协同工作以完成任务。第一个智能体生成一系列随机数字,第二个智能体将这些数字乘以 10。每个智能体使用 OpenAI 的 GPT-4o API 来执行这些任务。 本文遵循基于工作流的架构,智能体根据分配的任务进行交互。在这篇文章中,我们将逐步分析脚本的每个部分以及它如何为整体流程做出贡献。

阅读更多
使用 CrewAI 构建多代理系统

使用 CrewAI 构建多代理系统

AI代理正在通过独立分析数据、做出预测和推荐最佳行动来改变各个行业。这些智能程序不仅擅长独立执行任务,还在与其他代理协作方面表现出色,使它们在销售、市场营销和教育等领域成为宝贵的资产。 例如,在市场营销中,AI代理可以评估客户偏好,识别个人兴趣,并制定个性化的活动,以促进客户参与和满意度。在教育中,这些代理同样可以被利用来个性化学习路径,通过将课程与学生的独特需求和目标对齐来增强教育体

阅读更多
利用 LangGraph 和 OpenAI 打造代理金融分析师

利用 LangGraph 和 OpenAI 打造代理金融分析师

在股票交易的世界中,投资者依赖各种工具和方法来做出明智的决策。其中一种方法是 基本面分析,它评估公司的财务健康状况和股票表现,以提供可操作的见解。随着 AI 和机器学习的进步,股票分析现在可以在很大程度上实现自动化。在这篇文章中,我们将探讨如何使用 LangChain、LangGraph 和 Yahoo Finance 创建一个 股票表现分析代理,利用实时股票数据和关键技

阅读更多
打造未来:使用 LangGraph 开发自己的语音助手

打造未来:使用 LangGraph 开发自己的语音助手

今天,语音助手已经发展成为智能系统中需要先进自然语言处理的基本组成部分。本文提供了使用 LangGraph 开发语音助手的技术指南,LangGraph 是一个旨在管理复杂代理系统的编排框架。在整个文本中,我们将探讨 LangGraph 如何实现多个节点的协调,从而创建高效且高度可扩展的流程。本指南面向希望利用 LangGraph 功能在 AI 环境中实施解决方案的开发者。 什么是 L

阅读更多
使用 LangGraph 和 Waii 进行复杂 SQL 连接

使用 LangGraph 和 Waii 进行复杂 SQL 连接

在快速发展的数据分析领域,通过自然语言与数据互动的能力变得愈发重要。会话式分析旨在使复杂的数据结构对没有专业技术技能的用户更易于访问。 LangGraph 是一个用于构建有状态的多代理应用程序的框架,使用语言模型。Waii 提供文本到 SQL 和文本到图表的功能,使与数据库和数据可视化的自然语言交互成为可能。 本文探讨了 Waii 的功能如何增强 LangGraph 应用于会话式分析

阅读更多
面向真实世界应用的高级代理人工智能设计考虑因素

面向真实世界应用的高级代理人工智能设计考虑因素

从基于课堂的代理到语言链代理 随着人工智能(AI)系统的发展,代理人工智能的概念——即由模块化、特定任务的代理协作工作的AI系统——已成为可扩展和可适应AI解决方案的基石。本文探讨了代理人工智能背后的设计考虑,研究了代理、工具、记忆、状态和规划如何结合在一起创造智能工作流。我们将比较三种实现——CODE1、CODE2和CODE5——以揭示其中的实用性

阅读更多
从零到英雄:使用 LangGraph 快速构建智能聊天机器人

从零到英雄:使用 LangGraph 快速构建智能聊天机器人

在这个全面的快速入门指南中,我们将使用 LangGraph 构建一个支持聊天机器人,它可以:通过搜索网络回答常见问题 在调用之间保持对话状态 将复杂查询路由到人工进行审查 使用自定义状态来控制其行为 回溯并探索替代对话路径我们将从一个基本的聊天机器人开始,逐步添加更复杂的功能,同时介绍关键的 LangGraph 概念。

阅读更多
如何使用 LangGraph 构建人工智能代理:分步指南

如何使用 LangGraph 构建人工智能代理:分步指南

介绍 在人工智能的世界中,检索增强生成(RAG)系统已成为处理简单查询和生成上下文相关响应的常用工具。然而,随着对更复杂的人工智能应用需求的增长,出现了超越这些检索能力的系统的需求。AI代理应运而生——这些自主实体能够执行复杂的多步骤任务,在交互中保持状态,并动态适应新信息。LangGraph,作为LangChain库的强大扩展,旨在帮助开发人员构建这些先进的AI代理,通过启

阅读更多
如何利用人工智能制作更可靠的报告--技术指南

如何利用人工智能制作更可靠的报告--技术指南

技术指南,分享我与AI合作的经验 在过去的一年里,我一直在经营自己的AI软件开发和咨询公司,与各种客户合作——从创业公司创始人到学术界人士。在此期间,我承担了来自多个领域的项目,包括数字营销、SaaS和网络安全。尽管每个项目的目标和目的各不相同,但一个共同的请求是需要使用AI为利益相关者或最终客户创建可靠的报告。几乎所有客户在项目中都有一个里程碑是制作报告。 通过这些经验,我

阅读更多
用于医疗保健的 LangGraph:综合技术指南

用于医疗保健的 LangGraph:综合技术指南

构建生产就绪的医疗运营代理 LangGraph简介什么是 LangGraph? LangGraph 是一个 Python 库,旨在构建具有状

阅读更多
LangGraph Studio:您的第一个代理 IDE

LangGraph Studio:您的第一个代理 IDE

LangGraph Studio 是一个开创性的代理集成开发环境,用于生成和控制代理 AI 应用程序。这个 [IDE 是由 LangChain 引入的](https://bakingai.com/blog/langgraph-studio-ai-agen

阅读更多
LangGraph:高级多代理工作流的未来

LangGraph:高级多代理工作流的未来

人工智能的世界正在迅速发展,像 LangChain 和 LangGraph 这样的工具处于使开发者高效构建智能系统的前沿。如果你听说过 LangGraph,但不确定它是什么或如何充分利用它的潜力,这个指南适合你。 在这篇全面的文章中,我们将涵盖你需要了解的关于 LangGraph 的所有内容——从其核心概念到实际应用。无论你是初学者还是高级开发者,这个指南将帮助你理解为什么 LangGra

阅读更多

掌握 LangGraph:人工智能系统、RAG、代理和工具终极指南

您是否希望深入了解 LangGraph,这一 AI 技术的最新热词?无论您是开发者、学生还是技术爱好者,理解 LangGraph 及其相关概念,如 AI 助手、检索增强生成(RAG)、代理和工具,对于构建更智能、更互动的 AI 系统至关重要。在本文中,我们将分解 LangGraph 的基本内容,探索关键特性,并逐步指导您构建实用项目。 目录*什么是 LangGraph?

阅读更多
OpenAI Swarm vs LangChain LangGraph:多代理框架详解

OpenAI Swarm vs LangChain LangGraph:多代理框架详解

Ankush k Singal 介绍 人工智能的世界正在迅速发展,创建涉及多个代理的复杂工作流程的能力变得越来越重要。在这个领域中,OpenAI Swarm 和 LangChain LangGraph 是两个备受关注的框架。本文将深入探讨这两个框架,探索它们的功能、优势和理想用例,以帮助您决定哪个框架可能

阅读更多
使用 O1、GPT4o 和 Mini | ExtractThinker 扩展文档提取功能

使用 O1、GPT4o 和 Mini | ExtractThinker 扩展文档提取功能

在本文中,我们将探讨如何高效地使用 ExtractThinker 来处理大规模文档。我们将讨论何时使用不同的模型,如 O1、GPT4o 及其迷你版本,如何处理 OCR,提取图表,并使用异步批处理管理重负载。 ExtractThinker 介绍 是一个灵活的文档智能库,帮助您从各种文档中

阅读更多
六顶思考帽 + CrewAI 流程:利用人工智能农业做出更明智的决策

六顶思考帽 + CrewAI 流程:利用人工智能农业做出更明智的决策

“当时看起来是个好主意。”- 摘自 *大西部七侠*利用AI代理进行明智决策 “当时看起来是个好主意。”这句台词借自《七侠荡寇志》,常常是我们在反思过去决策时的共同感受。有时,我们不禁想,如果有更多的信息,是否能帮助我们做出更好的选择。但是,我们到底是如何做出决策的呢?我们依赖于自己的知识——存储在脑海中的信息,也许是经过索引和归档的——以及专家的见解。但

阅读更多
我应该使用哪种人工智能代理框架?(CrewAI、Langgraph、Majestic-one 和 pure code)。

我应该使用哪种人工智能代理框架?(CrewAI、Langgraph、Majestic-one 和 pure code)。

随着大型语言模型的进步,人工智能模型现在能够对问题进行推理。起初,我们认为这些模型无法完成我们的工作,因为它们似乎只是搜索引擎的聊天机器人版本,我们能够用简单的推理来欺骗这些模型,但这变得越来越困难。这些大型语言模型现在能够逐步思考,并完成比简单回答问题更复杂的任务。 大型语言模型是通过预测前一个标记的下一个标记进行训练的。标记可以是单词、字符或称为子词的字符组。从这个结构,OpenA

阅读更多
2025 年成为人工智能工程师的终极路线图

2025 年成为人工智能工程师的终极路线图

介绍:乘风破浪的人工智能 世界正经历一场人工智能的淘金热,像谷歌、特斯拉和亚马逊这样的公司正在向人工智能投资数十亿美元。对于那些有抱负的人来说,人工智能工程师的角色已成为最有前途的职业之一,融合了尖端技术、解决问题的能力和创造力。如果你准备好迎接这个挑战,这份指南将带您通过逐步的、按周的路线图,帮助您在2025年开启人工智能职业生涯。 这份路线图提供了一个详细、现实的8个月学习

阅读更多
新版 Claude 3.5 可以控制计算机:在编码方面超越 o1,重新定义代理能力

新版 Claude 3.5 可以控制计算机:在编码方面超越 o1,重新定义代理能力

Anthropic的突破性AI,Claude 3.5,像人类一样使用计算机,并在自动化领域成为游戏规则改变者 作者杨子健 (ORCID: 0009–0006–8301–7634)

阅读更多
[ChatGPT vs Claude]Cursor + Claude 3.5 如何颠覆科技行业?5 个疯狂的使用案例

[ChatGPT vs Claude]Cursor + Claude 3.5 如何颠覆科技行业?5 个疯狂的使用案例

探索 Cursor 和 Claude 3.5 如何通过自动视频编辑到以闪电般的速度构建加密货币交易界面,变革编码和设计的五种革命性方式。 Cursor 和 Claude 3.5 的强大力量:改变编码游戏的 5 个突破性用例 Cursor 和 Claude 3.5 的结合显著改变了编码领域,使开发者能够以无与伦比的速度和效率实现创新成果。这些工具在多个行业中证明了它们的颠

阅读更多
克劳德 3.5 与 GPT-4o:您需要了解的主要区别

克劳德 3.5 与 GPT-4o:您需要了解的主要区别

Anthropic 最新发布的 Claude 3.5 Sonnet 进入了一个市场,在这个市场中,OpenAI 的 GPT-4o 已经设定了高标准,已有 92% 的财富 500 强 公司利用 Open

阅读更多
克劳德 3.5 的计算机使用功能:改变工业自动化的游戏规则

克劳德 3.5 的计算机使用功能:改变工业自动化的游戏规则

在不断发展的人工智能领域,Anthropic 的 Claude 3.5 已成为一个强大的参与者,拥有一个引起各行业关注的功能:像人类一样使用计算机。这不仅仅是人工智能的另一个渐进式改进;这是一个重大变革,承诺将重塑企业在数字时代的运营方式。 AI驱动的计算机交互的曙光 让我们直截了当:Claude 3.5的计算机使用能力并不是普通的AI技巧。我们谈论的是一种能够浏览用户界面、操纵

阅读更多
使用 LangChain + Streamlit + *o1、GTP-4o 和 Claude 3.5 编写 RAG LLM 聊天应用程序

使用 LangChain + Streamlit + *o1、GTP-4o 和 Claude 3.5 编写 RAG LLM 聊天应用程序

学习如何使用 Python、Streamlit 和 LangChain 构建 RAG 网络应用,以便您可以与文档、网站和其他自定义数据进行聊天。 GitHub 代码:https://github.com/enricd/rag_llm_app RAG LLM Streamlit 应用:[https://rag\-llm\-app.streamlit.app/](https://rag-

阅读更多
Qwen 2.5 Coder 32B:这一最佳开放重量模型是否优于 GPT-4o 和 Claude 3.5 Sonnet?

Qwen 2.5 Coder 32B:这一最佳开放重量模型是否优于 GPT-4o 和 Claude 3.5 Sonnet?

在11月11日,阿里巴巴宣布推出其迄今为止最先进的编码模型:Qwen 2.5-Coder-32B-Instruct。但这并不是全部,它实际上是整个编码模型系列的一部分!除了32B模型,还有0.5B、1.5B、3B、7B和14B参数的版本。在撰写本文之前,我回顾了许多YouTuber、作家和技术专家的反馈,大家的共识 overwhelmingly positive。今天

阅读更多
Magentic-One、AutoGen、LangGraph、CrewAI 或 OpenAI Swarm:哪种多人工智能代理框架最好?

Magentic-One、AutoGen、LangGraph、CrewAI 或 OpenAI Swarm:哪种多人工智能代理框架最好?

流行的多智能体编排框架的优缺点 生成式人工智能中的多智能体话题正在升温,每个主要科技巨头都发布了一些相关框架。 但是,应该选择哪个多智能体框架呢?选择实在太多了!!随着OpenAI发布Swarm和微软的Magentic-One,这个领域变得非常拥挤。因此,为了消除任何疑虑,我将尝试解释每个框架的关键特性、优缺点,让您决定哪个最适合您。我们将讨论:AutoG

阅读更多
在 B2C 行业中利用大型语言模型 (LLM):在 B2C 行业中利用大型语言模型 (LLM):...

在 B2C 行业中利用大型语言模型 (LLM):在 B2C 行业中利用大型语言模型 (LLM):...

在金融服务、零售和电子商务等B2C行业快速发展的环境中,客户对个性化和即时响应的期望达到了前所未有的高度。随着人工智能技术的进步,尤其是大型语言模型(LLMs)的发展,企业在处理客户互动方面发生了剧烈变化。在银行和信用卡服务等行业,客户经常寻求有关产品、福利或交易的详细信息,因此采用基于LLM的自主代理提供了显著的优势。这些代理能够提供实时、智能的响应,转变客户参与方式,同时提高运营效率

阅读更多
2025 年成为人工智能工程师的路线图

2025 年成为人工智能工程师的路线图

如何在2025年成为AI工程师 有没有想过构建能够思考、学习和解决复杂问题的系统需要什么?几年前,我也很好奇——AI是一个未来主义的概念,我不知道从哪里开始。现在,随着我们迈入2025年,成为AI工程师比以往任何时候都更加容易。如果你在这里,你可能对如何从零开始进入这个领域感兴趣。好消息是?不需要成为计算机天才或数学奇才。只需一个清晰的路线图、奉献精神和正确的资源,你就能做到。

阅读更多
Bolt.new 和 Ollama:革新人工智能驱动的全栈式 Web 开发

Bolt.new 和 Ollama:革新人工智能驱动的全栈式 Web 开发

在快速发展的 Web 开发世界中,效率和创新至关重要。开发者、项目经理和设计师们都在不断寻找能够简化工作流程、降低成本和提高生产力的工具。Bolt.new 是一款突破性的 AI 驱动全栈 Web 开发代理,完全在您的浏览器中运行。与 Ollama 配合使用,后者允许您在本地运行开源 AI 模型,Bolt.new 将彻底改变我们构建和部署 Web 应用程序的方式。本文将深入

阅读更多
焦点正从人工智能代理转向人工智能代理工具的使用

焦点正从人工智能代理转向人工智能代理工具的使用

关于AI代理的关注点正在从单纯开发自主AI代理转向增强可供它们使用的工具,这直接影响到它们的能力和灵活性。 AI代理的功能和范围在很大程度上依赖于工具的访问,工具以自然语言描述,并通过代理的内部推理激活。 桌面和其他用户特定环境提供了代理有效执行任务所需的丰富上下文,使它们成为理想的操作空间。 ✨✨ 在 LinkedIn 上关注我 ✨✨ 介绍 随着模型成为实用工

阅读更多
Qwen 新发布:编码器之王是 Qwen2.5 编码器 32B!

Qwen 新发布:编码器之王是 Qwen2.5 编码器 32B!

大家好!介绍一下 Qwen2.5-Coder-32B-Instruct:最新的 AI 模型正在引领编码界的风潮! 这些模型大多在 Apache 2.0 许可下发布。基准分数高得惊人: ![](https://images.weserv.nl/?url=https://proxy.rifx.online/https://cdn-images-1.readmedium.com/v2

阅读更多
利用 CrewAI 构建自主多代理系统

利用 CrewAI 构建自主多代理系统

什么是多智能体自主系统以及如何使用CrewAI和LangChain构建一个? 动机 实际上,我们对这些概念并不陌生;我们从电影中了解到它们。一个人指挥他们的AI,而AI通过使用各种工具来执行这些命令。这就是我们今天在AI系统崛起的道路上所走的方向。时代正在逐渐变化。在过去,人们无法独自完成一项任务,需要一个团队。没有团队,他们要么在一段时间后精疲力竭,要么达到能力的极限。最

阅读更多
满足 Qwen2.5-Coder-32B-Instruct -Coder - 开源比 gpt4o 更好

满足 Qwen2.5-Coder-32B-Instruct -Coder - 开源比 gpt4o 更好

认识 Qwen2.5-Coder-32B-Coder,您新的 AI 编码伙伴 您是否曾希望编码变得更简单、更快速,甚至更有趣?那么,准备好迎接您的新 AI 编码朋友 Qwen2.5-Coder。Qwen2.5-Code 专门开发了这个模型,作为一个尖端语言模型,以简化您的编码体验。想象一下,拥有一个知识渊博的助手,可以为您编写代码、调试、解释复杂概念,并处理多种语言。感兴

阅读更多
Qwen2.5-Coder 32B Instruct:最佳编码模型--完整的分步指南和性能...

Qwen2.5-Coder 32B Instruct:最佳编码模型--完整的分步指南和性能...

学习如何在本地安装 Qwen2.5-Coder,探索其卓越的编码能力,并通过实践示例评估其性能 介绍 在不断发展的AI驱动编程工具领域,大型语言模型(LLMs)显著改变了开发者编写、调试和优化代码的方式。今天,我们很高兴探索Qwen2.5-Coder系列,这是一项开源的奇迹,承诺在代码生成和AI编码助手领域树立新的标准。该系列的最新版本**Qwen2.5-Coder

阅读更多
Qwen2.5-Coder、Cosmos Tokenizer、OpenCoder 和新的 SentenceTransformers:开放源代码的伟大时代

Qwen2.5-Coder、Cosmos Tokenizer、OpenCoder 和新的 SentenceTransformers:开放源代码的伟大时代

我想强调一些引人注目的开源进展:Qwen2.5-Coder 系列:一个开放源代码的代码 LLM,正在与 GPT-4 竞争。 Cosmos Tokenizer:一套先进的神经分词器,用于高效的图像和视频压缩。 OpenCoder:一个完全开源的代码 LLM,训练于惊人的 2.5 万亿个标记。 **SentenceTransformers 的大幅

阅读更多
面向 iOS 开发人员的 5 大人工智能工具

面向 iOS 开发人员的 5 大人工智能工具

提高工作流程速度与效率 虽然关于人工智能的讨论很多,但我想让你回归现实。无论你是否已经在使用 AI 辅助的编码工具,或者觉得这一切都是无稽之谈……这篇标题吸引眼球的文章可能适合你。 虽然你可能已经能找到很多关于如何使用各种工具来提高你的技能、效率和准确性的文献,但对于我们 iOS 开发者来说,这要复杂一些。因为我们依赖 Xcode 及其工具链来构建我们的应用,所以我们很难不使用

阅读更多
Claude 3.5 Haiku:人类的 速度之魔 脑力大增

Claude 3.5 Haiku:人类的 速度之魔 脑力大增

在人工智能进步的无情竞赛中,Anthropic刚刚推出了一位新的竞争者。认识一下Claude 3.5 Haiku,这是他们最快AI模型的最新版本。就像他们把短跑运动员送到了脑力训练营。结果呢?一个不仅在行动上迅速,而且在某些智力领域能够超越其更强大兄弟的模型。让我们深入了解一下这个新生事物的运作原理。 速度(和智慧)的需求 Anthropic 之前的 Haiku 模型已经是他

阅读更多
新人工智能 Bolt 是否会取代 v0.dev

新人工智能 Bolt 是否会取代 v0.dev

AI工具不是会员?免费阅读 这里。网页开发的世界正在快速发展,市场上涌现出多种AI工具。这些新AI工具通过自然

阅读更多
使用 Llama3.1 创建客户支持助理

使用 Llama3.1 创建客户支持助理

使用 LLM 代理和 Amazon Bedrock 解决客户查询的 AI:构建和部署支持助手的指南,使用 Llama3.1 介绍 问题 企业经常面临处理大量客户询问的挑战。这些询问可能从简单的问题“我的订单状态是什么?”到需要人工干预的更复杂的问题不等。重复询问的庞大数量可能会使客户支持团队不堪重负,导致响应时间延长和客户满意度降低。此外,利用人力资源处理简

阅读更多
利用 Gen AI(OpenAI API)构建智能测试自动化

利用 Gen AI(OpenAI API)构建智能测试自动化

我们都知道 UI 测试非常脆弱。它们可能因各种原因而失败,其中一个最大的问题是 UI 定位器的变化。很难想象我们如何能让它们足够智能,以理解定位器何时发生变化,并在测试中出现定位器问题之前防止测试运行。你没听错!现在是 2024 年,自动化测试工具已经取得了长足的进步。在与这些工具打交道近 18 年后,从 Mercury Winrunner 到 Playwright,我们现在可以利用

阅读更多
用于构建多代理系统的 LangGraph、Autogen 和 Crewai 比较研究

用于构建多代理系统的 LangGraph、Autogen 和 Crewai 比较研究

随着我们进入多智能体系统(MAS)的领域,了解专门为此目的设计的各种编程语言至关重要。在本文中,我们将通过比较 LangGraph、Autogen 和 Crewai —— 该领域的三大重要参与者,深入探讨 MAS 开发的世界。 介绍 多智能体系统(MAS)在各个行业中变得越来越重要。MAS是由多个智能体组成的系统,这些智能体相互之间以及与环境进行交互,以实现特定目标。在可用于构建M

阅读更多
Microsoft GraphRAG v0.4.0

Microsoft GraphRAG v0.4.0

微软最近发布了 GraphRAG 项目的 v0.4.0 版本,带来了几项重要更新。最显著的新增功能是增量索引特性和 DRIFT 图推理查询模块,这大大增强了系统的效率和功能。 此次更新的核心亮点包括: 1. 增量索引:显著提高大规模数据处理的效率,实现更快的信息更新。 2. DRIFT 图推理查询模块:引入先进的图推理技术,增强复杂查询处理能力。 此外,版本 0.4.

阅读更多
Claude Sonnet 3.5 和 Claude 3.5 Haiku 有哪些新功能?

Claude Sonnet 3.5 和 Claude 3.5 Haiku 有哪些新功能?

首先,Claude是什么? Claude是由Anthropic创建的语言模型,旨在帮助完成诸如回答问题、总结信息和生成文本等任务——类似于ChatGPT。Claude的一个优点是它被设计得更安全,更符合人类意图,因此生成有害或误导性内容的可能性较小。 等等…

阅读更多
Mojo,比 Python 快 90,000 倍,终于开源了!

Mojo,比 Python 快 90,000 倍,终于开源了!

2024年3月29日,Modular Inc.宣布开源Mojo的核心组件。 Mojo是一种专门为编写人工智能软件而设计的编程语言,去年八月正式发布。自那时以来,它已经吸引了超过175,000名开发者和50,000个组织。 人工智能模型通常使用多种编程语言编写。开发者通常使用Python实现神经网络的最简单部分,因为它易于学习,但相对较慢。其余代码通常用C++编写,虽然速度更快,但学习起来更复

阅读更多
ChatGPT Vision 将图片转化为 1000 个字

ChatGPT Vision 将图片转化为 1000 个字

如何将这些文字转化为商业价值 我有这个想法快十年了。一切始于我搭建网站的时候,一位旅馆老板给我发了一根装满近千张照片的U盘,还有一盒35mm的照片让我扫描。这些都是惊人的照片——客人们展示他们的珍贵捕获、令人惊叹的湖景,以及向导们带领的户外冒险。我知道,如果我们能把这些照片放到网上,它们将为旅馆创造一场口碑营销的浪潮。但事情变得复杂了:每张照

阅读更多
英伟达™(NVIDIA®)如何修剪和提炼 Llama 3.1 以创建 Minitron 4B 和 8B

英伟达™(NVIDIA®)如何修剪和提炼 Llama 3.1 以创建 Minitron 4B 和 8B

新模型采用了最先进的剪枝和蒸馏技术。我最近开始了一份专注于人工智能的教育通讯,目前已有超过170,000名订阅者。TheSequence是一份不做作(意味着没有炒作,没有新闻等)的机器学习导向通讯,阅读时间为5分钟。目标是让您及时了解机器学习项目、研究论文和概念。请通过下面的链接订阅试试:我们常常被大型语言模型(LLMs)特别是那些参数数量庞大的模型的进展所震撼。然

阅读更多
利用 Gemini 1.5 API 进行自动测试用例生成逆向工程

利用 Gemini 1.5 API 进行自动测试用例生成逆向工程

摘要 本报告探讨了利用 Gemini 1.5 API 与 Google Apps Script 结合,自动化脚本逆向工程中的示例输入创建。传统上,这一过程是手动且耗时的,特别是对于具有大量测试用例的函数。通过将逆向工程技术应用于 Google Apps Script 示例,探讨了 Gemini 1.5 API 在自动化输入生成方面简化开发的潜力。 介绍 随着 Gemin

阅读更多
利用 LangChain 和 LangGraph 进行多代理对冲基金模拟

利用 LangChain 和 LangGraph 进行多代理对冲基金模拟

多智能体对冲基金模拟与 LangChain 和 LangGraph 该项目演示了如何使用多智能体设置来模拟对冲基金的分析过程。它展示了一种实用的方法来构建一个系统,该系统利用 AI 智能体收集和分析金融数据,这种设置可以进一步扩展和定制。在这里,我将分解该项目,其中涉及一个投资组合经理和三个分析师智能体(基本面、技术面和情绪面),每个智能体在收集和处理股票数据方面被分配了特定角色。

阅读更多
使用 Llama 3 构建 AI 代理

使用 Llama 3 构建 AI 代理

构建具有 Llama 3 函数调用能力的 AI 代理的综合指南 引言 想象一下你想买一些东西。你访问一个电子商务网站,使用搜索选项找到你想要的东西。也许你有多个物品要购买,因此这个过程并不是很高效。现在考虑这个场景:打开一个应用程序,用简单的英语描述你想要的东西,然后按下回车。你不必担心搜索和价格比较,因为应用程序会自动为你处理这些事情。很酷,对吧?这正是我们将在本教

阅读更多
使用 Gemini Pro 和 LangChain 的多模式 RAG

使用 Gemini Pro 和 LangChain 的多模式 RAG

介绍 在本教程中,我们将探索将 Gemini Pro 和 Gemini Pro Vision 与 LangChain 框架集成,以实现多模态(在这种情况下为图像)检索增强生成(RAG)。

阅读更多
全新 Gemini 1.5 FLASH 型号:绝对的 Google 游戏规则改变者

全新 Gemini 1.5 FLASH 型号:绝对的 Google 游戏规则改变者

他们的新 Gemini 1.5 Flash 模型远远超过了 GPT-4o,其能力令人难以置信。 闪电般快速。 比 GPT-4o 便宜 33 倍,但上下文容量大 700% — 100 万个令牌。 在现实世界中,100 万个令牌是什么概念?大约:超过 1 小时的视频 超过 30,000 行代码 超过 700,000 个单词![](https://i

阅读更多
OpenAI 放弃 Next.js 转而使用 Remix 的真正原因

OpenAI 放弃 Next.js 转而使用 Remix 的真正原因

OpenAI 采取行动背后的惊人原因及其对未来网页开发的影响 过渡介绍 OpenAI 最近在开发者社区引起了轰动,因为它从 Next.js 转向了 Remix。 这一意外的转变让许多人质疑如此重大变化的理由。 但 你能责怪他们吗? 以下是 大多数开发者对 NextJS 的看法,基于 [这篇](https://www.reddit.com/r/nextj

阅读更多
OpenAI 实时 API(语音模式),Colab 入门

OpenAI 实时 API(语音模式),Colab 入门

您需要了解的一切,以及在 Colab 上运行 OpenAI 语音模式 API 的动手介绍。 OpenAI 最新的开发为我们带来了 实时 API,旨在允许开发者在他们的应用中创建 快速、无缝的语音到语音体验。该 API 旨在简化多模态对话功能的开发,使构建自然的实时语音交互变得更加容易。 在这篇博客中, 我将涵盖有关此新 API 的 主要问题,包括

阅读更多
智能代理:Langchain、CrewAI 和 AutoGen 比较

智能代理:Langchain、CrewAI 和 AutoGen 比较

1. AI代理框架概述 在人工智能快速发展的领域,选择合适的框架是每个数据科学家和开发者必须做出的关键决策。AI代理生态系统正在迅速演变,提供越来越复杂的解决方案来自动化和优化复杂的流程。 智能代理革命带来了几种框架,每种框架都有其独特的特点。Langchain、CrewAI、AutoGen和Swarm在这个场景中脱颖而出,各自提供了管理和协调AI代理的独特方法。 本次基准

阅读更多
使用 FastAPI、Groq 和 Replicate 的 AI 图像生成器和故事生成应用程序

使用 FastAPI、Groq 和 Replicate 的 AI 图像生成器和故事生成应用程序

项目介绍:AI 图像生成器和故事创作工具 AI 图像生成器和故事创作工具是一个网络应用程序,利用先进的 AI 技术为用户提供一个基于音频提示生成图像和故事的互动平台。该应用程序使用 FastAPI 作为后端,能够高效处理请求和响应,而前端则采用 HTML、CSS(DaisyUI 和 Tailwind CSS)和 JavaScript 构建,以提供响应式用户体验。该应用程序利用 lla

阅读更多
Atomic Agents 1.0 简介:构建 Agentic AI 的模块化框架

Atomic Agents 1.0 简介:构建 Agentic AI 的模块化框架

想象一下,构建 AI 应用程序就像组装乐高积木一样轻松。这就是 Atomic Agents 的理念,一个基于 Atomic Design 原则的模块化框架,用于构建 AI 代理。随着 1.0 版本 的发布,Atomic Agents 引入了一个强大的 CLI,称为 **Ato

阅读更多
文物:Claude 3.5 Sonent 最令人惊叹的用途

文物:Claude 3.5 Sonent 最令人惊叹的用途

Anthropic 最近推出了其最先进的 LLM,“Claude 3.5 Sonnet”,让人惊叹。社交媒体上的人们称这一模型为当前最先进的 LLM。这个 AI 模型在性能上超越了所有现有的 LLM,例如 GPT-4、GPT-4o mini、Llama 3 等等。Claude 3.5 Sonnet 的上下文窗口为 200K,最大输出为 8192 个 tokens。它可以生成一个包含大

阅读更多
与 Cursor 和 Claude-Dev 共度的一个月:我的想法

与 Cursor 和 Claude-Dev 共度的一个月:我的想法

我最近在使用两个新工具—— Cursor 和 Claude-Dev ——这两个工具在开发者社区中都引起了相当多的关注。它们都是通过 AI 驱动的助手来提高编码的速度和直观性,但它们采取了不同的方法,并各自有自己的优缺点。在使用这两者大约一个月后,我觉得是时候坐下来反思一下它们的优势和仍需改进的地方。 让我们从 Cursor 开始。 Cursor: 熟悉但更快速

阅读更多
如何使用 RAG 提高 LLM 成绩

如何使用 RAG 提高 LLM 成绩

初学者友好的介绍 w/ Python 代码 本文是关于在实践中使用大型语言模型的更大系列的一部分。在[上一篇文章](https://towardsdatascience.com/qlora-how-to-fine-tune-an-ll

阅读更多
大型语言模型变得更小了

大型语言模型变得更小了

这将如何改变软件初创企业的游戏规则 本文与 David Meiborg 共同撰写。 *TLDR: 大型语言模型(简称 LLMs)目前体积庞大,运行成本高,并且具有 显著的碳足迹。然而,最近在模型压缩和系统级优化方法上的进展可能会增

阅读更多
OpenAI 01-预览 — 99% 的人不知道的秘密

OpenAI 01-预览 — 99% 的人不知道的秘密

如何充分利用01-preview 自从01-preview发布以来,我一直在玩它。 我非常喜欢它! 我甚至在我的新AI增长黑客课程中教授它。 我很高兴分享一些关于如何充分利用它的关键见解。 大多数人对01-preview的工作原理一无所知。

阅读更多
追求生产质量 Graph RAG:开始容易,完成难

追求生产质量 Graph RAG:开始容易,完成难

克服图形 RAG 生产化的挑战 当我阅读最近在 VentureBeat 上关于 Glean [刚刚在最新融资轮中获得超过 2.6 亿美元的文章](https://venturebeat.com/data-infrastructure/how-to-take-advantage-of-a-generative-tool-fueling-gleans-260m-raise-grap

阅读更多
如何使用 CrewAI 和 Gemini Pro 创建 AI 团队来撰写引人入胜的故事

如何使用 CrewAI 和 Gemini Pro 创建 AI 团队来撰写引人入胜的故事

你是否对AI生成引人入胜的故事这一想法感到着迷?如果是这样,你并不孤单!在本文中,我们将深入探讨一个结合CrewAI和Gemini Pro力量的入门项目,创建一个代理网络,通过用户输入的帮助来创作短篇故事。无论你是一个初出茅庐的程序员,一个希望探索数字前沿的讲故事者,还是仅仅对人工智能的潜力感到好奇,这本指南都适合你。 CrewAI 和 Gemini Pro 是什么? 在我们深入探

阅读更多
使用 Unsloth 对 LLama 3 进行微调

使用 Unsloth 对 LLama 3 进行微调

在本文中,我将向您展示如何使用 Unsloth 微调 LLM(Meta 的 Llama 3)。我还将提供使用您自己自定义数据集的方法。 注意: Unsloth 是一个加速 LLM 在 NVIDIA GPU 上微调的库(与传统方法相比,内存使用减少 40%)。与 Hugging Face 兼容,支持 Ll

阅读更多
Qwen2.5 1.5b:移动AI的未来?

Qwen2.5 1.5b:移动AI的未来?

本地测试和评估阿里云最新的LLM。使用llama-cpp-python和DIY提示目录。 在第一部分,我们共同探讨了阿里云团队发布的Qwen2.5模型系列的创新。 在生成式AI基准测试中,基准测试现在是主要的oracle:新的LLM的有效性需要通过多个评判。你打破的基准记录越多,你就越优秀。 这是赢得SOTA竞赛的方式。 好吧,我不同意。尽管我们需要里程碑和更好的性

阅读更多
在 LLM 代理框架之间进行选择

在 LLM 代理框架之间进行选择

定制代码代理与主要代理框架之间的权衡 代理正在迎来一个重要时刻。随着多个新框架和新的 投资 的涌入,现代 AI 代理正在克服 [不稳定的起源](https://arxiv.org/html/2405.

阅读更多
Google 发布 Gemma — 轻量级开源模型

Google 发布 Gemma — 轻量级开源模型

在短短一周内,世界见证了两家科技巨头带来的最具突破性的AI进展。OpenAI推出了令人惊叹的AI视频生成器Sora,而谷歌则揭晓了其[Gemini 1.5模型](https://generativeai.pub/google-releases-gemini-1-5-with-1m-context-window-

阅读更多
Llama 3.1 405B——如何免费使用

Llama 3.1 405B——如何免费使用

无需本地安装 Llama 3.1 405B 是Meta于2024年7月发布的最先进的AI模型——但你可以在哪里试用它?** LLama 3.1 有不同的版本,包括参数最多的4050亿模型以及较小的70B和8B模型。 试用70B和8B模型的最简单方法是在Groq上——你可

阅读更多
o1-preview 与 claude-3.5-sonnet:比较顶级法学硕士

o1-preview 与 claude-3.5-sonnet:比较顶级法学硕士

今天(2024年9月12日),OpenAI 发布了其最新的语言模型 o1-preview。这个先进的模型经过设计,能够在生成响应之前投入更多时间进行处理,使其能够更好地应对复杂任务,并在科学、编码和数学等领域解决具有挑战性的问题。 在这篇博客文章中,我们将深入分析 o1-preview,并将其与之前被认为是最先进模型之一的 Claude 3.5 Sonnet 进行比较。 比较方

阅读更多
Claude 3.5 Sonnet(新):利用计算机控制能力开拓人工智能的未来

Claude 3.5 Sonnet(新):利用计算机控制能力开拓人工智能的未来

Anthropic于2024年10月22日发布了最新的AI模型Claude 3.5 Sonnet。此次发布引入了革命性的计算机控制能力,并在多个基准测试中实现了显著改进,为AI行业设定了新标准。 革命性的计算机控制:新前沿 Claude 3.5 Sonnet 的突出特点是其能够像人类一样与计算机进行交互。这一突破性的能力使得 AI 可以:使用鼠标和键盘输入导航桌面界面

阅读更多
阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴最近在人工智能领域引起了轰动,在2024年 Apsara 大会上开源了其 Qwen 2.5 模型。Qwen 拥有超过 100 个模型,涵盖语言、视觉、音频和代码等多种模态,使其成为最全面的开源人工智能解决方案之一。此次发布通过提供多样化应用的工具,赋能开发者,从文本到视频生成到实时问答。 阿里巴巴 Qwen 模型的关键特性多模态能力:Qwen 模型处

阅读更多
新崛起红星:Qwen2.5来了

新崛起红星:Qwen2.5来了

一起测试新生的阿里云生成式AI Qwen2.5,使用Python和llama-cpp 在没有太多宣传和预期公告的情况下,阿里云于9月19日发布了他们的旗舰模型系列Qwen2.5。 阿里云在Qwen上的革命性旅程再次展示了通过创新的强大领导力。 怎么做的?它们有什么特别之处?我们应该期待什么? 在本文中,我们将探讨新模型并检查其性能。作为后续,在下一篇文章中,我们将使用`l

阅读更多
在软件应用程序中使用 AutoGen 的实用指南

在软件应用程序中使用 AutoGen 的实用指南

更新:虽然这篇文章是在四个月前写的,但 AutoGen 自那时以来变化很大。对于我代码示例中可能过时的内容,我深感歉意。 如果您想了解 AutoGen,可以查看 文档、Colab 笔记本 和 [博客

阅读更多
使用 Ollama、Swarm 和 DuckDuckGo 构建本地 AI 新闻聚合器

使用 Ollama、Swarm 和 DuckDuckGo 构建本地 AI 新闻聚合器

使用OllamaSwarm和DuckDuckGo构建本地AI驱动的新闻聚合器 在当今快节奏的世界中,跟上特定领域最新新闻的步伐可能会很具挑战性。如果我们能够利用生成式AI和代理的力量,创建一个完全在本地机器上运行的个性化新闻聚合器呢?在本文中,我们将探讨如何使用Ollama的Llama 3.2模型、Swarm进行代理编排,以及DuckDuckGo进行网络搜索来构

阅读更多
本地探索 Swarm 多智能体框架

本地探索 Swarm 多智能体框架

Swarm 是一个实验性样本框架,用于模拟轻量级多智能体框架,旨在教育目的。通常它与 Open AI Key 一起使用,但我们可以更改为使用本地的 Ol

阅读更多
使用 GPT Vision 和 Langchain 从图像生成结构化数据

使用 GPT Vision 和 Langchain 从图像生成结构化数据

在当今这个视觉数据丰富的世界中,从图像中提取有意义信息的能力变得越来越重要。Langchain是一个强大的框架,用于构建大型语言模型(LLMs)应用程序,提供了一套多功能的工具来应对这一挑战。在本文中,我们将探讨如何使用Langchain从图像中提取结构化信息,例如计算人数和列出主要物体。 在深入代码之前,让我们先了解一下任务的背景。想象一下你有一张场景的图像,比如城市街道。你的目标是

阅读更多
如何在本地运行 Nvidia 的 llama-3.1-nemotron-70b-instruct

如何在本地运行 Nvidia 的 llama-3.1-nemotron-70b-instruct

在开发者、研究人员和 AI 爱好者中,本地运行大型语言模型(LLMs)变得越来越受欢迎。其中一个引起广泛关注的模型是 llama-3.1-nemotron-70b-instruct,这是 NVIDIA 定制的强大 LLM,旨在增强生成响应的有用性。在本综合指南中,我们将探讨多种方法,以便在您的本地机器上运行此模型,首先介绍用户友好的 Ollama 平台。在开始之前,如果您正在寻找一个

阅读更多
LangGraph、LangChain、LangFlow、LangSmith:使用哪一个以及为什么?

LangGraph、LangChain、LangFlow、LangSmith:使用哪一个以及为什么?

探索 LangGraph、LangChain、LangFlow 和 LangSmith 之间的关键区别,了解哪种框架最适合您的语言模型应用——从工作流构建到性能监控。 👨🏾‍💻 GitHub ⭐️ | 👔LinkedIn

阅读更多
RAG/LLM 和 PDF:使用 PyMuPDF 转换为 Markdown 文本

RAG/LLM 和 PDF:使用 PyMuPDF 转换为 Markdown 文本

以Markdown文本格式输入数据可以提高生成文本的质量 介绍 在大型语言模型(LLMs)和检索增强生成(RAG)环境中,以markdown文本格式输入数据具有重要意义。以下是一些详细考虑因素。 LLMs 是强大的语言模型,可以生成连贯且具有上下文相关性的文本。然而,它们有时可能会产生缺乏事实准确性或上下文的响应。通过结合基于检

阅读更多
RBYF:Qwen2.5–3B-instruct 非常棒。

RBYF:Qwen2.5–3B-instruct 非常棒。

修订基准:以您为反馈的全新3B模型来自阿里巴巴Qwen,是个令人惊叹的模型,我可以证明这一点! 涌现属性的错觉在很大程度上是评估这些模型所使用的指标的产物。这是一个事实。 几周前,我决定做一个小反叛,放弃所有官方基准,开始自己做基准测试! 这就是这个完全虚构的首字母缩略词RBYF的意义:以您为反馈的修订基准。其基本原则是,没有比您更好的评判者来验证一个大型语言模型的优劣。 老

阅读更多
6 种最佳本地运行模型的 LLM 工具

6 种最佳本地运行模型的 LLM 工具

运行大型语言模型(LLMs)如 ChatGPT 和 Claude 通常涉及将数据发送到由 OpenAI 和其他 AI 模型提供商管理的服务器。虽然这些服务是安全的,但一些企业更倾向于将其数据完全离线,以获得更高的隐私保护。 本文

阅读更多