Type something to search...
解锁 AI 代理工作流程:关于使用 langgraph 可视化决策和成本分析的 5 个关键见解

解锁 AI 代理工作流程:关于使用 langgraph 可视化决策和成本分析的 5 个关键见解

用 LangGraph 的状态流来玩——不需要 LLM 或 API!纯代码和数据科学!

可以通过我的 GitHub 个人资料 这里 访问代码。

背景

这篇文章的想法是在学习 LangGraph 课程时突然冒出来的。当我研究前几个例子时,我完全沉浸在玩 Graph 工作流程中——实际上非常有趣。那时我突然意识到:这些有状态的图对于理解请求和查询如何在代理工作流程中移动非常有用。

所以我有一些有趣的见解,我想与你分享,希望你能一直看到最后!

——让我们开始吧!

本文的目标是深入研究一些最常见的代理工作流程的概率分析,特别是使用 LangGraph。

考虑一个一般的代理 AI 系统示例,该系统使用 LLM 作为决策者来执行以下任务:

代理 AI 系统的状态流

以下是此工作流程内部发生的事情的细分:

  • 用户提出一个问题,并将其传递给 LLM 以执行 Refine Query
  • 基于上下文,LLM 将响应路由到 RetrieveSearch for Online Articles,并且
  • 最后,该过程以另一个 LLM Generate Summary 结束。

这是一个代理工作流程(又名 RAG)的一个非常简单的表示。在下文中,我将展示使用 LangGraph 对此过程的高级表示。

我将引导你完成一个使用蒙特卡洛模拟来生成大量样本路径的过程(假设有 10,000 个用户提出各种类型的问题)。

如果你不熟悉 蒙特卡洛模拟,这里是它的要点:这是一种方法,你从概率系统中生成大量随机样本,以了解事物在不同可能结果中的分布情况。

注意:你不需要调用任何 LLM 或 API 来运行此工作流程。这一切都基于假设的场景。

使用 LangGraph 设置一个模拟代理工作流程

我们使用以下场景对上述工作流程进行建模:

状态表示:

系统遵循一个字典 (TypedDictState) 来跟踪核心变量,包括:

  • tools_called:工具调用的计数。
  • condition:“good” 或 “bad”,表示工作流程状态。
  • steps:工作流程中执行的步数。
  • node_visits:一个字典,用于跟踪每个节点的访问计数。
  • termination_reason:工作流程结束的原因。
  • tool_1_counttool_2_count:特定工具的使用计数器。
  • token:表示查询度量。例如,用户可能会问一个大小为 100 个 token 的问题。

节点函数:

  • node_1:记录访问并更新步数计数。
  • tool_1:递增 tools_called,将 condition 设置为 “good”,并增加 token 计数。
  • tool_2:递增 tools_called,将 condition 设置为 “bad”,并记录终止。
  • node_2:最终决策节点,检查终止条件并更新指标。

决策函数:

  • decide_condition:将 95% 的情况路由到 tool_1,将 5% 路由到 tool_2,确保积极结果的可能性更大。
  • decide_condition_2:如果 tools_called 超过 55,则将其路由到 node_2 以进行终止;否则,它循环回到 node_1

图构建:

  • 工作流程使用 LangGraph 构建,定义节点之间的边并确保适当的转换。
  • 执行从 START 开始,并通过不同的节点进行,直到达到一个吸收条件(node_2 用于超过工具限制或 tool_2 用于负终止)。

Token 成本模拟:

  • token 计数器随机初始化为 100 到 400 之间。
  • 每次访问节点都会将 token 增加一个随机量,介于 400 到 700 之间,这可以解释为 LLM 生成的响应或检索到的上下文 token。
  • 在运行 10,000 次迭代后,我们分析了不同模型中的 token 成本。想象一下一个代理系统处理 10,000 个请求——这让我们能够分解 token 成本和其他关键指标。

终止:

  • 当达到不良结果(tool_2 标签)或资源使用超过定义的限制(tools_called > 55)时,工作流程结束。

性能和决策效率使用可视化技术进行评估,例如分布图和 token 成本直方图。

这是一个简单的 Graph 工作流程(不需要 LLM 或任何昂贵的东西)。

供你参考,此表示的 GitHub 代码可在 这里 找到。

结果和分析

模拟运行相对较快,我使用了带有 8GB RAM 的 Macbook Pro M2 芯片,运行 10,000 次迭代大约需要 1.5 分钟。

图 1 — 10,000 次模拟运行达到 END 状态的运行长度分布

图 1 表明,工具调用过程,尤其是如果输出不令人满意,最终可能会运行更长时间(导致消耗更多 token)。

图 2 — 10,000 次迭代的终止原因比例

图 2 — 这很有趣!我们最初的计划是将 95% 的负载发送到工具 1,而只有 5% 发送到工具 2。大约 94% 的迭代从 node_2 结束,只有大约 6% 在最后达到工具上限。

图 3 — 所有 10,000 次运行中每个节点的访问次数

图 3 显示了对每个节点或工具的总访问次数,可以看出,对 node_1tool_1 的访问次数最多。由于决策路由器在这两个节点之间保持运行,这是显而易见的。

在现实世界中,如果用户查询没有通过检索到的上下文找到其响应,那么 LLM 会在线搜索内容以找到资源。

分析 Token 的成本

我运行此模拟的主要原因之一是,当您评估不同的 LLM 模型时,了解运行一个智能体系统的成本。

因此,我查看了来自 OpenAIAnthropicGoogle 的 9 种不同的模型,并且我只考虑了每 100 万个 token 的价格成本。自本文发表以来,成本数字可能已经发生了变化。

它提供了一些关于成本如何分布的有趣见解,甚至暗示了您可能需要在哪里进行调整。

图 4 — 不同 LLM 模型每 100 万个 token 的成本

您可以在图 5 中查看生成的 token 总数的分布情况。一般来说,大约 80% 的请求可以使用大约 30,000 个生成的 token 完成。大约不到 10% 的请求可能达到 60,000 个 token。非常有趣的见解。

图 5 — 10,000 次迭代的生成 token 分布

结论

这只是一个简单的例子,您可以从中提取有意义的见解,并了解在大规模推出智能体系统时会发生什么。同样,当使用 LangGraph 时,这种类型的分析突然出现在我的脑海中,我希望这对您有意义,并给您一些思考的余地。

作为下一步,我认为找到成本函数与生成的 token 之间的可能性是对此分析的另一个有趣的补充。

Related Posts

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

AI 研究报告和论文写作 合并两个系统指令以获得两个模型的最佳效果 Perplexity AI 的 Deep Research 工具提供专家级的研究报告,而 OpenAI 的 ChatGPT-o3-mini-high 擅长推理。我发现你可以将它们结合起来生成令人难以置信的论文,这些论文比任何一个模型单独撰写的都要好。你只需要将这个一次性提示复制到 **

阅读更多
让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

Non members click here作为一名软件开发人员,多年来的一个发现总是让我感到惊讶,那就是人们还在 Excel

阅读更多
使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

10 个常见问题解答 本文是我推出的一个名为“10 个常见问题解答”的新系列的一部分。在本系列中,我旨在通过回答关于该主题的十个最常见问题来分解复杂的概念。我的目标是使用简单的语言和相关的类比,使这些想法易于理解。 图片来自 [Solen Feyissa](https://unsplash.com/@solenfeyissa?utm_source=medium&utm_medi

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

在AI军备竞赛中分辨事实与虚构 DeepSeek AI真的是它所宣传的游戏规则改变者,还是仅仅聪明的营销和战略炒作?👀 虽然一些人将其视为AI效率的革命性飞跃,但另一些人则认为它的成功建立在借用(甚至窃取的)创新和可疑的做法之上。传言称,DeepSeek的首席执行官在疫情期间像囤积卫生纸一样囤积Nvidia芯片——这只是冰山一角。 从其声称的550万美元培训预算到使用Open

阅读更多
Type something to search...