Type something to search...
探索kag在rag工作流程中的应用:如何提升数据检索与客户服务效率

探索kag在rag工作流程中的应用:如何提升数据检索与客户服务效率

检索增强生成 (RAG)

RAG 一直是基于AI的商业工作框架中最成功的。它并不使用基础数据来训练大语言模型(LLM),同时为企业提供企业级安全,但它也在回答问题、提供客户服务及其他方面提供了好处。

RAG 可能会以几种方式失败。

例如,最近有客户问我们为什么他们的数据导入出现故障。现在,我们有一些先前的信息:

  1. 客户收到了一条错误信息,内容为 DataNotFound
  2. 日志显示该账户没有手动数据导入
  3. 客户当前的订阅计划不支持从第三方源的自动数据导入
  4. 客户最近升级了他们的订阅计划

现在,RAG 依赖于文本检索和匹配。我在我的《更好的搜索》系列中详细描述了这一点 (1 & 2),因此工作流程不会从我们的订阅计划中获取信息,将其与错误匹配,然后与客户的问题联系起来。人工代理可以轻松做到这一点;问答(Q&A)将相当简单。

客户:“我正在尝试生成销售报告,但我不断收到‘数据未找到’的错误。我完全按照说明操作。”
代理:“感谢您分享这个信息。我看到您最近升级了软件版本。升级后,您是否重新配置了数据导入设置?”
客户:“我不知道我需要这样做。”
代理:“没问题。您的系统缺少最新数据,因此报告无法生成。让我指导您手动导入数据的步骤。或者,我们可以讨论升级您的计划以自动化此过程。”

人类直观地理解这一点,因为他们发现了数据在这些系统中使用的模式。这就是为什么我们在 Kommunicate 在客户服务中如此重视 “人类 + AI” 这个理念 的原因。

请记住,当您执行 RAG 时,并不是在用您的数据训练 AI。虽然文本检索方法包含模式匹配和向量搜索,但它并不像基于 LLM 的数据库搜索那样复杂。

因此,我们无法在 RAG 中使用 LLM 的直观推理和学习范式(如果您查看我最近的一些 教程,我明显抑制了我们用于客户服务的 AI 模型的创造力和推理,以提高准确性)。但我们应该充分利用 LLM 的能力,对吗?我们应该利用它们的推理和学习范式来解决问题。

我们已经知道,现代 LLM 如 Claude Sonnet 可以解决复杂的编码和其他专家导向的问题。那么,如果我们在 RAG 框架中增加更多问题解决能力以增加商业用例,会发生什么呢?

进入知识增强生成

The 知识增强生成 论文在人工智能社区引起了轰动,这也是有原因的。基本上,研究人员利用图形的基本特性,开发出一个结合了检索增强生成速度和知识图谱准确性的系统。

问题是,知识图谱很好,但它们在主语-谓语-宾语的范式内工作,而这并不适用于我们很多的数据。知识图谱需要大量的数据预结构化,而当你处理企业知识时,这又是不可能的。

那么,我们如何创新以突破这一限制呢?研究人员利用了图形的基本特性——模块化。

使用模块化映射连接

图形可以是模块化的,即图形中的不同节点可以形成更小的图内社区。因此,类似的实体、概念和事件可以在图形内创建关系。

现在,在知识库的上下文中,这意味着功能将与故障排除、定价结构等相关联。

这是图形的基本特性,知识增强生成(KAG)利用了这一点,但他们的分析还进一步深入。

通过知识增强生成引入的变化

论文的作者正式指出三项变化:

  1. 大语言模型特定知识框架 — 他们使用数据 → 信息 → 知识 → 智慧(DIKW)框架来改善传统的主语 → 谓语 → 宾语框架以适应大语言模型的使用。新的知识框架引入了实体类型事件类型概念类型逻辑类型类,以更好地表示不同文本块之间的关系。他们还引入了一个特定领域的专家知识层来处理原始文本块。该专家知识层包含有关概念和底层文本中存在的逻辑规则的信息。例如 — 在医学背景下,原始文本可能会说阿司匹林用于治疗头痛,但知识层会添加规则,说明它不能开给有出血性疾病的患者,并且还包含有关药物结构和非甾体抗炎药的信息。这个专家知识层将您从客户那里收到的原始数据对齐,以创建特定的数据结构。例如 — 在政府用例中,它可以创建如下数据结构:

    { “EntityType”: “GovernmentAffair”, “Administrative_Divisions”: “杭州市西湖区”, “Service_Procedures”: “在线申请或亲自申请。”, “Required_Materials”: [“身份证”, “就业证明”, “房屋租赁协议”] }

  2. 推理引擎 — 现在,大语言模型可以找到有关您领域的详细信息。然而,检索增强生成框架仍然必须提供相关信息,并且您需要一个支持的推理框架。

    使用上一步的概念库,一个问题被分解为一系列逻辑问题和概念。混合推理器然后使用这些来从原始文本中检索概念,最终检索实例。

    本质上,像“在美国内战后,支持对南方州严厉惩罚的政党在2010年控制了哪个机构?”这样的问题被分解为两个逻辑问题,“哪个政党在内战中惩罚南方州” + “这个政党控制了哪个机构?”

    然后,使用知识图谱中的结构检索答案,该结构用于回答问题。

  3. 在自然语言理解、自然语言推理和自然语言生成方面的改进 — 小模型经过微调,以为所有三项改进产生更好的结果。关于自然语言理解,相似的概念被放在同一类别中,模型被训练以从知识图谱中提取特定实体。关于自然语言推理,研究人员识别了语义关系并利用它们来增加大语言模型对上下文和领域的知识。此外,概念知识也被整合。对于自然语言生成,模型被训练以根据数据点生成特定答案。

    本质上,通过结合结构化知识框架,研究人员展示了更好的结果。

KAG的结果

KAG在实验环境中显著优于其他最先进的检索增强生成工作流,如HippoRAG。它还改善了自然语言理解和自然语言推理,并提供了比传统检索增强生成模型更全面的上下文召回能力。

KAG工作流可以产生比检索增强生成管道更好的结果,但它尚未准备好投入生产。

KAG 不会取代 RAG

从技术上讲,我希望能找到一个更全面的解决方案来处理客户服务查询。为 RAG 流水线添加推理能力和更结构化的数据是有意义的。

但 KAG 还未达到这个水平:

  1. 它使用 LLMs - 延迟是任何问答交互中的关键问题。LLMs 会将推理时间增加几个数量级。也许 领域特定的 SLMs 可以提供帮助,但在当前阶段,为每个行业构建一个单独的微调模型是不切实际的。
  2. 成本高昂 - 在当前情况下,为每个问题多次运行 LLM 所需的计算资源效率低下。虽然研究人员提出了替代方案,但大量的调用和令牌限制仍然是 KAG 的一个重大问题。
  3. 延迟 - 在实验设置中,回复的延迟并不重要。然而,在客户服务场景中,LLM 的较慢速度与需要进行的多个 API 调用的结合将限制性能。

因此,不,KAG 不会很快取代 RAG,但也许我们可以从中获得一些教育线索,以改善我们当前系统的工作方式。

建立一个不会失败的检索增强生成系统

知识增强生成的关键理念之一是结构化的特定领域知识,它在大语言模型的向量空间中创造了更好的连接。文本检索和数据检索方法令人印象深刻,但在该向量空间内的适当连接是您的AI系统读取数据和回答问题的关键。

我建议客户的一件事是建立一个结构化帮助台。如果您能投入一些精力构建一个具有原子答案的数据中心(即,通过将每个问题分解为子任务来回答每个问题),您可以帮助您的AI系统表现得更好。对于那些无法选择此选项的企业,创建更好的SOP,附加元标签和标题标签,以便大语言模型可以读取,将是解决方案。

AI已经到来,您需要结构化的数据源来支持AI。无论您是否喜欢,数据都需要为您的员工和客户的利益进行调整和完善。

来自AI Mind的消息

Related Posts

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

AI 研究报告和论文写作 合并两个系统指令以获得两个模型的最佳效果 Perplexity AI 的 Deep Research 工具提供专家级的研究报告,而 OpenAI 的 ChatGPT-o3-mini-high 擅长推理。我发现你可以将它们结合起来生成令人难以置信的论文,这些论文比任何一个模型单独撰写的都要好。你只需要将这个一次性提示复制到 **

阅读更多
让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

Non members click here作为一名软件开发人员,多年来的一个发现总是让我感到惊讶,那就是人们还在 Excel

阅读更多
使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

10 个常见问题解答 本文是我推出的一个名为“10 个常见问题解答”的新系列的一部分。在本系列中,我旨在通过回答关于该主题的十个最常见问题来分解复杂的概念。我的目标是使用简单的语言和相关的类比,使这些想法易于理解。 图片来自 [Solen Feyissa](https://unsplash.com/@solenfeyissa?utm_source=medium&utm_medi

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

在AI军备竞赛中分辨事实与虚构 DeepSeek AI真的是它所宣传的游戏规则改变者,还是仅仅聪明的营销和战略炒作?👀 虽然一些人将其视为AI效率的革命性飞跃,但另一些人则认为它的成功建立在借用(甚至窃取的)创新和可疑的做法之上。传言称,DeepSeek的首席执行官在疫情期间像囤积卫生纸一样囤积Nvidia芯片——这只是冰山一角。 从其声称的550万美元培训预算到使用Open

阅读更多
Type something to search...