掌握 25 种 RAG 架构:何时以及如何使用每一种
介绍
检索增强生成 (RAG) 架构彻底改变了我们处理信息检索的方式。这些架构弥合了生成响应与提取相关数据之间的差距,使模型能够提供准确、实时且具有上下文意识的答案。但在众多可用的 RAG 架构中,您如何知道在每种独特场景中使用哪一个?
在本指南中,我们将深入探讨 25 种 RAG 架构,解释它们的具体用途,并提供现实世界的示例,以演示每种架构何时最有效。
1. Corrective RAG: 实时事实检查器
- Description: 想象一下,如果你的AI助手拥有自己的“事实检查”大脑!Corrective RAG通过生成一个响应,然后在交付之前双重检查该响应的准确性。如果有任何不妥之处,它会自我纠正,确保所说内容与可靠来源一致。这个过程最大限度地减少了错误信息。
- Usage Context: 对于准确性至关重要的应用场景至关重要,例如医疗保健或金融领域,因为即使是小错误也可能导致严重后果。
- Example: 一个提供药物剂量指导的医疗保健聊天机器人。如果它建议某种内容,它会与可信的医学数据进行交叉引用,以确保其正确性。例如,如果用户询问关于非处方止痛药的问题,Corrective RAG会确保剂量符合医学指南后再作回应。
纠正 RAG 的流程图:
- 用户查询:用户提出问题。
- 文档检索:系统提取相关信息。
- 初步响应生成:草拟响应。
- 错误检测模块:检查是否存在不准确之处。
- 纠正反馈循环:如果发现错误,调整响应。
- 修正响应生成:生成经过完善的、无错误的响应。
- 最终输出给用户:用户收到可靠的、修正过的答案。
2. Speculative RAG: A Step Ahead of You
- Description: 将Speculative RAG视为一个读心助手!该架构预测用户接下来可能需要什么,并提前准备信息。Speculative RAG不断分析用户的上下文,准备相关信息,以便在用户询问时,信息已经准备好一半。
- Usage Context: 对于时间敏感的平台,如新闻或客户服务,预测用户需求可以提高满意度。
- Example: 在新闻应用中,如果用户搜索“气候变化”,Speculative RAG会预先获取与环境主题相关的热门文章。在用户完成输入之前,它已经猜测到他们感兴趣的主题,并准备好相关的文章,从而节省时间并改善体验。
流程图用于推测性RAG:
- 用户查询:用户开始输入查询。
- 上下文分析:系统分析用户的行为和上下文。
- 预测性数据检索:根据预测需求预先检索相关数据。
- 推测性响应生成:生成一个初步响应。
- 用户反馈收集:用户与生成的响应进行交互。
- 精炼响应生成:根据反馈更新响应。
- 最终输出给用户:用户收到快速、相关的答案。
3. Agenetic RAG: 自学习助手
- 描述: Agenetic RAG 就像一个与您“共同成长”的人工智能,从每次互动中学习。与依赖于不断更新的常规系统不同,Agenetic RAG 根据用户行为自行演变。随着时间的推移,它在理解和预测用户喜好方面变得更加出色。
- 使用场景: 非常适合推荐系统,如电子商务或流媒体平台,在这些平台上,个性化体验推动用户满意度。
- 示例: 一款时尚应用程序使用 Agenetic RAG 来学习用户的风格偏好。如果用户持续浏览极简设计,Agenetic RAG 将演变为显示更多极简风格,即使没有新的编程,仅根据互动调整其推荐。
Agenetic RAG 的流程图:
- 用户查询:用户提出问题或与内容互动。
- 初始文档检索:系统根据过去的数据检索信息。
- 响应生成:生成初始响应。
- 用户反馈收集:根据用户的反应(喜欢或不喜欢)进行学习。
- 实时学习模块:更新其“知识”并进行适应。
- 精细化检索:检索过程根据新的偏好进行调整。
- 更新后的用户响应:用户收到更个性化的响应。
4. 自我-RAG:自我改进指南
- 描述:自我-RAG 是一个始终寻求自我改进的 AI。想象一个系统,它主动从自己的响应中学习,并在没有任何人帮助的情况下提高准确性。自我-RAG 充当自己的管理者,寻找改进信息检索和提供方式的方法,基于过去的互动。
- 使用场景:非常适合需要不断更新信息的行业,如金融分析,在这些行业中,实时数据的准确性至关重要。
- 示例:在一个金融应用中,自我-RAG 确保股票价格的准确性,通过学习市场波动和用户修正。随着时间的推移,它在提取相关数据方面变得更加出色,基于实时反馈更新检索方法。
自我RAG的流程图:
- 用户查询:用户发起请求。
- 文档检索:系统收集相关信息。
- 初始响应生成:生成第一条响应。
- 自我评估模块:评估响应以便改进。
- 自主反馈循环:根据评估调整检索方法。
- 响应精炼:为未来的查询精炼答案。
- 最终输出给用户:用户收到越来越准确的响应。
5. 自适应 RAG:检索的变色龙
- 描述:自适应 RAG 根据变化的上下文调整其响应,类似于变色龙如何适应其环境。该架构不断扫描用户需求的“环境”,并自动调整其检索方法以保持相关性。
- 使用场景:非常适合实时变化影响用户需求的系统,例如票务平台,在这些平台上,需求和偏好变化迅速。
- 示例:一个事件票务系统使用自适应 RAG 来调整对高需求事件的关注,并相应地定制推荐,提供对热门事件的快速访问,尤其是在它们流行时。
自适应 RAG 的流程图:
- 用户查询:用户提出问题或请求。
- 初始上下文分析:系统评估当前上下文和趋势。
- 文档检索:根据初始上下文提取相关信息。
- 响应生成:根据当前需求生成响应。
- 上下文监测模块:持续检查上下文变化。
- 实时适应循环:根据更新调整检索方法。
- 最终输出给用户:提供反映当前条件的答案。
6. Refeed Retrieval Feedback RAG: 自我纠正学习者
- 描述: Refeed Retrieval Feedback RAG 旨在通过学习用户反馈来不断改进。每次用户与响应互动时,它都会学习什么有效,什么无效,使系统在每次互动中变得更加准确。
- 使用场景: 非常适合用户满意度至关重要且需要持续改进的客户服务聊天机器人。
- 示例: 一家电信提供商的客户支持机器人使用 Refeed Retrieval Feedback RAG 来调整其知识库。如果用户频繁纠正机器人,它会从这些纠正中“学习”,并调整其响应以更好地满足用户需求。
反馈检索反馈 RAG 的流程图:
- 用户查询:用户提出问题。
- 初始文档检索:提取与查询相关的文档。
- 响应生成:生成响应。
- 用户反馈收集:收集对响应准确性的反馈。
- 反馈回馈循环:将反馈输入系统。
- 检索调整:根据反馈调整检索方法。
- 精细化响应生成:为未来的查询生成更准确的响应。
7. Realm (Retrieval-Augmented Language Model) RAG: 知识丰富的助手
- 描述:Realm RAG就像一个博览群书的助手,知道在哪里可以找到答案!该架构利用大型语言模型(LLMs)的强大能力,将深入的、特定上下文的信息融入每个响应中,使其非常适合深入的查询。
- 使用场景:非常适合法律或技术领域,需要高度特定的信息。
- 示例:在一家律师事务所,Realm RAG通过检索案件特定的法律先例来提供帮助。对于涉及版权法的案件,它可以提取相关的法院裁决,节省法律团队数小时的研究时间。
Realm RAG 流程图:
- 用户查询:用户提出复杂问题。
- 上下文分析:系统识别特定的上下文需求。
- 文档检索:提取上下文特定的文档。
- 基于 LLM 的响应生成:语言模型生成响应。
- 上下文优化:根据相关性优化响应。
- 反馈收集:收集反馈以便未来响应使用。
- 最终输出给用户:提供高度相关且信息充分的响应。
8. Raptor (树状检索) RAG: 有序的问题解决者
- 描述: Raptor RAG 以层次结构组织信息,就像一个结构良好的图书馆。通过使用基于树的组织方式,它可以快速聚焦于与查询相关的特定“分支”信息,从而使检索更快、更准确。
- 使用场景: 适用于层次数据,如医疗诊断或产品类别。
- 示例: 在医院中,Raptor RAG 通过对症状进行分类并将其与可能的诊断连接起来,帮助医生。如果医生输入如发烧和咳嗽等症状,它会迅速导航到呼吸系统疾病并检索相关信息。
Raptor RAG 流程图:
- 用户查询:用户输入查询。
- 树状数据结构:以层次方式组织数据。
- 层次导航:快速浏览相关分支。
- 文档检索:从相关类别中提取数据。
- 响应生成:创建有针对性的响应。
- 反馈收集:收集对响应的反馈。
- 最终输出给用户:提供准确、结构良好的答案。
9. Replug (Retrieval Plugin) RAG: 数据连接器
- 描述: Replug RAG 像一个“即插即用”的检索系统,能够无缝连接多个外部来源。如果信息在其数据库中不可用,Replug RAG 可以访问外部数据库,以确保始终拥有最新的数据。
- 使用场景: 适用于需要外部数据访问的应用程序,如股票价格或天气信息。
- 示例: 一款金融应用通过连接股票市场数据库使用 Replug RAG 检索实时股票价格。当用户查看某只股票的价格时,它会实时拉取最新数据。
Replug RAG 的流程图:
- 用户查询:用户请求特定数据。
- 外部来源识别:识别所需的外部来源。
- 通过插件进行数据检索:连接到外部数据库。
- 使用外部数据生成响应:使用检索到的数据生成响应。
- 用户反馈收集:收集关于响应准确性的反馈。
- 插件优化:根据反馈优化数据来源。
- 最终输出给用户:提供准确的实时响应。
10. Memo RAG: 记忆保持器
- 描述: Memo RAG 记住过去的互动,保持对话的连续性。它像一个记忆库,存储关键细节,并利用这些细节确保每个新响应与之前的上下文一致。
- 使用场景: 适用于客户服务或辅导平台等应用程序,在这些场景中,持续的上下文保留是有益的。
- 示例: 一个客户支持聊天机器人使用 Memo RAG 记住用户之前的问题,因此当用户返回时,机器人可以从上次的对话继续,使体验更加无缝和个性化。
Memo RAG 流程图:
- 用户查询:用户提出问题。
- 记忆检索:回忆与查询相关的过去互动。
- 文档检索:提取新的相关信息。
- 结合记忆的响应生成:将新数据与过去的上下文结合。
- 用户反馈收集:收集关于记忆准确性的反馈。
- 记忆更新循环:用新的互动更新记忆。
- 最终输出给用户:提供连贯的、上下文感知的响应。
11. 基于注意力的RAG:聚焦分析器
- 描述:基于注意力的RAG优先考虑用户查询中的关键元素,“聚焦”于最重要的内容。通过过滤掉无关信息,它提供准确且切中要点的响应。
- 使用场景:非常适合需要关注特定关键词或概念的学术或研究平台。
- 示例:一个研究工具使用基于注意力的RAG帮助学者,聚焦于研究查询中的重要术语。例如,如果用户搜索“医疗保健中的人工智能”研究,它会过滤掉无关的研究,优先考虑相关的研究。
基于注意力的 RAG 流程图:
- 用户查询:用户输入一个问题或主题。
- 注意力机制:识别并优先考虑查询中的关键元素。
- 相关文档检索:根据关键元素进行重点检索。
- 响应生成:产生一个聚焦的响应。
- 反馈收集:收集对响应相关性的反馈。
- 注意力调整:根据反馈优化注意力机制。
- 最终输出给用户:提供一个精确、针对性的响应。
12. RETRO (Retrieval-Enhanced Transformer) RAG: 语境历史学家
- 描述: RETRO RAG 将历史语境的力量带入每个响应。它利用之前的对话、文档和用户互动,提供基于充分信息的语境的答案。
- 使用场景: 适用于企业知识管理或法律咨询,过去的案例或讨论非常重要。
- 示例: 在公司的内部网中,RETRO RAG 通过引用以前的讨论或文档来帮助员工查找信息。例如,它回忆起过去的项目决策,以便通知新团队成员正在进行的策略。
RETRO RAG 的流程图:
- 用户查询:用户提出问题。
- 检索历史数据:收集相关的历史数据和文档。
- 整合先前知识:将历史背景与当前查询合并。
- 上下文响应生成:基于整合的上下文生成响应。
- 反馈收集:收集反馈以进一步优化。
- 历史数据优化:细化历史相关性标准。
- 最终输出给用户:提供一个良好上下文化的答案。
13. Auto RAG: 无需人工的检索器
- 描述: Auto RAG 是一种自我维持的架构,自动化检索过程,几乎不需要人工监督。它持续提取相关信息,能够自我适应变化的数据流。
- 使用场景: 最适合处理大量动态数据的应用程序,例如新闻聚合器或股票市场应用。
- 示例: 一款新闻应用使用 Auto RAG 每天早上自动提取头条新闻。它扫描各种来源,根据相关性对文章进行排序,并在没有任何人工输入的情况下提供最新的头条新闻。
自动 RAG 流程图:
- 用户查询:用户请求一个主题或关键词。
- 自动数据流启动:开始自动检索过程。
- 动态过滤与优先级排序:过滤并优先处理检索到的数据。
- 响应生成:生成自动响应。
- 用户反馈收集:收集反馈以微调响应。
- 持续优化:自动调整检索策略。
- 最终输出给用户:提供更新的高效响应。
14. 成本限制的 RAG:预算意识型检索器
- 描述:成本限制的 RAG 根据预算限制优化检索。它确保信息检索保持在设定的成本框架内,非常适合需要平衡成本和准确性的组织。
- 使用场景:非常适合非营利或预算意识型行业,在这些行业中,成本效益解决方案至关重要。
- 示例:一家非营利组织使用成本限制的 RAG 仅从符合有限预算的特定来源提取数据,确保在有效管理成本的同时仍能访问必要的信息。
成本限制 RAG 的流程图:
- 用户查询:用户提交查询。
- 预算评估:评估成本参数。
- 成本高效检索选择:选择在预算内的检索方法。
- 响应生成:生成一个成本有效的响应。
- 成本调整反馈:收集对响应准确性的反馈。
- 优化成本限制:细化检索以保持成本效率。
- 最终输出给用户:提供符合预算要求的答案。
15. ECO RAG: 绿色检索器
- 描述: ECO RAG 优先考虑环保的数据检索,尽量减少能耗。它在检索需求与环境影响之间取得平衡,是关注可持续发展的组织的环保选择。
- 使用场景: 适合希望减少碳足迹的绿色科技和环保公司。
- 示例: 一个平台使用 ECO RAG 优化从远程传感器的数据检索,同时节约能源,最小化系统的生态足迹。
ECO RAG 流程图:
- 用户查询:用户发起请求。
- 能源与资源评估:评估检索所需的能源。
- 低能耗检索选择:选择节能的方法。
- 响应生成:生成资源意识的响应。
- 能源优化反馈:收集反馈以进行进一步优化。
- 优化资源使用:精炼检索以减少能源消耗。
- 最终输出给用户:提供环保的响应。
16. 基于规则的RAG:合规指南
- 描述:基于规则的RAG遵循严格的指导方针,以确保响应符合特定的规则或标准。该架构在具有监管要求的领域中非常理想,确保每个答案都符合既定的协议。
- 使用场景:最适合金融或医疗等行业,在这些行业中合规性至关重要。
- 示例:一个金融咨询系统使用基于规则的RAG提供符合法律和监管标准的投资指导,确保建议始终合规。
基于规则的RAG流程图:
- 用户查询:用户请求信息。
- 规则验证与评估:检查请求是否符合预定义规则。
- 基于规则的文档检索:在规则约束内检索数据。
- 按规则生成响应:生成符合规则的答案。
- 合规性反馈:收集关于规则遵循的反馈。
- 优化规则一致性:改进检索以提高合规性。
- 最终输出给用户:提供符合规则的答案。
17. 对话式RAG:引人入胜的沟通者
- 描述:对话式RAG旨在促进自然、互动的对话。该架构实时创建上下文相关的响应,使交互感觉流畅且引人入胜。
- 使用场景:非常适合客户支持聊天机器人和虚拟助手,在这些场景中,对话的参与度至关重要。
- 示例:零售聊天机器人使用对话式RAG与客户互动,根据客户的询问和过去的互动调整响应,使对话更加引人入胜和无缝。
对话RAG的流程图:
- 用户查询:用户开始对话。
- 对话上下文分析:分析当前和过去的互动。
- 相关文档检索:根据对话流程检索数据。
- 对话响应生成:生成动态、引人入胜的响应。
- 上下文调整反馈:收集反馈以改善上下文意识。
- 上下文记忆更新:更新记忆以确保未来响应的连贯性。
- 最终输出给用户:提供自然、对话式的响应。
18. 迭代 RAG:精炼专家
- 描述:迭代 RAG 通过多轮迭代精炼响应,随着每次迭代不断改进。通过从每个响应中学习,它可以精炼并提供越来越准确的答案。
- 使用场景:非常适合技术支持和故障排除,初始答案可能需要进一步精炼。
- 示例:一个技术支持机器人使用迭代 RAG 通过基于持续用户反馈精炼其响应来排查用户的问题,最终找到最佳解决方案。
迭代 RAG 的流程图:
- 用户查询: 用户描述问题。
- 初始文档检索: 检索相关的故障排除信息。
- 生成初始响应: 提供第一个可能的解决方案。
- 审查和完善响应: 根据反馈进行完善。
- 进一步迭代的反馈: 收集额外的用户输入。
- 响应优化: 迭代优化响应。
- 最终输出给用户: 提供经过完善的准确答案。
19. HybridAI RAG: 多才多艺的检索器
- 描述: HybridAI RAG 结合了多种机器学习模型,整合了各种方法的优势,以提供全面且多样化的响应。
- 使用场景: 适用于需要从多个来源提取信息的复杂系统,如预测性维护或财务建模。
- 示例: 一个预测性维护平台使用 HybridAI RAG 分析传感器和日志中的数据,通过整合多种数据模型来预测设备故障。
HybridAI RAG 的流程图:
- 用户查询:用户提供复杂查询。
- 多模型集成:整合来自多个模型的数据。
- 文档检索:从相关模型中检索数据。
- 响应生成:基于集成数据生成响应。
- 模型调整反馈:收集反馈以调整模型选择。
- 模型优化:优化模型组合以提高准确性。
- 最终输出给用户:提供包含多模型见解的响应。
20. 生成式人工智能 RAG:创造性思维者
- 描述:生成式人工智能 RAG 提取相关信息并创造性地生成新内容或想法。它非常适合需要原创性的应用,如内容创作。
- 使用场景:非常适合市场营销或品牌管理,在这些领域中,原创且引人注目的内容是非常有价值的。
- 示例:品牌助理使用生成式人工智能 RAG 创建新的社交媒体帖子,将过去的品牌信息与新的创意想法相结合,提供新鲜且引人入胜的内容。
生成式 AI RAG 流程图:
- 用户查询:用户请求新内容或创意。
- 文档检索:检索品牌指南和过去的消息。
- 创意生成:生成新的原创内容。
- 用户反馈收集:收集关于创意的反馈。
- 优化生成过程:根据反馈优化生成。
- 提升创意:提高内容生成的原创性。
- 最终输出给用户:提供新鲜、富有创意的内容。
21. XAI (可解释人工智能) RAG: 透明顾问
- 描述: XAI RAG 专注于可解释性,确保用户理解响应是如何生成的。它在需要透明度的受监管行业中特别有用。
- 使用场景: 适用于医疗或法律领域,在这些领域中,解释答案背后的推理至关重要。
- 示例: 在医疗领域,XAI RAG 为医生提供推荐的治疗方案,并包含每种治疗建议的解释,从而增强决策过程中的透明度。
XAI RAG 的流程图:
- 用户查询:用户寻求详细答案。
- 文档检索:提取包含详细数据的文档。
- 透明响应生成:生成可解释的响应。
- 可解释性层:为响应的每个部分添加解释。
- 清晰度反馈:收集反馈以改善解释。
- 精炼可解释性:根据反馈提高清晰度。
- 最终输出给用户:提供带有清晰解释的响应。
22. LLM RAG 中的上下文缓存:内存库
- 描述:LLM RAG 中的上下文缓存维护一个上下文相关信息的缓存,使其能够生成与先前交互一致的响应。
- 使用场景:非常适合教育工具,其中多个课程或主题之间的连续性至关重要。
- 示例:虚拟辅导员使用上下文缓存回忆与学生的先前课程,帮助其提供与之前学习连贯且相关的响应。
LLM RAG中的上下文缓存流程图:
- 用户查询:用户发起与过去互动相关的问题。
- 检索上下文缓存:从之前的互动中提取相关数据。
- 上下文响应生成:基于缓存的上下文生成响应。
- 用户反馈收集:收集关于连贯性的反馈。
- 更新上下文缓存:将新数据添加到缓存中。
- 优化上下文一致性:改善响应的连贯性。
- 最终输出给用户:提供上下文丰富的答案。
23. 理解 RAG:直观学习者
- 描述:理解 RAG 超越表面理解,“直观”掌握复杂概念,使其适合科学或技术研究。
- 使用场景:非常适合需要深入理解的领域,如科学研究。
- 示例:拥有理解 RAG 的研究助理通过综合复杂的化学概念,帮助科学家将复杂主题分解为易于理解的见解。
Grokking RAG 的流程图:
- 用户查询:用户询问一个复杂的概念。
- 深度文档检索:提取详细的技术文档。
- 直观响应生成:生成深入且直观的答案。
- 用户反馈收集:收集关于清晰度的反馈。
- 完善概念理解:提升对复杂主题的理解。
- 优化理解能力:增强掌握细微概念的能力。
- 最终输出给用户:提供一个既深刻又易于理解的答案。
24. Replug Retrieval Feedback: 调整连接器
- 描述: Replug Retrieval Feedback 连接到外部数据源,利用反馈来微调其检索。随着时间的推移,它改善与外部数据的整合方式,确保准确性。
- 使用场景: 最适合数据密集型领域,在这些领域中,实时数据访问和检索准确性至关重要。
- 示例: 一款市场洞察工具使用 Replug Retrieval Feedback 从金融来源检索准确的实时数据,根据反馈进行调整,以提高相关性和精确性。
Replug检索反馈的流程图:
- 用户查询:用户请求特定的实时数据。
- 外部数据源识别:识别相关的外部数据库。
- 检索外部数据:连接到数据源以进行数据检索。
- 用户反馈收集:收集有关数据相关性的反馈。
- 优化数据源选择:调整数据源连接。
- 优化外部检索:提高数据的准确性和相关性。
- 最终输出给用户:提供经过优化的准确响应。
25. Attention Unet RAG: 详细映射器
- 描述: Attention Unet RAG 利用注意力机制对数据进行细粒度分割。这使得它非常适合需要详细映射的应用,如医学成像。
- 使用场景: 适用于放射学或任何需要图像分割的应用。
- 示例: 一名放射学助理使用 Attention Unet RAG 精确分割 MRI 图像,帮助医生清晰地分析不同的组织和结构。
Attention Unet RAG 的流程图:
- 用户查询:用户请求分析(例如,医学扫描)。
- 图像数据检索:检索相关的图像数据。
- 基于注意力的分割:使用注意力机制对图像进行分割。
- 详细响应生成:生成详细的分析。
- 用户反馈收集:收集关于分割准确性的反馈。
- 优化分割:改进分割以提高准确性。
- 最终输出给用户:提供高度详细的分割分析。
结论
通过这25种RAG架构,我们可以看到检索增强生成所提供的深度和多样性。通过为每个用例选择合适的架构,公司可以确保其系统提供的响应不仅准确,而且在上下文中丰富、用户友好,并符合各种要求。