Rag
开发人员 2025 年人工智能入门路线图
在我上一篇文章中,我写了关于初学者学习 AI 的路径,试图揭开其工具和日常任务应用的神秘面纱。 这次,我们将大幅度转向。 想象一下,完全独立构建、部署甚至货币化 SaaS 应用程序,但你不知道从哪里开始。本文主要面向寻找指南或课程的初级开发者,将介绍一些关键概念、工具和策略,帮助你入门。 和往常一样,我将文章组织成几个大类别和主题,这些内容并不需要按顺序阅读,所以如果你已经熟悉某些
阅读更多为结构化和非结构化数据构建图形 RAG。
RAG 架构迄今为止是解决 LLM 缺乏上下文化的最适应和复杂的解决方案。通过 RAG,几乎不需要微调,就在很大程度上解决了使用未训练知识库的 LLM 所面临的问题。 尽管向量 RAG 可以建立上下文化,但其能力是有限的。在复杂的关系和高度互联的数据中,向量 RAG 的召回率并不令人印象深刻。其主要原因之一是构成知识库的简单向量嵌入,仅考虑几何接近性。 另一方面,图形天生结构化,以捕
阅读更多使用自定义工具构建和服务 RAG 代理:完整指南
- Rifx.Online
- Programming , Generative AI , Data Science
- 14 Jan, 2025
目标 本文的目标是演示如何使用 LangGraph 和 LangChain 创建一个大型语言模型(LLM)代理,该代理将在一组文档上执行检索增强生成(RAG)。此外,我们将探讨如何构建一个工具,以便进行 API 调用,从而使 LLM 能够从外部来源获取实时知识。最后,我们将使用 Flask API(FastAPI)在本地提供此代理,并使用本地 PostgreSQL 数据库服务器存
阅读更多使用 LangGraph 构建 RAG 研究多重代理
❓引言 — 天真的 RAG 与 代理 RAG 🧠 项目概述 📊 结果 🔚 结论在本文中,我们介绍了一个实用项目,使用 LangGraph 开发了一个 RAG 研究多代理 工具。该工具旨在解决需要 多个来源 和 迭代步骤 才能得出最终答案的 复杂问题。它采用 混合搜索 和 Cohere **重新排序步
阅读更多简化的人工智能代理:人工智能代理如何利用领域知识回答问题
揭秘企业AI代理如何利用领域知识定制回答客户问题,并严格限制答案在领域知识范围内。 背景 你是否曾想过,今天最先进平台上的尖端 AI 代理是如何运作的?例如,在上面的截图中,我向 wealthsimple.com 的 AI 代理询问利率问题,它提供了特定于 Wealthsimple 产品的答案,并将其限制在 Wealthsimple 产品范围内。它没有告诉我美国银行的现
阅读更多使用 Python 构建您自己的个性化健身 RAG 代理!
- Rifx.Online
- Programming , Generative AI , Health
- 14 Jan, 2025
AI代理 | RAG代理 | Python | DSPy | 健身代理 | 初学者友好 完整且适合初学者的指南:使用 Python 构建您完全个性化的健身 RAG 代理***还不是会员?请随时访问完整文章 [这里](https://readmedium.com/69fe37b803f6?source=friends_link&sk=13d4674246ba
阅读更多用Google Gemini 2.0 API构建RAG!推荐系统的未来在哪里?
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 11 Jan, 2025
LangChain与Vertex AI RAG引擎在亚马逊产品数据上的比较 谷歌在人工智能竞赛中似乎一直处于落后,但在2025年之前发布的Gemini 2.0让人感觉他们终于在某种程度上赶上了。我起初不确定会有什么期待,但在试用后,我对其能力感到由衷的印象深刻。它甚至让我怀疑像ChatGPT、Claude或Llama这样的工具是否仍然必要。**Gemini实时[
阅读更多2025 年最著名的 21 个 RAG 框架
通过高级检索增强生成技术革新人工智能 披露:我使用GPT搜索。整篇文章仍由我草拟。我的写作风格倾向于自信和分析性,相比之前的文章,不依赖于ChatGPT辅助写作。感谢您与我一起参与这段旅程,我希望在未来几年继续为您提供价值!通过支持我来提供建议。 截至2025年1月4日, 免责声明:[类似](https://sebastian-petrus.medium.
阅读更多巧用OpenAI o3和Swarm,打造多元化聊天机器人!你准备好迎接高效智能沟通了吗?
- Rifx.Online
- Chatbots , Programming/Scripting , Machine Learning
- 30 Dec, 2024
在这个故事中,我将为您提供一个超级快速的教程,展示如何使用Swarm、RAG和OpenAI的o3创建一个多智能体聊天机器人,为您的商业或个人使用提供强大的代理聊天功能。 近年来,随着AI技术的发展,多个AI智能体协作完成任务的“多智能体系统”引起了广泛关注。 大型语言模型(LLMs)就像能够独立思考的人脑,而AI智能体是进一步与环境互动、制定计划并最终执行任务的系统。与LLMs相比,AI
阅读更多代理 RAG 系列:探索 LangGraph 高级工作流程
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 27 Dec, 2024
介绍 在上一篇文章中,我们介绍了Agentic RAG的概念,强调它如何通过集成自主代理能力来扩展传统的检索增强生成(RAG)框架。在本期中,我们深入探讨LangGraph,这是一个用于协调逻辑工作流程的创新框架。LangGraph使得创建具有复杂推理能力的多代理系统成为可能,是构建Agentic RAG架构的理想工具。 ![](https://wsrv.nl/?u
阅读更多现代人工智能的核心:知识图谱和矢量数据库
- Rifx.Online
- Technology , Data Science , Machine Learning
- 27 Dec, 2024
在快速发展的人工智能领域,检索增强生成(RAG)系统因其能够通过从外部数据库检索相关信息来增强传统人工智能模型而日益受到欢迎。这项技术的核心是两个关键工具——知识图谱和向量数据库——它们以根本不同的方式运作,但相辅相成,以解决各种问题。 为了理解它们的重要性,让我们来分析它们的概念、差异、优势,以及它们如何重塑各个行业。 1. 知识图谱:连接的基础
阅读更多2024 年 RAG 的崛起与演变:年度回顾
- Rifx.Online
- Generative AI , Machine Learning , Data Science
- 27 Dec, 2024
随着2024年的结束,检索增强生成(RAG)的发展可谓波澜起伏。让我们从多个角度全面回顾这一年的进展。 RAG演变中的关键事件 辩论:“RAG已死,RAG万岁!” 在2024年初,这一年被一些人称为“RAG之年”,尽管这一称谓并未得到普遍认可。然而,全年取得的进展确实证明了这一称号的合理性。在涉及大型语言模型(LLMs)的场景中,RAG始终被证明是不可或缺的角色。然而
阅读更多构建生产就绪的人工智能助理后台服务(Python)--第 2 部分
- Rifx.Online
- Programming , Generative AI , Chatbots
- 26 Dec, 2024
— 使用 LangGraph 构建多代理 RAG 系统 + 用授权密钥头保护您的应用程序 *免责声明 — 本文内容仅代表我个人观点,不代表我当前或过去雇主的立场。* 在上一部分([第 1 部分](https://readmedium.com/build-production-ready-ai-assistant-backend-service-in-python-part-
阅读更多Gemini 2.0 Flash + 本地多模式 RAG + 上下文感知 Python 项目:文档的简易人工智能/聊天
- Rifx.Online
- Programming , Chatbots , Generative AI
- 26 Dec, 2024
在这个视频中,我将展示一个超级快速的教程,教你如何创建一个本地多模态 RAG、Gemini 2.0 Flash 和上下文感知响应,以便为你的业务或个人使用打造一个强大的代理聊天机器人——一个不需要强大笔记本电脑的聊天机器人。 年末时,大模型产品之间的竞争再次加剧。在我上一个视频中,我介绍了 LLama3.3\。 在12月11日,谷歌发布了 **Gemini 2.0 Flash。
阅读更多构建 Agentic RAG(检索-增强生成)管道的实践演示
- Rifx.Online
- Generative AI , Autonomous Systems , Technology/Web
- 26 Dec, 2024
插图展示了自主代理如何参与 RAG 系统,以检索最相关的信息片段。 什么是Agentic RAG? 我们都知道什么是检索增强生成(Retrieval Augmented Generation,RAG)。但让我们快速回顾一下。检索增强生成是一种强大且流行的管道,通过从大型语言模型中增强响应来提升其表现。它通过将从向量数据库中检索到的相关数据作为上下文添加到提示中,并将其发送给LLM进
阅读更多如何使用 CrewAI 和 Langchain 构建代理 RAG
在快速发展的 AI 领域,提供准确、上下文感知的用户查询响应能力是一个游戏改变者。检索增强生成(RAG)作为一种强大的范式,结合了从外部来源检索相关信息与大型语言模型(LLMs)的生成能力。然而,随着查询变得越来越复杂和多样化,静态 RAG 设置可能并不总是足够。这就是 Agentic RAG 发挥作用的地方。 Agentic RAG 引入了一个智能的模块化框架,其中专门的代理协同
阅读更多使用 Markdown 和 Gemini 为 RAG 解锁 PDF
- Rifx.Online
- Programming , Technology , Data Science
- 26 Dec, 2024
可以说,检索增强生成(RAG)为许多企业和组织带来了变革。通过将像 Gemini 这样的 LLM 的内置功能与您自己的信息相结合,您可以创造出真正具有变革性的强大体验。 尽管如此,创建一个能够很好处理复杂非结构化文档(如 PDF)的 RAG 应用程序仍然是一个挑战。 **本文提出了一种从
阅读更多Agentic Workflow and Retrieval-Augmented Generation:实时健康监测指南
- Rifx.Online
- Health , Technology , Ethics
- 19 Dec, 2024
探索这种模块化架构如何彻底改变实时医疗数据分析,增强对高风险老年人的监督。通过将多智能体系统(MAS)与检索增强生成(RAG)集成,本指南为医疗保健和人工智能领域的专业人士提供优化患者监测和提供准确、可操作见解的工具。 介绍 传统的医疗监测系统通常依赖于静态的线性管道。数据被处理,规则被应用,结果被生成。虽然这种线性方法有效,但可能显得僵化,适应性差,并且对患者不断变化的临
阅读更多LangChain 与 LlamaIndex:检索增强生成(RAG)的综合比较
- Rifx.Online
- Generative AI , Data Science , Programming/Scripting
- 15 Dec, 2024
介绍 Retrieval-Augmented Generation (RAG) 结合了信息检索与生成模型,使其成为一个强大的技术,适用于问答、摘要及其他自然语言处理任务。要实现 RAG,目前最流行的两个框架是 LangChain 和 LlamaIndex。这两个框架旨在处理文档的摄取、拆分、索引以及将步骤链在一起,以实现无缝的 RAG 工作流程。但哪个框架更适合您
阅读更多什么是人工智能代理?从虚拟助理到智能决策者
- Rifx.Online
- Chatbots , Autonomous Systems , Machine Learning
- 15 Dec, 2024
从零开始理解AI代理的指南 最近,从基于LLM的聊天机器人转向该领域现在定义为代理系统或代理AI的变化可以用一句老话来总结:“少说多做。” 跟上技术进步可能令人畏惧,尤其是当你已经有一个现有的业务时。更不用说技术进步的速度和复杂性可能会让你感觉像是开学的第一天。 本文提供了基于其组件和特征的AI代理概述。引言部分涵盖了构成“AI代理”一词的组件,以创建一个直观的定义。在建立
阅读更多利用多代理 RAG 构建企业人工智能应用程序!
- Rifx.Online
- Generative AI , Machine Learning , Data Science
- 12 Dec, 2024
作者: Pavan Belagatti 和 Madhukar Kumar 在快速发展的AI领域中,[多智能体检索增强生成](https://readmedium.com/how-to-build-enterprise-ai-apps
阅读更多掌握 25 种 RAG 架构:何时以及如何使用每一种
介绍 检索增强生成 (RAG) 架构彻底改变了我们处理信息检索的方式。这些架构弥合了生成响应与提取相关数据之间的差距,使模型能够提供准确、实时且具有上下文意识的答案。但在众多可用的 RAG 架构中,您如何知道在每种独特场景中使用哪一个? 在本指南中,我们将深入探讨 25 种 RAG 架构,解释它们的具体用途,并提供现实世界的示例,以演示每种架构何时最有效。 1. Corr
阅读更多LazyGraphRAG:高效和有效 RAG 的新时代 | 作者:Ankush k Singal | 2024年11月 | Medium
- Rifx.Online
- Generative AI , Machine Learning , Data Science
- 27 Nov, 2024
介绍 在人工智能领域,检索增强生成(RAG)已成为一种强大的技术,以增强大型语言模型(LLMs)的能力。RAG使LLMs能够访问和处理来自外部知识源的大量信息,从而提供更具信息性和综合性的响应。然而,传统的RAG方法在处理大型数据集时可能计算成本高且耗时。 为了解决这些限制,提出了一种称为LazyGraphRAG的新方法。这种创新技术在效率和有效性方面提供了显著的优势,使其成为广泛
阅读更多如何使用 LangGraph 构建人工智能代理:分步指南
- Rifx.Online
- Programming , Machine Learning , Generative AI
- 25 Nov, 2024
介绍 在人工智能的世界中,检索增强生成(RAG)系统已成为处理简单查询和生成上下文相关响应的常用工具。然而,随着对更复杂的人工智能应用需求的增长,出现了超越这些检索能力的系统的需求。AI代理应运而生——这些自主实体能够执行复杂的多步骤任务,在交互中保持状态,并动态适应新信息。LangGraph,作为LangChain库的强大扩展,旨在帮助开发人员构建这些先进的AI代理,通过启
阅读更多介绍 LightRAG:检索增强一代的新时代
在快速发展的自然语言处理领域,检索增强生成(RAG)系统已成为提供准确、上下文丰富的响应的关键。然而,传统的 RAG 系统在更新知识库或处理复杂查询时,往往面临效率低下的问题。 引入 LightRAG,这是一个新颖的系统,旨在通过提供高效、增量更新和优化的检索过程来解决这些挑战。 传统 RAG 系统的问题 在我们深入了解 LightRAG 之前,先来理解一下我们为什么
阅读更多掌握 LangGraph:人工智能系统、RAG、代理和工具终极指南
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 25 Nov, 2024
您是否希望深入了解 LangGraph,这一 AI 技术的最新热词?无论您是开发者、学生还是技术爱好者,理解 LangGraph 及其相关概念,如 AI 助手、检索增强生成(RAG)、代理和工具,对于构建更智能、更互动的 AI 系统至关重要。在本文中,我们将分解 LangGraph 的基本内容,探索关键特性,并逐步指导您构建实用项目。 目录*什么是 LangGraph?
阅读更多Claude 3.5 Sonnet on Amazon Bedrock:人工智能知识库的新时代
- Rifx.Online
- Technology , Machine Learning , Generative AI
- 20 Nov, 2024
在不断发展的人工智能领域,保持领先意味着要以热情和战略眼光拥抱最新的创新。其中一个在人工智能社区引起轰动的创新是 Anthropic 的 Claude 3.5 Sonnet 模型与 Amazon Bedrock 知识库的最近整合。这不仅仅是一次例行升级——这是我们管理、检索和生成上下文准确响应的方式的重大飞跃。 但是,是什么让 Claude 3.5 Sonnet 如此开创性?为什么
阅读更多使用 LangChain + Streamlit + *o1、GTP-4o 和 Claude 3.5 编写 RAG LLM 聊天应用程序
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 20 Nov, 2024
学习如何使用 Python、Streamlit 和 LangChain 构建 RAG 网络应用,以便您可以与文档、网站和其他自定义数据进行聊天。 GitHub 代码:https://github.com/enricd/rag_llm_app RAG LLM Streamlit 应用:[https://rag\-llm\-app.streamlit.app/](https://rag-
阅读更多在 B2C 行业中利用大型语言模型 (LLM):在 B2C 行业中利用大型语言模型 (LLM):...
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 16 Nov, 2024
在金融服务、零售和电子商务等B2C行业快速发展的环境中,客户对个性化和即时响应的期望达到了前所未有的高度。随着人工智能技术的进步,尤其是大型语言模型(LLMs)的发展,企业在处理客户互动方面发生了剧烈变化。在银行和信用卡服务等行业,客户经常寻求有关产品、福利或交易的详细信息,因此采用基于LLM的自主代理提供了显著的优势。这些代理能够提供实时、智能的响应,转变客户参与方式,同时提高运营效率
阅读更多人工智能研究代理:2025 年将改变知识研究(外加三大免费工具)
- Rifx.Online
- Research , Data Science , Generative AI
- 16 Nov, 2024
事情是这样的:一些重大变化即将动摇知识研究的世界。 在深入研究AI研究代理并在各个行业看到它们的实际应用几个月后,我可以肯定地告诉你——到2025年,这些工具不仅仅是有用的工具。它们将从根本上改变我们进行知识研究的方式(无论是营销还是科学!)。人类在一个小时内访问10,000个网站并研究数据在物理上是不可能的。然而,代理可以轻松做到这一点。在这篇文章中,我将向你展示3个
阅读更多使用 LangChain、Streamlit 和 PubMed 构建基于 RAG 的科学聊天机器人--第 4 部分(将所有...
- Rifx.Online
- Chatbots , Natural Language Processing , Science
- 13 Nov, 2024
您好,欢迎来到构建科学聊天机器人的系列最后一部分,使用Langchain、Streamlit和PubMed! 在前一部分中,我们构建了数据持久性和带有向量存储的RAG管道。现在,是时候将我们所构建的一切整合在一起,创建聊天机器人用户界面,利用我们构建的后端功能,帮助科学家回答他们的科学问题! 作为提醒,这就是我们在系列中构建的完整解决方案: ![](https://images.w
阅读更多在构建非英语 RAG 系统时,嵌入为什么很重要 - 多语言嵌入
为什么嵌入是关键 嵌入是现代生成 AI 的基石,默默推动着我们每天互动的许多系统的功能。简单来说,嵌入是 文本的数值表示 —— 有效地将单词、句子甚至整个文档转换为数字。这些数字远非随机;它们经过精心设计,以捕捉文本中的含义和关系。例如,“dog”和“puppy”的嵌入在数值空间中会更靠近,而“car”的嵌入则会相对较远,反映出它们的 语义相似性。将意义编码为可测量的
阅读更多使用 Llama 3 构建 AI 代理
- Rifx.Online
- Programming , Generative AI , Chatbots
- 10 Nov, 2024
构建具有 Llama 3 函数调用能力的 AI 代理的综合指南 引言 想象一下你想买一些东西。你访问一个电子商务网站,使用搜索选项找到你想要的东西。也许你有多个物品要购买,因此这个过程并不是很高效。现在考虑这个场景:打开一个应用程序,用简单的英语描述你想要的东西,然后按下回车。你不必担心搜索和价格比较,因为应用程序会自动为你处理这些事情。很酷,对吧?这正是我们将在本教
阅读更多使用 Gemini Pro 和 LangChain 的多模式 RAG
- Rifx.Online
- Programming , Machine Learning , Computer Vision
- 08 Nov, 2024
介绍 在本教程中,我们将探索将 Gemini Pro 和 Gemini Pro Vision 与 LangChain 框架集成,以实现多模态(在这种情况下为图像)检索增强生成(RAG)。
阅读更多LongRAG:让人工智能在信息海洋中捕捞更多鱼
在 我之前的文章 中,我介绍了RAG是否会因长上下文LLMs而变得过时。今天,让我们看看如何将长上下文LLMs应用于RAG场景。 在检索增强生成(RAG)领域,传统方法一直依赖于短检索单元,通常约为100个单词,这迫
阅读更多可视化你的 RAG 数据——使用 Ragas 评估你的检索增强生成系统
如何使用 UMAP 降维将嵌入可视化以展示多个评估问题及其与源文档的关系,结合 Ragas、OpenAI、Langchain 和 ChromaDB 检索增强生成(RAG)在 LLM 的工作流程中增加了一个检索步骤,使其能够在回答问题和查询时,从私人文档等额外来源查询相关数据 [1]。该工作流程不需要对额外文档进行昂贵的训练或微调。文档被拆分成片段,然后进行索引,通常使用紧凑的 M
阅读更多Agentic RAG 如何解决当前 RAG 限制的问题
- Rifx.Online
- Generative AI , Data Science , Machine Learning
- 04 Nov, 2024
在本卷咖啡休息概念的第 4 期中,我们将了解 AgenticRAG 如何帮助解决传统 RAG 的限制。 RAG框架 RAG(检索增强生成)框架按特定顺序操作: 文档 -> 片段 -> 向量数据库 -> 片段检索(前K个) -> LLM 然而,这一顺序在处理某些类型的查询时会遇到障碍。 问题 1:摘要 考虑一个查询,比如“总结文档”。传统
阅读更多如何使用 RAG 提高 LLM 成绩
初学者友好的介绍 w/ Python 代码 本文是关于在实践中使用大型语言模型的更大系列的一部分。在[上一篇文章](https://towardsdatascience.com/qlora-how-to-fine-tune-an-ll
阅读更多追求生产质量 Graph RAG:开始容易,完成难
- Rifx.Online
- Programming , Data Science , Generative AI
- 01 Nov, 2024
克服图形 RAG 生产化的挑战 当我阅读最近在 VentureBeat 上关于 Glean [刚刚在最新融资轮中获得超过 2.6 亿美元的文章](https://venturebeat.com/data-infrastructure/how-to-take-advantage-of-a-generative-tool-fueling-gleans-260m-raise-grap
阅读更多检索增强生成:方法、最新进展和优化策略
⭐ RAG 在知识密集型场景或需要持续更新知识的特定领域应用中尤其有用。最近,RAG 因其在对话代理中的应用而受到广泛关注。 📌 参考研究主要集中在当前的 RAG 方法及其不同组件、最新进展(SOTA)、应用、检索、生成、增强技术的评估上。 随着 RAG 系统从简单到高级再到模块化的演变,每个阶段都是为了应对特定用例的增强而出现的。 ![](https://images.wese
阅读更多RAG/LLM 和 PDF:使用 PyMuPDF 转换为 Markdown 文本
- Rifx.Online
- Programming , Technology , Technology/Web
- 24 Oct, 2024
以Markdown文本格式输入数据可以提高生成文本的质量 介绍 在大型语言模型(LLMs)和检索增强生成(RAG)环境中,以markdown文本格式输入数据具有重要意义。以下是一些详细考虑因素。 LLMs 是强大的语言模型,可以生成连贯且具有上下文相关性的文本。然而,它们有时可能会产生缺乏事实准确性或上下文的响应。通过结合基于检
阅读更多