Embeddings
为人工智能代理提供个性化用户体验
- Rifx.Online
- Chatbots , Autonomous Systems , Machine Learning
- 19 Jan, 2025
基于用户角色的AI代理微调以满足企业用例 1. 引言 关于 ChatGPT(通常指生成式 AI)的讨论,现在已经演变为代理 AI。虽然 ChatGPT 主要是一个可以生成文本响应的聊天机器人,但 AI 代理可以自主执行复杂任务,例如:进行销售、规划旅行、预订航班、预定承包商进行家庭工作、点披萨。下图 1 说明了代理 AI 系统的演变。 比尔·盖茨最近[设想](htt
阅读更多为结构化和非结构化数据构建图形 RAG。
RAG 架构迄今为止是解决 LLM 缺乏上下文化的最适应和复杂的解决方案。通过 RAG,几乎不需要微调,就在很大程度上解决了使用未训练知识库的 LLM 所面临的问题。 尽管向量 RAG 可以建立上下文化,但其能力是有限的。在复杂的关系和高度互联的数据中,向量 RAG 的召回率并不令人印象深刻。其主要原因之一是构成知识库的简单向量嵌入,仅考虑几何接近性。 另一方面,图形天生结构化,以捕
阅读更多用Google Gemini 2.0 API构建RAG!推荐系统的未来在哪里?
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 11 Jan, 2025
LangChain与Vertex AI RAG引擎在亚马逊产品数据上的比较 谷歌在人工智能竞赛中似乎一直处于落后,但在2025年之前发布的Gemini 2.0让人感觉他们终于在某种程度上赶上了。我起初不确定会有什么期待,但在试用后,我对其能力感到由衷的印象深刻。它甚至让我怀疑像ChatGPT、Claude或Llama这样的工具是否仍然必要。**Gemini实时[
阅读更多Gemini 2.0 Flash + 本地多模式 RAG + 上下文感知 Python 项目:文档的简易人工智能/聊天
- Rifx.Online
- Programming , Chatbots , Generative AI
- 26 Dec, 2024
在这个视频中,我将展示一个超级快速的教程,教你如何创建一个本地多模态 RAG、Gemini 2.0 Flash 和上下文感知响应,以便为你的业务或个人使用打造一个强大的代理聊天机器人——一个不需要强大笔记本电脑的聊天机器人。 年末时,大模型产品之间的竞争再次加剧。在我上一个视频中,我介绍了 LLama3.3\。 在12月11日,谷歌发布了 **Gemini 2.0 Flash。
阅读更多我如何利用 ChromaDB 和 Chainlit 构建基于 Graph-RAG 系统的 LLM 应用程序
一个端到端的应用,带有 GUI,并且仅用 3 个脚本将新知识存储在向量数据库中 大型语言模型(LLMs)和知识图谱是处理自然语言的宝贵工具。检索增强生成(RAG)作为一种强大的方法,能够通过上下文知识增强 LLM 的响应。上下文知识通常嵌入并存储在向量数据库中,用于创建上下文以增强提示。然而,这种方式下,知识被映射在一个概念空间中,但并没有真正组织起来。知识图谱捕捉了领域内数据点或实体
阅读更多你准备好迎接人工智能的未来了吗?OpenAI 的 Swarm 可能会改变一切
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 06 Dec, 2024
学习如何配置和个性化 OpenAI 的 Swarm 框架,以创建强大的、协作的多代理系统,满足您的独特需求并推动更智能的自动化 想象一个复杂问题不是由单一 AI 而是由一个团队的智能代理无缝协作解决的世界。OpenAI 的 Swarm 使这一愿景成为现实。它是一个开创性的框架,利用 LLM 的力量创建一个协作的系统,其中每个代理都有独特的角色。 无论是自动化耗时的工作流程、解决多
阅读更多使用 LangChain + Streamlit + *o1、GTP-4o 和 Claude 3.5 编写 RAG LLM 聊天应用程序
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 20 Nov, 2024
学习如何使用 Python、Streamlit 和 LangChain 构建 RAG 网络应用,以便您可以与文档、网站和其他自定义数据进行聊天。 GitHub 代码:https://github.com/enricd/rag_llm_app RAG LLM Streamlit 应用:[https://rag\-llm\-app.streamlit.app/](https://rag-
阅读更多在 B2C 行业中利用大型语言模型 (LLM):在 B2C 行业中利用大型语言模型 (LLM):...
- Rifx.Online
- Programming , Machine Learning , Chatbots
- 16 Nov, 2024
在金融服务、零售和电子商务等B2C行业快速发展的环境中,客户对个性化和即时响应的期望达到了前所未有的高度。随着人工智能技术的进步,尤其是大型语言模型(LLMs)的发展,企业在处理客户互动方面发生了剧烈变化。在银行和信用卡服务等行业,客户经常寻求有关产品、福利或交易的详细信息,因此采用基于LLM的自主代理提供了显著的优势。这些代理能够提供实时、智能的响应,转变客户参与方式,同时提高运营效率
阅读更多在构建非英语 RAG 系统时,嵌入为什么很重要 - 多语言嵌入
为什么嵌入是关键 嵌入是现代生成 AI 的基石,默默推动着我们每天互动的许多系统的功能。简单来说,嵌入是 文本的数值表示 —— 有效地将单词、句子甚至整个文档转换为数字。这些数字远非随机;它们经过精心设计,以捕捉文本中的含义和关系。例如,“dog”和“puppy”的嵌入在数值空间中会更靠近,而“car”的嵌入则会相对较远,反映出它们的 语义相似性。将意义编码为可测量的
阅读更多可视化你的 RAG 数据——使用 Ragas 评估你的检索增强生成系统
如何使用 UMAP 降维将嵌入可视化以展示多个评估问题及其与源文档的关系,结合 Ragas、OpenAI、Langchain 和 ChromaDB 检索增强生成(RAG)在 LLM 的工作流程中增加了一个检索步骤,使其能够在回答问题和查询时,从私人文档等额外来源查询相关数据 [1]。该工作流程不需要对额外文档进行昂贵的训练或微调。文档被拆分成片段,然后进行索引,通常使用紧凑的 M
阅读更多检索增强生成:方法、最新进展和优化策略
⭐ RAG 在知识密集型场景或需要持续更新知识的特定领域应用中尤其有用。最近,RAG 因其在对话代理中的应用而受到广泛关注。 📌 参考研究主要集中在当前的 RAG 方法及其不同组件、最新进展(SOTA)、应用、检索、生成、增强技术的评估上。 随着 RAG 系统从简单到高级再到模块化的演变,每个阶段都是为了应对特定用例的增强而出现的。 ![](https://images.wese
阅读更多