Embeddings

为人工智能代理提供个性化用户体验

Rifx.Online
Chatbots , Autonomous Systems , Machine Learning
19 Jan, 2025

基于用户角色的AI代理微调以满足企业用例 1. 引言关于 ChatGPT（通常指生成式 AI）的讨论，现在已经演变为代理 AI。虽然 ChatGPT 主要是一个可以生成文本响应的聊天机器人，但 AI 代理可以自主执行复杂任务，例如：进行销售、规划旅行、预订航班、预定承包商进行家庭工作、点披萨。下图 1 说明了代理 AI 系统的演变。比尔·盖茨最近[设想](htt

为结构化和非结构化数据构建图形 RAG。

Rifx.Online
Programming , Natural Language Processing , Data Science
14 Jan, 2025

RAG 架构迄今为止是解决 LLM 缺乏上下文化的最适应和复杂的解决方案。通过 RAG，几乎不需要微调，就在很大程度上解决了使用未训练知识库的 LLM 所面临的问题。尽管向量 RAG 可以建立上下文化，但其能力是有限的。在复杂的关系和高度互联的数据中，向量 RAG 的召回率并不令人印象深刻。其主要原因之一是构成知识库的简单向量嵌入，仅考虑几何接近性。另一方面，图形天生结构化，以捕

用Google Gemini 2.0 API构建RAG！推荐系统的未来在哪里？

Rifx.Online
Programming , Machine Learning , Chatbots
11 Jan, 2025

LangChain与Vertex AI RAG引擎在亚马逊产品数据上的比较谷歌在人工智能竞赛中似乎一直处于落后，但在2025年之前发布的Gemini 2.0让人感觉他们终于在某种程度上赶上了。我起初不确定会有什么期待，但在试用后，我对其能力感到由衷的印象深刻。它甚至让我怀疑像ChatGPT、Claude或Llama这样的工具是否仍然必要。**Gemini实时[

Gemini 2.0 Flash + 本地多模式 RAG + 上下文感知 Python 项目：文档的简易人工智能/聊天

在这个视频中，我将展示一个超级快速的教程，教你如何创建一个本地多模态 RAG、Gemini 2.0 Flash 和上下文感知响应，以便为你的业务或个人使用打造一个强大的代理聊天机器人——一个不需要强大笔记本电脑的聊天机器人。年末时，大模型产品之间的竞争再次加剧。在我上一个视频中，我介绍了 LLama3.3\。在12月11日，谷歌发布了 **Gemini 2.0 Flash。

我如何利用 ChromaDB 和 Chainlit 构建基于 Graph-RAG 系统的 LLM 应用程序

Rifx.Online
Programming , Machine Learning , Natural Language Processing
26 Dec, 2024

一个端到端的应用，带有 GUI，并且仅用 3 个脚本将新知识存储在向量数据库中大型语言模型（LLMs）和知识图谱是处理自然语言的宝贵工具。检索增强生成（RAG）作为一种强大的方法，能够通过上下文知识增强 LLM 的响应。上下文知识通常嵌入并存储在向量数据库中，用于创建上下文以增强提示。然而，这种方式下，知识被映射在一个概念空间中，但并没有真正组织起来。知识图谱捕捉了领域内数据点或实体

你准备好迎接人工智能的未来了吗？OpenAI 的 Swarm 可能会改变一切

Rifx.Online
Programming , Machine Learning , Chatbots
06 Dec, 2024

学习如何配置和个性化 OpenAI 的 Swarm 框架，以创建强大的、协作的多代理系统，满足您的独特需求并推动更智能的自动化想象一个复杂问题不是由单一 AI 而是由一个团队的智能代理无缝协作解决的世界。OpenAI 的 Swarm 使这一愿景成为现实。它是一个开创性的框架，利用 LLM 的力量创建一个协作的系统，其中每个代理都有独特的角色。无论是自动化耗时的工作流程、解决多

使用 LangChain + Streamlit + *o1、GTP-4o 和 Claude 3.5 编写 RAG LLM 聊天应用程序

Rifx.Online
Programming , Machine Learning , Chatbots
20 Nov, 2024

学习如何使用 Python、Streamlit 和 LangChain 构建 RAG 网络应用，以便您可以与文档、网站和其他自定义数据进行聊天。 GitHub 代码：https://github.com/enricd/rag_llm_app RAG LLM Streamlit 应用：[https://rag\-llm\-app.streamlit.app/](https://rag-

在 B2C 行业中利用大型语言模型 (LLM)：在 B2C 行业中利用大型语言模型 (LLM)：...

Rifx.Online
Programming , Machine Learning , Chatbots
16 Nov, 2024

在金融服务、零售和电子商务等B2C行业快速发展的环境中，客户对个性化和即时响应的期望达到了前所未有的高度。随着人工智能技术的进步，尤其是大型语言模型（LLMs）的发展，企业在处理客户互动方面发生了剧烈变化。在银行和信用卡服务等行业，客户经常寻求有关产品、福利或交易的详细信息，因此采用基于LLM的自主代理提供了显著的优势。这些代理能够提供实时、智能的响应，转变客户参与方式，同时提高运营效率

在构建非英语 RAG 系统时，嵌入为什么很重要 - 多语言嵌入

Rifx.Online
Natural Language Processing , Machine Learning , Multilingual
13 Nov, 2024

为什么嵌入是关键嵌入是现代生成 AI 的基石，默默推动着我们每天互动的许多系统的功能。简单来说，嵌入是文本的数值表示 —— 有效地将单词、句子甚至整个文档转换为数字。这些数字远非随机；它们经过精心设计，以捕捉文本中的含义和关系。例如，“dog”和“puppy”的嵌入在数值空间中会更靠近，而“car”的嵌入则会相对较远，反映出它们的语义相似性。将意义编码为可测量的

可视化你的 RAG 数据——使用 Ragas 评估你的检索增强生成系统

Rifx.Online
Natural Language Processing , Generative AI , Data Science
04 Nov, 2024

如何使用 UMAP 降维将嵌入可视化以展示多个评估问题及其与源文档的关系，结合 Ragas、OpenAI、Langchain 和 ChromaDB 检索增强生成（RAG）在 LLM 的工作流程中增加了一个检索步骤，使其能够在回答问题和查询时，从私人文档等额外来源查询相关数据 [1]。该工作流程不需要对额外文档进行昂贵的训练或微调。文档被拆分成片段，然后进行索引，通常使用紧凑的 M

检索增强生成：方法、最新进展和优化策略

Rifx.Online
Generative AI , Natural Language Processing , Machine Learning
31 Oct, 2024

⭐ RAG 在知识密集型场景或需要持续更新知识的特定领域应用中尤其有用。最近，RAG 因其在对话代理中的应用而受到广泛关注。 📌 参考研究主要集中在当前的 RAG 方法及其不同组件、最新进展（SOTA）、应用、检索、生成、增强技术的评估上。随着 RAG 系统从简单到高级再到模块化的演变，每个阶段都是为了应对特定用例的增强而出现的。 ![](https://images.wese