如何使用 DeepSeek-R1、LangChain 和 Ollama 构建隐私优先的 RAG

Rifx.Online
Programming , Generative AI , Data Science
12 Feb, 2025

在本指南中，您将学习如何构建一个 检索增强生成 (RAG) 系统，该系统使用 DeepSeek-R1、LangChain、Ollama 和 Streamlit 在本地处理 PDF 文件。这个逐步教程结合了 LangChain 的模块化能力和 DeepSeek-R1 的隐私优先方法，提供了一个强大的解决方案，用于处理技术、法律和学术文档。

该项目将 LangChain（一个用于 RAG 工作流的 AI 框架）与 Ollama（用于 DeepSeek-r1 本地部署）和 Streamlit（用于用户界面）结合在一起。最终结果是一个能够 本地摄取 PDF 并 快速准确回答问题 的 AI 助手。

在本演示中，我们将使用一个 7B 参数的 DeepSeek-r1 精简模型，但如果您拥有更强大的计算能力，我建议使用其他 DeepSeek-r1 精简模型。

为什么选择私人RAG解决方案？

基于云的AI解决方案功能强大，但通常面临诸如隐私风险和重复成本等挑战。通过利用LangChain的模块化框架，您可以创建一个具有众多优势的本地RAG解决方案：

数据隐私：所有操作都在本地进行，您的数据永远不会离开您的机器。
成本效率：无需昂贵的API订阅，此解决方案是免费的和开源的。
可定制性：LangChain的灵活性使您能够微调文档检索和响应生成管道。
强大的AI：与DeepSeek-R1集成，这是一个优化用于解决问题和技术任务的推理模型。

工具和技术：LangChain、DeepSeek-R1、Ollama、ChromaDB 和 Streamlit

该项目由以下部分组成：

LangChain：RAG 流水线的核心框架，支持文档加载器、向量存储和 LLM 的集成。它允许根据您的特定需求定制模块化和可扩展的 AI 工作流程。
DeepSeek-R1：一种用于编码、解决问题和技术任务的推理 LLM。提供多种精简版本以便与 Ollama 进行本地部署。
Ollama：一个命令行工具，简化本地 LLM 和嵌入模型（如 DeepSeek-R1 和 mxbai-embed-large）的部署和管理。
ChromaDB：一个向量数据库，用于存储和检索文档嵌入，以便进行基于相似性的查询。
Streamlit：一个用于构建网页界面的 Python 库，使您的 RAG 应用程序用户友好且易于访问。

构建 RAG 流水线：逐步指南

以下是如何设置本地 ChatPDF 解决方案的步骤：

1. 安装先决条件

确保您已安装 Python 3.8+ 和 Ollama。运行以下命令：

curl -fsSL https://ollama.com/install.sh | sh
ollama -v  # 验证安装

下载所需的 AI 模型：

ollama pull deepseek-r1:latest # 默认 7B 模型
ollama pull mxbai-embed-large  # 嵌入模型

2. 设置项目

克隆仓库并设置虚拟环境：

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1.git
cd chatpdf-rag-deepseek-r1
python3 -m venv venv
source venv/bin/activate

安装依赖：

pip install -r requirements.txt

3. 运行应用程序

启动 Streamlit 应用程序：

streamlit run app.py

在浏览器中访问应用程序，地址为 http://localhost:8501。上传您的 PDF 文件，调整检索设置并开始提问。

使用 DeepSeek-R1、Ollama、LangChain 和 ChromaDB 构建 RAG 管道

该项目使用 LangChain 管理整个 RAG 工作流：

使用 LangChain 进行 PDF 导入：

使用 LangChain 的 PyPDFLoader 和 RecursiveCharacterTextSplitter 读取并拆分 PDF 文件。
将块嵌入为向量表示，使用 OllamaEmbeddings。

2. 使用 ChromaDB 进行文档检索：

LangChain 与 ChromaDB 的集成实现了快速的基于相似度的相关文档块检索。
自定义结果数量 (k) 和相似度阈值 (score_threshold)，以更好地控制。

3. 使用 DeepSeek-R1 生成响应：

检索到的文档块被传递给 DeepSeek-R1，生成简洁且准确的答案。
LangChain 的 ChatPromptTemplate 确保 AI 以用户友好的格式进行响应。

自定义检索设置以获得最佳结果

LangChain 使调整检索设置以获得最佳性能变得简单：

k: 检索结果数量控制响应中使用的文档块数量。

更高的 k: 更多上下文，响应较慢。
更低的 k: 更少上下文，响应较快。

score_threshold: 相似度阈值根据相关性过滤检索结果。

更高的阈值: 仅检索高度相关的块。
更低的阈值: 更广泛的上下文但不够精确。

使用案例和测试您的 RAG 应用程序

以下是一些测试应用程序的示例：

测试PDF：

金融：分析财务报告并提取可行的见解。
医疗：总结研究论文或医疗指南。
教育：从电子书和学术论文中提取摘要或关键点。

示例问题：

“这个 Python 库的关键特性是什么？”
“本合同的第 5 节讨论了什么？”
“总结一下这本电子书的第二章。”

结论

通过结合 LangChain、DeepSeek-R1 和 ChromaDB，您可以创建一个优先考虑隐私、灵活性和成本效率的 RAG 系统。这个本地 RAG 解决方案非常适合分析技术文档、法律文本等，而无需依赖基于云的工具。

参考文献：

https://ollama.com/https://python.langchain.com/docs/tutorials/rag/https://docs.streamlit.io/https://api-docs.deepseek.com/

如何使用 DeepSeek-R1、LangChain 和 Ollama 构建隐私优先的 RAG

为什么选择私人RAG解决方案？

工具和技术：LangChain、DeepSeek-R1、Ollama、ChromaDB 和 Streamlit

构建 RAG 流水线：逐步指南

1. 安装先决条件

2. 设置项目

3. 运行应用程序

使用 DeepSeek-R1、Ollama、LangChain 和 ChromaDB 构建 RAG 管道

自定义检索设置以获得最佳结果

使用案例和测试您的 RAG 应用程序

测试PDF：

示例问题：

结论

参考文献：

Tags :

Share :

Related Posts

结合chatgpt-o3-mini与perplexity Deep Research的3步提示：提升论文写作质量的终极指南

让 Excel 过时的 10 种 Ai 工具：实现数据分析自动化，节省手工作业时间

使用 ChatGPT 搜索网络功能的 10 种创意方法

掌握Ai代理：解密Google革命性白皮书的10个关键问题解答

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

揭开真相！深度探悉DeepSeek AI的十大误区，您被误导了吗？