Data science

DeepSeek-R1-Lite-Preview：人工智能推理的新时代

DeepSeek-R1-Lite-Preview：人工智能推理的新时代

Rifx.Online
Machine Learning , Natural Language Processing , Data Science
20 Jan, 2025

人工智能（AI）在突破界限方面并不陌生，但偶尔会出现一些创新，让我们停下脚步，仔细关注。其中一个创新就是 DeepSeek-R1-Lite-Preview，这是由中国AI实验室 DeepSeek 开发的先进推理AI模型。该模型不仅提升了推理能力的标准，还在基准测试中取得了令人印象深刻的成绩，使行业巨头如OpenAI也感受到了压力。在本文中，我们将更深入地了解De

DeepSeek-R1-Lite 预览版的推理能力如何？

DeepSeek-R1-Lite 预览版的推理能力如何？

Rifx.Online
Machine Learning , Natural Language Processing , Data Science
20 Jan, 2025

DeepSeek-R1-Lite-Preview (R1LP) 是中国公司 DeepSeek 最近发布的一款 LRM（大型推理模型）。根据该模型的发布说明，R1LP 在多个数学和推

垂直AI代理：将引爆3000亿美元科技浪潮的颠覆性力量！

垂直AI代理：将引爆3000亿美元科技浪潮的颠覆性力量！

Rifx.Online
Technology , Data Science , Machine Learning
20 Jan, 2025

想象一个由AI代理管理整个业务功能的世界——无需人工干预。这听起来像科幻小说吗？其实离我们并不远。在过去的二十年里，我们见证了SaaS（软件即服务）的迅速崛起，出现了超过300个SaaS独角兽。但我们现在正进入一个新的范式，垂直AI代理的规模、价值和颠覆潜力可能会超越SaaS。在未来五年内，我们可能会看到由AI驱动的企业，员工不足10人却能创造数十亿美元的收入。影

使用 CrewAI 自动分析 CSV

使用 CrewAI 自动分析 CSV

Rifx.Online
Programming , Data Science , Generative AI
19 Jan, 2025

在本博客中，我们将探讨如何使用CrewAI自动化分析CSV数据集的过程。我们将构建一个工作流程，其中包括用于数据集上下文推断、数据清理、可视化和报告的代理，并最终形成一个精美的Markdown报告。 1. 初始化环境我们首先导入必要的库，并为工作流程初始化工具和环境。 import os import pandas as pd import char

利用 Docling、Ollama、Phi-4 | ExtractThinker 构建企业内部文档智能堆栈

利用 Docling、Ollama、Phi-4 | ExtractThinker 构建企业内部文档智能堆栈

在这个大型语言模型（LLM）的新时代，银行和金融机构在某种程度上处于劣势，因为前沿模型由于其硬件要求几乎无法在本地使用。然而，银行数据的敏感性带来了显著的隐私问题，尤其是当这些模型仅作为云服务提供时。为了解决这些挑战，组织可以转向**本地或小型语言模型（SLM）**设置，以将数据保留在内部，避免敏感信息的潜在泄露。这种方法使您能够利用先进的LLM（本地或通过最少的外部调用），同时

在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能（AI）的快速发展改变了企业的运作方式，使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计，AI工具帮助专业人士节省时间，提高生产力，专注于创造力。以下是按功能分类的100个AI工具的全面列表，以及它们在现实世界中的使用实例。 1. 研究工具研究可能耗时，但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

2025 年十大企业技术趋势：平台工程和人工智能代理引领潮流...

2025 年十大企业技术趋势：平台工程和人工智能代理引领潮流...

在预测2025年十大最重要的企业软件技术时，有三个关键要求：它需要真实：只有在生产环境中展示出其价值的技术才被视为“真实”，并将被纳入此列表。它需要可访问：一项技术要成为趋势，必须能够被广泛的企业所接触。仅被少数大型组织利用的技术不符合条件。它需要有强大的商业影响：顶尖技术趋势需要在商业层面上产生影响。这通常意味着提升人类生产力、应

为什么人工智能代理是好软件

为什么人工智能代理是好软件

Rifx.Online
Programming , Machine Learning , Data Science
14 Jan, 2025

为什么（设计良好的）自主系统能如此有效大约一个月前，我写了以下关于自主 AI 如何能够促进 AI 系统更好软件设计原则的文章。这篇文章将更深入地探讨和扩展我在那篇文章中讨论的想法。我想这将是结束我们关

为结构化和非结构化数据构建图形 RAG。

为结构化和非结构化数据构建图形 RAG。

Rifx.Online
Programming , Natural Language Processing , Data Science
14 Jan, 2025

RAG 架构迄今为止是解决 LLM 缺乏上下文化的最适应和复杂的解决方案。通过 RAG，几乎不需要微调，就在很大程度上解决了使用未训练知识库的 LLM 所面临的问题。尽管向量 RAG 可以建立上下文化，但其能力是有限的。在复杂的关系和高度互联的数据中，向量 RAG 的召回率并不令人印象深刻。其主要原因之一是构成知识库的简单向量嵌入，仅考虑几何接近性。另一方面，图形天生结构化，以捕

使用自定义工具构建和服务 RAG 代理：完整指南

使用自定义工具构建和服务 RAG 代理：完整指南

Rifx.Online
Programming , Generative AI , Data Science
14 Jan, 2025

目标本文的目标是演示如何使用 LangGraph 和 LangChain 创建一个大型语言模型（LLM）代理，该代理将在一组文档上执行检索增强生成（RAG）。此外，我们将探讨如何构建一个工具，以便进行 API 调用，从而使 LLM 能够从外部来源获取实时知识。最后，我们将使用 Flask API（FastAPI）在本地提供此代理，并使用本地 PostgreSQL 数据库服务器存

使用哪种人工智能代理框架？LangChain？AutoGen？9 种常用框架说明！

使用哪种人工智能代理框架？LangChain？AutoGen？9 种常用框架说明！

Rifx.Online
Programming , Machine Learning , Data Science
14 Jan, 2025

开发 AI 代理涉及选择合适的框架，以满足项目的需求，无论是基本任务、二次开发还是企业级集成。本指南探讨了多个框架——Coze、Dify、FastGPT、MetaGPT、AutoGen、Spring AI、Swarm、LangChain 和 LangGraph——以提供对它们的工作原理和使用案例的详细见解。 1. Coze Coze 是一个轻量级且用户友好的框架，旨在以尽可能少的

2025 年构建人工智能驱动的推荐系统！

2025 年构建人工智能驱动的推荐系统！

本博客深入探讨部署 AI 驱动的个性化引擎的复杂性，重点介绍如何利用 AI 和机器学习技术进行实时、高度针对性的推荐。无论您是在电子商务、媒体还是其他行业，理解这些系统对于保持竞争力至关重要。 AI驱动的个性化引擎介绍 AI驱动的个性化引擎改变了企业与客户互动的方式。通过利用先进的算法，这些系统分析用户行为和偏好，以提供量身定制的体验。这种个性化增强了用户参与度，提高了转化率

使用 PydanticAI 框架构建多代理 LLM 系统：创建人工智能系统的分步指南...

使用 PydanticAI 框架构建多代理 LLM 系统：创建人工智能系统的分步指南...

Rifx.Online
Programming , Generative AI , Data Science
14 Jan, 2025

Pydantic是Python生态系统中的一大力量，拥有超过2.85亿次的月下载量，一直是Python项目中稳健数据验证的基石。现在，它的创造者们正在前往AI的前沿领域，推出Pydantic AI，这是一个旨在构建由生成式AI驱动的生产级应用程序的框架。在本文中，我们将深入探讨Pydantic AI的独特之处、其关键特性以及与其他智能体框架的比较。 Pyd

使用 LLM 执行分析查询

使用 LLM 执行分析查询

实用方法：使用 LLM 进行数据探索与分析考虑以下场景。您有一个包含 500 万行和 20 列的 CSV 文件。该 CSV 文件包含客户的交易记录，例如销售日期、单价、数量、客户姓名、地址等。基于这些数据，您希望 LLM 能帮助回答以下问题：客户 A 在某一天购买了什么？某个月的总销售额是多少？列出某一年每个月的销售额。LLM的局限性如果你尝

文档智能的多代理革命：Sema4.ai 的

文档智能的多代理革命：Sema4.ai 的

本文由 Sunil Govindan 共同撰写，他对 AI 驱动的文档处理提供了见解和专业知识。Sema4.ai 文档智能多代理系统自去年年底将文档智能（DI）作为 Sema4.ai 企业代理平台的一部分推出以来，我们看到企业对转变其以文档为中心的工作流程产生了极大的兴趣。从数小时到数秒。从手动

构建惊艳的文本分析管道！LangGraph的奇妙能力揭秘！

构建惊艳的文本分析管道！LangGraph的奇妙能力揭秘！

Rifx.Online
Natural Language Processing , Programming , Data Science
11 Jan, 2025

在本文中，我将向您介绍 LangGraph，这是一个用于构建基于图的工作流的应用程序的令人难以置信的框架，这些工作流在其他情况下将是不可行的。我将分享我对 LangGraph 的经验，它的重要特性，并最终创建一个文本分析管道，以展示 LangGraph 的能力。理解 LangGraph 本质上，LangGraph 是围绕图形工作流程的概念构建的，其中每个节点作为特定的过程或

利用模态微调 LLaMA-3 实现文本到 SQL 的生成：综合指南

利用模态微调 LLaMA-3 实现文本到 SQL 的生成：综合指南

Rifx.Online
Programming , Machine Learning , Data Science
11 Jan, 2025

微调大型语言模型（LLMs）传统上是一项复杂的工作，需要大量的基础设施设置和管理。然而，借助Modal的云平台和Axolotl的微调框架，您现在可以直接从本地机器对强大的模型如LLaMA-3进行微调，而无需处理基础设施的复杂性。在本指南中，我们将通过使用Modal的远程GPU功能和Axolotl的先进训练优化，逐步演示如何对LLaMA-3 8B进行SQL查询生成的微调。 ![](htt

能将 Docker 容器大小减少 80% 的人工智能工具

能将 Docker 容器大小减少 80% 的人工智能工具

如何通过 Docker Shrink 优化容器并节省时间和金钱在容器化应用主导的现代范式中，有效处理 Docker 容器是开发人员和组织面临的主要问题之一。这导致了大型 Docker 镜像，从而造成更高的存储费用、较长的构建时间以及生产环境中的其他问题。 Docker Shrink 是解决这些问题的新方案，它是一个创新工具，利用人工智能来解决这些问题。作为一个亲身经历过大型 D

利用来自 Hugging Face 的 SmolAgents 库构建多代理供应链模拟

利用来自 Hugging Face 的 SmolAgents 库构建多代理供应链模拟

“smolagents — 一个构建优秀智能体的小型库” 供应链管理是一个复杂的领域，其中多个实体需要有效协调，以便将产品交付给最终消费者。现代供应链是一个复杂的网络，涉及供应商、制造商、分销商和零售商。对这些网络的仿真可以帮助我们理解瓶颈、优化操作并提高效率。在本

如何用Pydantic AI与Google Gemini构建强大的SWOT分析代理？惊人架构揭秘！

如何用Pydantic AI与Google Gemini构建强大的SWOT分析代理？惊人架构揭秘！

在当今快节奏的世界中，快速收集和综合信息变得至关重要。我构建了一个 AI 代理，以现代技术栈提供战略洞察。本文将带您了解这一过程，突出技术和设计选择，并演示您如何在 Google Cloud 上构建它。一个 AI 代理是一种能够感知其环

使用人工智能代理进行数据探索：使用 SmolAgents 探索泰坦尼克号数据集

使用人工智能代理进行数据探索：使用 SmolAgents 探索泰坦尼克号数据集

Rifx.Online
Data Science , Machine Learning , Natural Language Processing
11 Jan, 2025

十年前，当我开始我的机器学习之旅时，和许多人一样，我是从泰坦尼克号数据集开始的。我清晰地记得进行第一次探索性数据分析（EDA）的兴奋，发现模式和关联。快进到今天，数据分析的格局已经以我无法想象的方式演变。在这个智能AI的时代，我们现在可以将大部分的EDA委托给智能代理。问题不再是我们能否自动化EDA？而是我们能将这些能力推向多远？简短的回答是：相当远。借助由尖端AI模型驱动的

颠覆想象！揭秘7维代理AI价值的强大潜力！

颠覆想象！揭秘7维代理AI价值的强大潜力！

Rifx.Online
Generative AI , Autonomous Systems , Data Science
11 Jan, 2025

推动现实世界影响的整体架构“想象一下，一个能够感知其环境、创造性地制定解决方案、协调多步骤工作流并不断学习的 AI——无需持续的人类微观管理。”欢迎来到代理型生成 AI的世界，在这里，系统可以自主感知、推理、行动、适应和解释它们的决策。在这篇文章中，我将介绍一个高级概念架构，将这些能力提炼为7 个核心 AI 维度。把它想象成一个**全局指南

GPT-4o Python 疯狂制图：即时数据可视化提示

GPT-4o Python 疯狂制图：即时数据可视化提示

Rifx.Online
Programming , Data Science , Technology/Web
09 Jan, 2025

来自联合国人口预测数据集的无代码可视化实操 GPT-4o 的自动数据可视化生成工具越来越先进。您可以上传多个 CSV（和 XSLX）文件，并要求 GPT-4o 查看它们并为您提供文件中的结构和数据值列表。然后，您可以提示这个 LLM 创建 Python 代码来清理数据，并提供图表和地图的数据可视化。这非常有用。让我来给您演示一下它是如何工

利用 Pydantic AI 实现智能自主研究代理

利用 Pydantic AI 实现智能自主研究代理

Rifx.Online
Autonomous Systems , Data Science , Machine Learning
09 Jan, 2025

在技术进步的步伐要求不断学习和适应的时代，拥有一个智能助手来承担研究的重担不仅仅是一种奢侈——它正逐渐成为一种必需品。独立企业家、研究人员甚至普通学习者常常会被大量的信息所淹没。这就是由人工智能驱动的研究代理发挥作用的地方，它们不仅承诺提高效率，还能深入理解复杂主题。代理系统的重要性 AI agents 并不新颖；它们的应用遍及客户服务聊天机器人、推荐引擎和个人助手，如 Si

Phi-4：微软最新的小语言模型，专门用于复杂推理

Phi-4：微软最新的小语言模型，专门用于复杂推理

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
09 Jan, 2025

Phi-4: 一款重新定义现实世界应用的紧凑型强大AI推理模型微软的Phi-4在小型语言模型领域代表了一项显著的进步，能够在复杂推理任务中表现出色，同时保持紧凑高效的架构。与其更大型的同行不同，Phi-4专注于为那些需要高级问题解决能力的用例提供精确、细致的输出，而不会对计算资源造成过大压力。本博客将探讨Phi-4的架构、基准测试、实际应用，以及在本地或Azure

Crawl4AI：释放高效网络抓取功能

Crawl4AI：释放高效网络抓取功能

Rifx.Online
Programming , Technology/Web , Data Science
09 Jan, 2025

在当今数据驱动的世界中，高效收集和处理信息的能力对于人工智能（AI）应用的成功至关重要。随着人工智能的不断发展，对结构化数据以训练大型语言模型（LLMs）的需求前所未有地高。引入 Crawl4AI，一个创新的开源 Python 库，旨在简化网页爬取和数据提取，使其成为开发者和人工智能爱好者不可或缺的工具。本文将探讨 Crawl4AI 的功能、特性和使用案例，强调它如何使用户能够利

掌握 CrewAI：第 5 章--训练、测试、回放和计划 | 作者：Okan Yenigün | 2025年1月 | 人工智能浅析

掌握 CrewAI：第 5 章--训练、测试、回放和计划 | 作者：Okan Yenigün | 2025年1月 | 人工智能浅析

Rifx.Online
Programming , Machine Learning , Data Science
08 Jan, 2025

训练、测试、重放与计划在本章中，我们将探讨CrewAI的训练、测试、重放和计划功能。上一章：让我们为这篇文章创建一个新项目。 crewai create crew train_test_example这将创建一个模板项目。训练在训练过程中，我们使用人机协作技术。团队生成结果，我们对其提供反馈。通过迭代反馈，结果随着时

轻松打造高效研究助手！AutoGen与Panel UI结合的神奇旅程

轻松打造高效研究助手！AutoGen与Panel UI结合的神奇旅程

Rifx.Online
Programming , Machine Learning , Data Science
05 Jan, 2025

🎉 新年快乐，大家好！在开始之前，衷心感谢大家对我们之前故事的支持和反馈——这对我们意义重大！🙌 现在，让我们以一个有趣的项目开始新的一年。在人工智能和数据科学的世界中，打造智能和动态的代理可以为自动化研究工作流程带来重大变化。利用 AutoGen 和 Panel UI，您可以构建一个研究代理，与多个子代理协作，每个子代理都设计用于特定任务，如编码、规划或批评。✨ 让我

Wren AI：Uber如何利用Text-to-SQL每月节省14万个小时？揭秘你的企业也能获得的强大力量！

Wren AI：Uber如何利用Text-to-SQL每月节省14万个小时？揭秘你的企业也能获得的强大力量！

Rifx.Online
Programming , Data Science , Generative AI
05 Jan, 2025

在数据驱动决策至关重要的世界中，企业正在争相寻找从庞大数据集中提取可操作洞察的最有效方法。Uber，作为实时物流和运输的全球领导者，最近分享了他们的内部Text-to-SQL平台 — QueryGPT（如果你还没有查看这篇文章，[请在这里查看](https://www.uber.com/en-

Wren AI 文本到 SQL：API - 好东西 | by D | Medium

Wren AI 文本到 SQL：API - 好东西 | by D | Medium

Wren AI 是一个 AI 管道应用程序，可以将自然语言用户查询转换为 SQL，也称为文本到 SQL（也称为自然语言到 SQL 或 NL2SQL），使您能够与数据库进行对话。它同时提供 UI 和 API，允许您根据用户提示生成 SQL 查询，并使用这些查询检索数据。这大大简化了在您的 RAG/Agent 应用程序中处理结构化表格数据的过程。查看他们的演示 [https:/

使用 PydanticAI 框架构建多代理 LLM 系统：创建人工智能系统的分步指南...

使用 PydanticAI 框架构建多代理 LLM 系统：创建人工智能系统的分步指南...

Rifx.Online
Programming , Generative AI , Data Science
05 Jan, 2025

Pydantic 是 Python 生态系统中的一股强大力量，拥有超过 2.85 亿次的月下载量，一直是 Python 项目中稳健数据验证的基石。现在，它的创造者正在进军前沿的 AI 领域，推出 Pydantic AI，这是一个旨在构建由生成式 AI 驱动的生产级应用程序的框架。在本文中，我们将深入探讨 Pydantic AI 的独特之处、其关键特性，以及它与其他

2024 年人工智能驱动的网络抓取：用 Python 构建价值百万美元的自动化工具

2024 年人工智能驱动的网络抓取：用 Python 构建价值百万美元的自动化工具

Rifx.Online
Programming , Technology/Web , Data Science
03 Jan, 2025

精通下一代网络爬虫：从零到英雄，结合 AI 集成、反检测策略和真实案例研究 | 完整指南与代码示例 🚀 介绍：自动化数据收集的力量在当今数据驱动的世界中，网页抓取已经从一种简单的数据收集技术演变为开发者、数据科学家和企业的重要技能。无论您是在构建一个人工智能驱动的研究工具、监控市场趋势，还是为机器学习模型收集训练数据，掌握网页抓取都是您开启网络数据巨大潜力的门户。

Jupyter Agent 让我大开眼界。你未曾预见的人工智能革命。| 作者：Savvas Theocharous | 2024年12月 | 人工智能的进步

Jupyter Agent 让我大开眼界。你未曾预见的人工智能革命。| 作者：Savvas Theocharous | 2024年12月 | 人工智能的进步

Rifx.Online
Programming , Data Science , Generative AI
03 Jan, 2025

易于获取，但难以置信。一旦你亲自体验过，你就会明白我在说什么！我想我们都听说过 AI Agents。它正在进入主流，并且已经成为一个新兴的流行词。不过，我向你保证，在我自己尝试过 Jupyter Agent 之后，它的能力绝对不容小觑。什么是 Jupyter Agent？ [Jupyter Agent](https://huggingface.co/spaces/da

什么是人工智能代理？构建自己的人工智能代理的分步指南。

什么是人工智能代理？构建自己的人工智能代理的分步指南。

Rifx.Online
Autonomous Systems , Data Science , Technology
03 Jan, 2025

下一个大趋势？ Gartner认为AI代理是未来。OpenAI、Nvidia和Microsoft对此寄予厚望——包括Salesforce等公司，它们在AI领域迄今为止表现得相对低调。毫无疑问，这一事物现在正在迅速发展。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1

揭秘AI加密代币：如何颠覆区块链世界？5大创新点助你掌握未来！

揭秘AI加密代币：如何颠覆区块链世界？5大创新点助你掌握未来！

探索AI代币及其功能、优势、使用案例和一些示例。区块链技术经历了显著的演变。它为旨在增强去中心化、匿名性、保障数字交互以及使Web3对所有人可及的创新铺平了道路。此外，焦点越来越多地转向解决关键挑战，如用户体验、提升可

人工智能在加密货币交易和分析中的作用

人工智能在加密货币交易和分析中的作用

人工智能在加密货币交易与分析中的作用加密货币交易可能是当今最具动态性和波动性的金融市场之一。该市场的特点是波动性较大，但在各个方面都高度依赖数据。加密货币交易中的人工智能人工智能基本上是指计算机系统，它们在学习数据、决策和预测方面模仿人类智能。这可以用于分析与加密货币趋势相关的大量数据。 AI在加密交易中的关键应用 1.市场情绪分析它们基于

未来已来！OpenAI o3模型颠覆你对AI的所有想象！

未来已来！OpenAI o3模型颠覆你对AI的所有想象！

Rifx.Online
Programming , Machine Learning , Data Science
30 Dec, 2024

令人难以置信的奇迹，不仅仅是一个更先进的 AI 模型 OpenAI 以盛大的方式结束了他们为期 12 天的圣诞活动。在第一天，他们推出了他们的 [第一个推理 AI 模型 o1 的完整版本](https://www.thealgorithmicbridge.com/p/openai-announces-o1-model-

2025 年企业数据与人工智能趋势：代理、平台和新产品

2025 年企业数据与人工智能趋势：代理、平台和新产品

Rifx.Online
Data Science , Artificial Intelligence , Technology
27 Dec, 2024

*在数据和人工智能这样快速发展的领域中，做出预测尤其困难。然而，我们，Rajesh Parikh 和 Sanjeev Mohan 去年发布了我们的 [2024 趋势预测](https://sanjmo.medium.com/

DeepSeek V3：超越竞争对手的开源大语言模型技术解析

DeepSeek V3：超越竞争对手的开源大语言模型技术解析

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
27 Dec, 2024

优于 Claude 3.5 Sonnet、GPT-4o、Llama3.1 405B 年末将至，刚刚，中国的 DeepSeek 发布了其开源模型 DeepSeek-v3，该模型在性能上超越了所有主要竞争者，包括 Claude3.5 Sonnet、GPT-4o、Qwen2.5 Coder 等等。该模型的表现如同怪兽，显然，我们可以说 DeepSeek-V3 是迄今

使用 Gemini 2.0 提取任何文档 | 使用 ExtractThinker 提取文档智能

使用 Gemini 2.0 提取任何文档 | 使用 ExtractThinker 提取文档智能

在本文中，我们将探讨 Google 的 Gemini 2.0 模型如何与 [ExtractThinker](https://github.com/enoch3712/ExtractThinker

我如何利用人工智能在几秒钟内从任何网站提取信息

我如何利用人工智能在几秒钟内从任何网站提取信息

Rifx.Online
Programming , Technology/Web , Data Science
27 Dec, 2024

使用 Langchain、OpenAI、Bright Data 和 NextJS 构建一个免费的 AI 工具，用于抓取、提取和分析数据。 “有用”的数据是任何成功企业进行明智决策和战略规划的基础。然而，真正的挑战不仅仅在于抓取数据——而在于从收集到的数据中提取有价值的信息。这一步通常需要大量的时间和精力，成为了过程中的瓶颈。在本文中，您将学习如何构建一个不仅能提取网页数据，

Llm 微调指南：您是否需要以及如何进行微调

Llm 微调指南：您是否需要以及如何进行微调

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
27 Dec, 2024

在使用LLM时，我们最常收到的问题之一就是关于微调。每第二位客户都会问他们是否应该对他们的模型进行额外的训练。在大多数情况下，答案是否定的，他们不需要。现代LLM在许多商业应用中已经足够好，无需微调，比如帮助客户从花店订购鲜花的机器人。此外，他们没有数据来进行微调，而他们拥有的20个对话样本并不算数（200个也是如此）。训练和微调模型是一项昂贵的工作，如果可以的话，你真的应该避免它，

现代人工智能的核心：知识图谱和矢量数据库

现代人工智能的核心：知识图谱和矢量数据库

Rifx.Online
Technology , Data Science , Machine Learning
27 Dec, 2024

在快速发展的人工智能领域，检索增强生成（RAG）系统因其能够通过从外部数据库检索相关信息来增强传统人工智能模型而日益受到欢迎。这项技术的核心是两个关键工具——知识图谱和向量数据库——它们以根本不同的方式运作，但相辅相成，以解决各种问题。为了理解它们的重要性，让我们来分析它们的概念、差异、优势，以及它们如何重塑各个行业。 1. 知识图谱：连接的基础

搜索的未来：人工智能搜索引擎的工作原理

搜索的未来：人工智能搜索引擎的工作原理

Rifx.Online
Technology , Machine Learning , Data Science
27 Dec, 2024

厌倦了 Google 的错误答案？了解 AI 如何让网络搜索更智能、更好！想象一下：你在 Google 中输入一个问题，但得到的却不是正确的答案，而是点击了一堆无关的链接。令人沮丧，对吧？搜索引擎确实已经通过机器学习和自然语言处理等工具取得了长足的进步，帮助它们提供更好的结果。但即便有了这些改进，它们仍然主要是被动的，等待你提出问题。它们是反应式的，仅在你输入查询时才作出回应，并

2024 年 RAG 的崛起与演变：年度回顾

2024 年 RAG 的崛起与演变：年度回顾

Rifx.Online
Generative AI , Machine Learning , Data Science
27 Dec, 2024

随着2024年的结束，检索增强生成（RAG）的发展可谓波澜起伏。让我们从多个角度全面回顾这一年的进展。 RAG演变中的关键事件辩论：“RAG已死，RAG万岁！” 在2024年初，这一年被一些人称为“RAG之年”，尽管这一称谓并未得到普遍认可。然而，全年取得的进展确实证明了这一称号的合理性。在涉及大型语言模型（LLMs）的场景中，RAG始终被证明是不可或缺的角色。然而

从自然语言到 SQL 生成的代理反射

从自然语言到 SQL 生成的代理反射

Rifx.Online
Programming , Natural Language Processing , Data Science
26 Dec, 2024

作者：Atul Varshneya, Toby Fotherby, Shweta Keshavanarayana 介绍自然语言到 SQL (NL2SQL) 的转换有望为非技术用户普及数据访问。然而，这一过程充满了挑战。自然语言中的模糊性、数据库架构的变化、数据库中表的数量庞大以及 SQL 语法的复杂性常常导致不准确和/或低效的 SQL 查询生成。即使是先进的 AI 模型也难以

超越 Text2SQL：自然语言数据库查询的新领域

超越 Text2SQL：自然语言数据库查询的新领域

Rifx.Online
Natural Language Processing , Data Science , Programming/Scripting
26 Dec, 2024

介绍 TAG，一个用于复杂问题回答的统一模型缩小人工智能与数据库之间的差距承诺与瓶颈人工智能（AI）正在迅速改变我们与数据互动的方式。强大的语言模型（LMs）的出现为以更自然和直观的方式查询和分析信息开辟了新的可能性。想象一个世界，你可以用简单的英语提问，系统就能从庞大的数据库中检索到你所需的确切信息。这就是AI驱动的数据交互所带来的承诺。然而，存在

选择适合您的双子座人工智能模型：从 Flash 到专业

选择适合您的双子座人工智能模型：从 Flash 到专业

Rifx.Online
Generative AI , Technology , Data Science
26 Dec, 2024

原文发布于 Premier Cloud 博客谷歌发布了多个 Gemini 模型，彻底改变了 AI 驱动工具的格局，使生成性 AI 对个人、开发者和企业而言更加可及和强大。这些模型由 DeepMind 开发，代表了生成性

🔌 Cline + MCP：VS Code 的人工智能助手获得代理超能力

🔌 Cline + MCP：VS Code 的人工智能助手获得代理超能力

Rifx.Online
Programming , Technology/Web , Data Science
26 Dec, 2024

“嘿，Cline，你能检查一下我们在 CI 中测试失败的原因吗？”到目前为止，AI 编码助手只能分析您手动共享的代码。但通过 Cline 最新的模型上下文协议（MCP）集成，您的 AI 助手现在可以调查问题、部署修复，并管理您整个开发工作流程——这一切都可以在 VS Code 中完成。“多亏了 Claude 3.5 Sonnet 的代理编码能力，Cline 可以逐步处理复杂的软

对话式商业智能：Text2SQL 的挑战与解决方案

对话式商业智能：Text2SQL 的挑战与解决方案

Rifx.Online
Natural Language Processing , Programming/Scripting , Data Science
26 Dec, 2024

用自然语言查询 SQL 数据库/数据仓库的艺术介绍 BI的未来是对话式的 — 这是Gartner和其他分析师在过去几年中告诉我们的。对话式BI在赋能业务用户自主查询数据存储（使用自然语言）方面具有巨大的潜力，无需依赖数据工程团队。随着大型语言模型（LLMs）的出现，我们似乎已经达到了一个转折点。让我们首先了解实现Text2SQL的挑战。 Text2SQL 挑战

Crawl4AI：您的终极异步网络爬行伴侣 🕷️🤖

Crawl4AI：您的终极异步网络爬行伴侣 🕷️🤖

Rifx.Online
Programming , Technology/Web , Data Science
26 Dec, 2024

Crawl4AI 是一个开源 Python 库，旨在简化网络爬虫并轻松提取网页上的有价值信息。无论您是将其集成作为 REST API，还是直接在您的 Python 项目中使用，Crawl4AI 都提供了一种强大、灵活和完全异步的解决方案，专为大型语言模型（LLMs）和人工智能应用量身定制。介绍 Crawl4AI 旨在 **简化

使用 Google 双子座 2.0 轻松进行网络抓取

使用 Google 双子座 2.0 轻松进行网络抓取

Rifx.Online
Programming/Scripting , Technology/Web , Data Science
26 Dec, 2024

网页抓取从未如此简单，这都要感谢谷歌开创性的多模态实时 API——Gemini 2.0\。使用这个工具，您可以轻松地从任何网页中提取数据，无论是复杂的、非结构化的，还是某些非常特定的数据。今天，我将逐步带您体验我自己尝试过的实际示例，这样您就会确切知道该怎么做。即使您是完全的初学者，您也会在短时间内感觉像个专业人士。让我们开始吧！入门：设置 Google AI

未来工程：数据、软件和人工智能的共同点

未来工程：数据、软件和人工智能的共同点

Rifx.Online
Programming , Data Science , Technology/Web
26 Dec, 2024

识别跨学科共性不仅增强招聘策略，还支持灵活的IT架构。我注意到IT部门中存在过度专业化的趋势。然而，多年来我学到的一个重要教训是这种孤立专业化的负面影响。虽然这主要是一个组织问题，但对供应商专业平台产品的盲目追求也[导致了我们企

从帖子到报告：利用 LLM 进行社交媒体数据挖掘

从帖子到报告：利用 LLM 进行社交媒体数据挖掘

Rifx.Online
Programming , Data Science , Natural Language Processing
26 Dec, 2024

如何指导LLMs过滤餐厅帖子并提取对业务增长至关重要的见解。应用概述我们正处于自动化的黄金时代，这得益于大型语言模型（LLMs）的崛起。从改变行业到解锁无尽的应用，LLMs彻底改变了我们与数据的互动方式，主要通过自然语言。在本文中，我将向您展示如何指示LLM穿透社交媒体的噪音，提取最重要的信息。具体来说，我们将深入探讨如何挖掘Instagram上的餐厅帖子，以

如何使用人工智能免费抓取和分析数据：从收集到洞察

如何使用人工智能免费抓取和分析数据：从收集到洞察

Rifx.Online
Programming/Scripting , Data Science , Natural Language Processing
26 Dec, 2024

学习如何结合网络爬虫、代理和人工智能语言模型来自动化数据提取，轻松获得可操作的洞察。虽然有些网站可以通过使用Selenium、Puppeteer等工具轻松抓取，但其他实施了先进安全措施的网站，如验证码和IP封禁，可能会变得困难。为了克服这些挑战，并确保您可以免费抓取99%的网站，您将在本文中构建一个集成[代理工具](https://get.brightdata.com/bd-

如何了解人工智能的最新趋势（无需花大量时间上网）

如何了解人工智能的最新趋势（无需花大量时间上网）

Rifx.Online
Technology , Machine Learning , Data Science
26 Dec, 2024

如今，跟上人工智能（AI）趋势的感觉有点像试图从消防栓中小口喝水——只不过消防栓喷出的却是机器生成的术语、研究论文和未来预测，以超音速的速度涌出。但别担心，亲爱的朋友！保持对AI的了解并不一定要像全职工作一样。通过一些巧妙的策略，你可以在不牺牲空闲时间（或理智）的情况下走在前沿。让我们以隐喻、幽默和高效的方式来解析一下。 1. 订阅精选新闻通讯：你的AI备忘单把新闻通讯想象

文本到 SQL 的数据建模已死？Wren AI 如何连接现代商业智能与传统实践

文本到 SQL 的数据建模已死？Wren AI 如何连接现代商业智能与传统实践

Rifx.Online
Data Science , Programming , Technology/Web
26 Dec, 2024

数据建模在文本到SQL时代是否已经过时？Wren AI如何弥合现代商业智能与传统实践之间的差距来自Wren AI团队的用户最常问的问题是：“我们可以直接将Wren AI的文本到SQL解决方案连接到我们的原始数据吗？现在AI可以处理一切，数据建模还有必要吗？”虽然现代AI驱动的工具如Wren AI确实改

o1:ChatGPT 的新模式再次改变了数据分析！(比特币分析）

o1:ChatGPT 的新模式再次改变了数据分析！(比特币分析）

Rifx.Online
Chatbots , Data Science , Predictive Analytics
26 Dec, 2024

测试 ChatGPT 的新 O1 模型，进行比特币数据分析 ChatGPT 最近宣布将在 12 天内分享 12 个新功能，今天是第一天。正如您从我之前的文章中所读到的，我们已经看到了他们第一天的功能，包括 O1 模型。 o1 模型这个模型在一段时间前以 o1-preview(beta) 的名称发布。看起来测试阶段已经结束，现在我们有了 o1 模型。根据基准测试结果

OpenAI 的 O3 模型：崛起与信任的重构

OpenAI 的 O3 模型：崛起与信任的重构

从我第一次听到那些低声的传闻开始，我内心深处便感受到了一种变化。这是一种渴望的紧张感，夹杂着怀疑。柔和的声音围绕着一个神秘的“o3”推理模型。 o3 Open AI ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1*fjKrpXECxJXGDgO5xxEvaw.p

基于智能工作流的金融文档处理自动化解决方案

基于智能工作流的金融文档处理自动化解决方案

金融文档如 SEC 10-K 报告通常复杂且繁琐，但通过合适的工作流，整个过程可以得到改造。我开发了一种集成 Phidata、n8n 和 Qdrant 的简化解决方案，以自动化金融文档分析。该工作流无缝处理报告，提取精确且结构化的见解，并将其存储在 Qdrant 中，这是一种强大的向量数据库，能够实现高级搜索和检索功能。结果是处理金融数据的方式更加快速、高效，使决策者能够获取和利

使用 Markdown 和 Gemini 为 RAG 解锁 PDF

使用 Markdown 和 Gemini 为 RAG 解锁 PDF

可以说，检索增强生成（RAG）为许多企业和组织带来了变革。通过将像 Gemini 这样的 LLM 的内置功能与您自己的信息相结合，您可以创造出真正具有变革性的强大体验。尽管如此，创建一个能够很好处理复杂非结构化文档（如 PDF）的 RAG 应用程序仍然是一个挑战。 **本文提出了一种从

2025 年十大数据与人工智能趋势

2025 年十大数据与人工智能趋势

Agentic AI、小数据，以及在非结构化数据堆栈时代寻找价值根据行业专家的说法，2024年注定是生成性AI的丰收年。运营用例正在浮现，技术正在降低准入门槛，而通用人工智能显然就在眼前。那么……这些事情发生了吗？嗯，有点。在2024年年底，一些预测已经热乎乎地浮现出来。其余的则需要在烤箱里多待一会儿（我在看你，通用人工智能）。以下是领先的未来学家和投资者Tomasz

DeepSeek-VL2：利用专家视觉语言混合模型促进多模态理解

DeepSeek-VL2：利用专家视觉语言混合模型促进多模态理解

Rifx.Online
Natural Language Processing , Computer Vision , Data Science
19 Dec, 2024

DeepSeek-VL2 在视觉语言模型领域代表了一个重要的飞跃，提供了先进的多模态理解能力。这一创新系列的大型混合专家（MoE）视觉语言模型在其前身 DeepSeek-VL 的基础上，提供了在广泛任务中的卓越性能。让我们深入探讨 DeepSeek-VL2 的关键方面，探索其架构、能力和潜在应用。在开始之前，如果您正在寻找一个一体化的 AI 平台，可以在一个地方管理您所有的 A

利用 ClientAI 和 Ollama 构建本地人工智能任务规划器

利用 ClientAI 和 Ollama 构建本地人工智能任务规划器

Rifx.Online
Programming , Machine Learning , Data Science
19 Dec, 2024

在本教程中，我们将使用 ClientAI 和 Ollama 构建一个 AI 驱动的任务规划器。我们的规划器将把目标分解为可执行的任务，创建现实的时间表，并管理资源——所有这些都在您的机器上运行。

人工智能代理如何帮助简化工作流程自动化？

人工智能代理如何帮助简化工作流程自动化？

Rifx.Online
Technology , Data Science , Autonomous Systems
19 Dec, 2024

在当今快速变化的商业环境中，组织必须高效运作以保持竞争力。实现这种效率的一个关键是自动化。然而，自动化已经超越了简单的任务调度和数据输入，特别是在AI代理进入自动化领域之后。这些智能系统不仅增强了传统的自动化过程，还彻底改变了企业对工作流程管理的方式。在这篇博客中，我们将探讨AI代理如何简化工作流程自动化，它们为何成为游戏规则的改变者，以及企业如何利用它们推动创新和提高运营效率。

LangChain 与 LlamaIndex：检索增强生成（RAG）的综合比较

LangChain 与 LlamaIndex：检索增强生成（RAG）的综合比较

Rifx.Online
Generative AI , Data Science , Programming/Scripting
15 Dec, 2024

介绍 Retrieval-Augmented Generation (RAG) 结合了信息检索与生成模型，使其成为一个强大的技术，适用于问答、摘要及其他自然语言处理任务。要实现 RAG，目前最流行的两个框架是 LangChain 和 LlamaIndex。这两个框架旨在处理文档的摄取、拆分、索引以及将步骤链在一起，以实现无缝的 RAG 工作流程。但哪个框架更适合您

使用语言模型生成合成数据：实用指南

使用语言模型生成合成数据：实用指南

Rifx.Online
Programming , Data Science , Generative AI
15 Dec, 2024

在人工智能不断发展的领域中，数据仍然是推动创新的燃料。但是，当获取真实世界数据变得困难、昂贵，甚至不可能时，会发生什么呢？合成数据生成应运而生——这是一种开创性的技术，利用语言模型创建高质量、逼真的数据集。考虑在不违反隐私法的情况下对医疗记录进行语言模型训练，或者在没有私人对话记录的情况下开发客户互动模型，或设计自动驾驶系统，其中收集稀有边缘案例的数据几乎是不可能的。合成数据弥补了数

战胜大数据：小企业如何在没有巨型数据集的情况下参与人工智能竞争

战胜大数据：小企业如何在没有巨型数据集的情况下参与人工智能竞争

Rifx.Online
Technology , Data Science , Machine Learning
15 Dec, 2024

面对现实——在AI领域，小企业常常感觉像是在进行一场不对称的斗争。大企业——谷歌、Meta、OpenAI——似乎垄断了AI的叙事，凭借在庞大的数据集上训练的炫酷模型，这些数据集大到需要小城镇大小的数据中心。他们拥有博士军团、无尽的预算，以及对数十亿（有时甚至是万亿）数据点的访问权。而你呢，一个谦逊的企业或正在成长的初创公司，手头可能只有……几千行井然有序的电子表格数据。你没有PB级的

小模型在法律硕士时代的作用

小模型在法律硕士时代的作用

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
12 Dec, 2024

近期的一项研究广泛探讨了小型语言模型（SLMs）在现代人工智能中的作用。该研究对SLMs进行了全面分析，重点探讨了它们的能力、应用及潜在优势，尤其是在与大型模型的对比中。本研究强调了在需要效率和可解释性的领域中SLMs的重要性，同时也讨论了在大型模型不切实际的具体任务中它们的相关性。最近的一项研究通过两个角度：合作与竞争，探讨了大型语言模型（LLMs）与小型模型（

如何将人工智能和数据科学融入企业战略

如何将人工智能和数据科学融入企业战略

Rifx.Online
Programming , Data Science , Technology/Web
12 Dec, 2024

数据科学咨询内部咨询指南：如何成功举办为期两天的高管研讨会“我们的行业不尊重传统——它只尊重创新。” — *Satya Nadella，微软首席执行官，2014年致员工的

我对 ChatGPT 的新 o1 和 o1 专业模式的真实看法（附测试）

我对 ChatGPT 的新 o1 和 o1 专业模式的真实看法（附测试）

注意：在本文中，我将尽量涵盖与事件相关的所有要点以及我的个人看法。几天前，OpenAI 开始了他们的“12 Days of OpenAI”活动，带来了令人兴奋的消息：发布了一个新的 ChatGPT 模型，称为 o1，以及一个包括强大 o1 Pro 模式的高级订阅计划 ChatGPT Pro。这一公告展示了 AI 在思考、解决问题、处理图像以及帮助完成编码和数学等复杂

利用多代理 RAG 构建企业人工智能应用程序！

利用多代理 RAG 构建企业人工智能应用程序！

Rifx.Online
Generative AI , Machine Learning , Data Science
12 Dec, 2024

作者: Pavan Belagatti 和 Madhukar Kumar 在快速发展的AI领域中，[多智能体检索增强生成](https://readmedium.com/how-to-build-enterprise-ai-apps

测试 OpenAI 的 o1 模型：新闻任务的思维链提示概览

测试 OpenAI 的 o1 模型：新闻任务的思维链提示概览

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
07 Dec, 2024

新的大型语言模型被称为更聪明的问题解决者——但它们在数据可视化和标题选择等实际新闻任务中表现如何？上个月，OpenAI 发布了两个新的大型语言模型：o1-preview 和 o1-mini。这些被公司称为 “推理模型”，与我们迄今为止看到的大型语言模型有着重要的区

克劳德的新款 3.5 Sonnet 性能超过了 OpenAI 的 O1-mini。我很震惊。

克劳德的新款 3.5 Sonnet 性能超过了 OpenAI 的 O1-mini。我很震惊。

Rifx.Online
Programming , Generative AI , Data Science
07 Dec, 2024

Claude更新的3.5 Sonnet模型的并排比较当OpenAI发布GPT-4o时，我充满期待……但很快就失望了。尽管GPT-4o比GPT-4更快且成本更低，但其表现明显不如前者。如果不考虑成本，原始的GPT-4（和Claude 3.5）显然是更好的模型。今天，Anthropic发布了更新的3.5 Sonnet模型。像Reddit这样的在线社区对此赞不绝口，解释它比之前的版

利用 CrewAI 为自动化 EDA 构建人工智能代理协作框架

引言：数据探索的新纪元在当今这个数据驱动的世界中，企业不断寻求从庞大的数据集中提取可操作的洞察。传统上，这项任务一直是熟练数据科学家的领域，他们花费大量时间探索和分析数据。但如果我们能够自动化这个过程呢？如果一个由人工智能驱动的系统能够对数据提出有见地的问题，彻底分析数据，并呈现详细报告——所有这些都只需最少的人为干预？这正是我们的项目旨在通过利用CrewAI代理框架来实现的目标。

CrewAI 的任务工具与代理工具：您必须知道的区别

CrewAI 的任务工具与代理工具：您必须知道的区别

Rifx.Online
Programming , Machine Learning , Data Science
07 Dec, 2024

在 CrewAI 中，工具本质上是代理可以利用的技能或功能，以执行各种操作。可以将其视为为您的 AI 代理提供一个装满专业工具的工具箱。这些工具在扩展 CrewAI 代理的能力方面至关重要，使他们能够承担广泛的任务并有效协作，例如访问互联网、查询数据库中的数据或运行 Python 代码。 CrewAI 提供了灵活性，您可以以多种方式为代理配备工具：**A) 代理

SpiderTool 和 CrewAI：网络抓取和数据提取的终极组合

SpiderTool 和 CrewAI：网络抓取和数据提取的终极组合

Rifx.Online
Programming/Scripting , Technology/Web , Data Science
07 Dec, 2024

Ankush k Singal 介绍在网络爬虫和数据提取方面，SpiderTool和CrewAI是天作之合。SpiderTool以其强大的抓取和爬行能力而闻名，与旨在简化和扩展您的抓取项目的CrewAI平台完美结合。 ![](https://wsrv.nl/?url=https://cdn-image

利用 CrewAI Flows 实现人工智能工作流程自动化

利用 CrewAI Flows 实现人工智能工作流程自动化

Rifx.Online
Programming , Machine Learning , Data Science
07 Dec, 2024

CrewAI CrewAI 是一个尖端的 Python 框架，用于协调角色扮演和自主 AI 代理。通过构建“团队”由专业代理，我们可以自动化任务、生成创意文本格式，并以全新的方式访问信息。本文将指导您如何使用 CrewAI 的 Flow 功能创建简单项目。流程 CrewAI 流程是一个强大的功能，旨在简化 AI 工作流程的创建和管理。流程允许开发人员与多个任务和团队协

如何使用 LangChain 和 CrewAI 构建人工智能驱动的 SQL 数据分析代理

如何使用 LangChain 和 CrewAI 构建人工智能驱动的 SQL 数据分析代理

Rifx.Online
Programming , Data Science , Generative AI
07 Dec, 2024

在当今数据驱动的世界中，自动化数据提取、分析和报告的工作流程对于节省时间和提高效率至关重要。本教程将指导您使用 LangChain 和 CrewAI 构建一个 AI 驱动的 SQL 工作流程。通过集成强大的 Llama 3 模型、SQL 数据库工具和基于代理的自动化，您将学习如何创建一个无缝的管道，以处理数据库查询、分析结果和生成高管报告 — 所有这些都需要最少的手动干预。无论您是数据爱好者

选择合适的人工智能代理框架：LangGraph vs CrewAI vs OpenAI Swarm

选择合适的人工智能代理框架：LangGraph vs CrewAI vs OpenAI Swarm

Rifx.Online
Programming , Machine Learning , Data Science
07 Dec, 2024

对使用 3 种不同框架构建的相同 Agentic Finance 应用程序进行深入比较。我们将涵盖的内容什么是代理？深入了解我们如何定义代理，以及它们与AI管道和独立LLM的区别。使用3个流行的代理框架构建的实践示例： LangGraph、CrewAI和OpenAI Swarm（[完整代码](https://github.com/relari-a

代码审查中的人工智能

代码审查中的人工智能

Rifx.Online
Programming , Machine Learning , Data Science
06 Dec, 2024

我们都知道，少量的上下文可以完全改变我们对 AI 模型的回答。这不仅限于 AI，人类的运作方式也是如此。同样的原则适用于编码。如果没有上下文，代码审查可能会偏离目标。传统的方法往往关注表面问题，而更深层次、更复杂的问题却被忽视。这就是基于 AI 的代码审查的作用。通过引入先进的人工智能，这些审查可以对问题有更深刻的理解，将例行检查转变为战略资产。基于 AI 的代码审查者可以彻

使用人工智能提取和分析您的 Chrome 浏览器历史记录

使用人工智能提取和分析您的 Chrome 浏览器历史记录

有没有想过您的浏览历史对您说了什么？无论您是想了解自己的在线习惯，反思自己的工作效率，还是需要记录自己的活动，分析浏览历史都能提供有价值的见解。在本文中，我们将探讨如何提取您的 Chrome 浏览历史，并利用 AI 进行聚类和分析。我们将介绍一种无代码的方法以及一种更技术性的方式，适合那些熟悉命令行的用户。为什么浏览历史？在之前的帖子中，我讨论了使用 Logseq 或 Obsi

5 分钟内构建财务报告分析器：LlamaIndex + 毕马威会计师事务所案例研究

5 分钟内构建财务报告分析器：LlamaIndex + 毕马威会计师事务所案例研究

在当今快速变化的金融世界中，快速而准确地从冗长的报告中提取有意义的见解至关重要。随着生成性人工智能的出现，我们现在拥有强大的工具来自动化和增强这一过程。在本文中，我将带您了解如何使用LlamaIndex构建一个复杂的财务报告分析系统，以KPMG关于财务报告中人工智能的报告作为我们的测试案例。如果您对提高生产力和机器学习技能的实用技巧感兴趣，请随时订阅我们的[LinkedIn页面]

探索类比数据配色方案的人工智能生成建议

探索类比数据配色方案的人工智能生成建议

Rifx.Online
Generative AI , Color Vision , Data Science
05 Dec, 2024

类比色彩和谐是指在色轮上相邻的至少三种颜色。这种色彩方案可以创造出令人愉悦的色彩组合，但在应用于数据可视化时，可能会面临色盲测试不合格的风险。生成式AI能否通过提供通过色彩缺陷测试的类比建议来帮助数据色彩方案设计？在这里，我将探讨这个问题。让我们首先更详细地回顾一下类比色彩和谐、色彩缺陷以及生成式AI系统的概念。类比色彩和谐：色彩和谐是选择在色轮上能很好地配合在一起的颜色

技术岗位大迁移即将来临

技术岗位大迁移即将来临

Rifx.Online
Technology , Data Science , Machine Learning
05 Dec, 2024

技术职位观察关于工作如何适应新技术环境的必要知识 11月科技职位观察还不是会员？您可以在这里免费阅读。如果您一

掌握 25 种 RAG 架构：何时以及如何使用每一种

Rifx.Online
Generative AI , Natural Language Processing , Data Science
30 Nov, 2024

介绍检索增强生成 (RAG) 架构彻底改变了我们处理信息检索的方式。这些架构弥合了生成响应与提取相关数据之间的差距，使模型能够提供准确、实时且具有上下文意识的答案。但在众多可用的 RAG 架构中，您如何知道在每种独特场景中使用哪一个？在本指南中，我们将深入探讨 25 种 RAG 架构，解释它们的具体用途，并提供现实世界的示例，以演示每种架构何时最有效。 1. Corr

自动求职：人工智能一夜之间申请 1000 个职位，获得 100+ 个面试机会！

自动求职：人工智能一夜之间申请 1000 个职位，获得 100+ 个面试机会！

在当今快节奏和竞争激烈的就业市场中，寻找和获得理想工作既耗时又令人疲惫。这个过程通常涉及无休止的浏览职位列表、定制每一份申请以及重复填写表格——所有这些都可能导致求职疲劳和错失机会。这里有Auto_Jobs_Applier_AIHawk，您的AI驱动求职助手，旨在自动化申请过程，提供个性化推荐，并显著提高您获得心仪职位的机会。本综合指南将带您了解有关Auto_Jobs

LazyGraphRAG：高效和有效 RAG 的新时代 | 作者：Ankush k Singal | 2024年11月 | Medium

LazyGraphRAG：高效和有效 RAG 的新时代 | 作者：Ankush k Singal | 2024年11月 | Medium

Rifx.Online
Generative AI , Machine Learning , Data Science
27 Nov, 2024

介绍在人工智能领域，检索增强生成（RAG）已成为一种强大的技术，以增强大型语言模型（LLMs）的能力。RAG使LLMs能够访问和处理来自外部知识源的大量信息，从而提供更具信息性和综合性的响应。然而，传统的RAG方法在处理大型数据集时可能计算成本高且耗时。为了解决这些限制，提出了一种称为LazyGraphRAG的新方法。这种创新技术在效率和有效性方面提供了显著的优势，使其成为广泛

AI for BI：利用 CrewAI 和 OpenAI 构建商业信息报告

AI for BI：利用 CrewAI 和 OpenAI 构建商业信息报告

如何直接从CSV数据创建简单的BI报告商业信息应用程序帮助企业将数据作为资源来做出关键决策，我们将利用AI构建一个这样的应用。 AI必将越来越多地在BI工具中发挥作用；更具体地说，基于LLM的应用程序将使BI应用能够创建可视化，通过数据分析提供洞察，并自动化商业报告。因此，在本文中，我们将探讨LLM应用如何帮助创建商业信息。它不会是一个全面的BI应用；然而，它将直接从数

使用 CrewAI 构建多代理系统

使用 CrewAI 构建多代理系统

Rifx.Online
Programming , Machine Learning , Data Science
25 Nov, 2024

AI代理正在通过独立分析数据、做出预测和推荐最佳行动来改变各个行业。这些智能程序不仅擅长独立执行任务，还在与其他代理协作方面表现出色，使它们在销售、市场营销和教育等领域成为宝贵的资产。例如，在市场营销中，AI代理可以评估客户偏好，识别个人兴趣，并制定个性化的活动，以促进客户参与和满意度。在教育中，这些代理同样可以被利用来个性化学习路径，通过将课程与学生的独特需求和目标对齐来增强教育体

利用 LangGraph 和 OpenAI 打造代理金融分析师

利用 LangGraph 和 OpenAI 打造代理金融分析师

在股票交易的世界中，投资者依赖各种工具和方法来做出明智的决策。其中一种方法是基本面分析，它评估公司的财务健康状况和股票表现，以提供可操作的见解。随着 AI 和机器学习的进步，股票分析现在可以在很大程度上实现自动化。在这篇文章中，我们将探讨如何使用 LangChain、LangGraph 和 Yahoo Finance 创建一个股票表现分析代理，利用实时股票数据和关键技

使用 LangGraph 和 Waii 进行复杂 SQL 连接

使用 LangGraph 和 Waii 进行复杂 SQL 连接

Rifx.Online
Natural Language Processing , Programming , Data Science
25 Nov, 2024

在快速发展的数据分析领域，通过自然语言与数据互动的能力变得愈发重要。会话式分析旨在使复杂的数据结构对没有专业技术技能的用户更易于访问。 LangGraph 是一个用于构建有状态的多代理应用程序的框架，使用语言模型。Waii 提供文本到 SQL 和文本到图表的功能，使与数据库和数据可视化的自然语言交互成为可能。本文探讨了 Waii 的功能如何增强 LangGraph 应用于会话式分析

面向真实世界应用的高级代理人工智能设计考虑因素

面向真实世界应用的高级代理人工智能设计考虑因素

Rifx.Online
Programming , Machine Learning , Data Science
25 Nov, 2024

从基于课堂的代理到语言链代理随着人工智能（AI）系统的发展，代理人工智能的概念——即由模块化、特定任务的代理协作工作的AI系统——已成为可扩展和可适应AI解决方案的基石。本文探讨了代理人工智能背后的设计考虑，研究了代理、工具、记忆、状态和规划如何结合在一起创造智能工作流。我们将比较三种实现——CODE1、CODE2和CODE5——以揭示其中的实用性

介绍 LightRAG：检索增强一代的新时代

介绍 LightRAG：检索增强一代的新时代

Rifx.Online
Generative AI , Data Science , Natural Language Processing
25 Nov, 2024

在快速发展的自然语言处理领域，检索增强生成（RAG）系统已成为提供准确、上下文丰富的响应的关键。然而，传统的 RAG 系统在更新知识库或处理复杂查询时，往往面临效率低下的问题。引入 LightRAG，这是一个新颖的系统，旨在通过提供高效、增量更新和优化的检索过程来解决这些挑战。传统 RAG 系统的问题在我们深入了解 LightRAG 之前，先来理解一下我们为什么

使用 O1、GPT4o 和 Mini | ExtractThinker 扩展文档提取功能

使用 O1、GPT4o 和 Mini | ExtractThinker 扩展文档提取功能

在本文中，我们将探讨如何高效地使用 ExtractThinker 来处理大规模文档。我们将讨论何时使用不同的模型，如 O1、GPT4o 及其迷你版本，如何处理 OCR，提取图表，并使用异步批处理管理重负载。 ExtractThinker 介绍是一个灵活的文档智能库，帮助您从各种文档中

2025 年成为人工智能工程师的终极路线图

2025 年成为人工智能工程师的终极路线图

Rifx.Online
Programming , Machine Learning , Data Science
25 Nov, 2024

介绍：乘风破浪的人工智能世界正经历一场人工智能的淘金热，像谷歌、特斯拉和亚马逊这样的公司正在向人工智能投资数十亿美元。对于那些有抱负的人来说，人工智能工程师的角色已成为最有前途的职业之一，融合了尖端技术、解决问题的能力和创造力。如果你准备好迎接这个挑战，这份指南将带您通过逐步的、按周的路线图，帮助您在2025年开启人工智能职业生涯。这份路线图提供了一个详细、现实的8个月学习

Claude 3.5 Sonnet Unleashed：你不能错过的人工智能革命 | 作者 Ahmed Bahaa Eldin | Medium

Claude 3.5 Sonnet Unleashed：你不能错过的人工智能革命 | 作者 Ahmed Bahaa Eldin | Medium

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
20 Nov, 2024

被称为人工智能的技术领域是一个相对年轻的领域，发展速度异常迅猛，其中最新的一个例子被称为 Claude 3. 5 Sonnet. 这是科技行业中最强大的 AI 模型之一，具有这些非凡的特性和功能。我们将重点关注 [***C

如何使用克劳德 3.5 进行数据分析（秘密工具）

如何使用克劳德 3.5 进行数据分析（秘密工具）

Rifx.Online
Data Science , Technology , Machine Learning
20 Nov, 2024

大多数人对这个功能并不了解在本文中，我们将讨论 Claude，这是一款由 AI 驱动的数据分析工具，可以帮助我们分析数据并制作酷炫的交互式可视化。我们将涵盖您需要了解的所有内容，从启用特殊功能到使用较小的数据集。让我们开始吧！什么是Claude：一个AI数据分析师想象一下，口袋里有一个非常聪明的助手，可以查看数据并给你答案。这就是Claude的样子！Clau

人工智能帮助我控制糖尿病前期病情

人工智能帮助我控制糖尿病前期病情

健康 | 血糖 | 糖尿病我如何利用技术控制血糖、减肥和保持健康免责声明：我不是医生，本文的任何部分都不应被视为医疗建议。我分享的是我自己在管理减肥和避免糖尿病方面的探索。 *您所有的健康护理问题和挑战应与您的个人健康护理专业人士讨论。本文仅应被视为娱乐内容，不应用于教育或医疗。* 现状如果你一直在关注我，你会知道我处于糖尿病前期，并且体

2025 年成为人工智能工程师的路线图

2025 年成为人工智能工程师的路线图

Rifx.Online
Programming , Machine Learning , Data Science
16 Nov, 2024

如何在2025年成为AI工程师有没有想过构建能够思考、学习和解决复杂问题的系统需要什么？几年前，我也很好奇——AI是一个未来主义的概念，我不知道从哪里开始。现在，随着我们迈入2025年，成为AI工程师比以往任何时候都更加容易。如果你在这里，你可能对如何从零开始进入这个领域感兴趣。好消息是？不需要成为计算机天才或数学奇才。只需一个清晰的路线图、奉献精神和正确的资源，你就能做到。

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

Rifx.Online
Technology , Generative AI , Data Science
16 Nov, 2024

在人工智能和科技这样一个动态的行业中，保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析，还是希望通过人工智能转变传统领域如法律，这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表，可以助力你的职业发展，并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

人工智能研究代理：2025 年将改变知识研究（外加三大免费工具）

人工智能研究代理：2025 年将改变知识研究（外加三大免费工具）

事情是这样的：一些重大变化即将动摇知识研究的世界。在深入研究AI研究代理并在各个行业看到它们的实际应用几个月后，我可以肯定地告诉你——到2025年，这些工具不仅仅是有用的工具。它们将从根本上改变我们进行知识研究的方式（无论是营销还是科学！）。人类在一个小时内访问10,000个网站并研究数据在物理上是不可能的。然而，代理可以轻松做到这一点。在这篇文章中，我将向你展示3个

Bolt.new 和 Ollama：革新人工智能驱动的全栈式 Web 开发

Bolt.new 和 Ollama：革新人工智能驱动的全栈式 Web 开发

Rifx.Online
Programming , Technology/Web , Data Science
16 Nov, 2024

在快速发展的 Web 开发世界中，效率和创新至关重要。开发者、项目经理和设计师们都在不断寻找能够简化工作流程、降低成本和提高生产力的工具。Bolt.new 是一款突破性的 AI 驱动全栈 Web 开发代理，完全在您的浏览器中运行。与 Ollama 配合使用，后者允许您在本地运行开源 AI 模型，Bolt.new 将彻底改变我们构建和部署 Web 应用程序的方式。本文将深入

生成式人工智能在市场研究和情报领域的应用：优势、用例和策略

生成式人工智能在市场研究和情报领域的应用：优势、用例和策略

Rifx.Online
Generative AI , Market Research , Data Science
16 Nov, 2024

利用AI转变市场情报生成式AI正在改变企业进行市场研究和情报的方式，使数据分析变得更快、更深入。传统的市场研究方法高度依赖手动数据收集、调查分析和竞争对手研究，这些方法往往耗时且范围有限。生成式AI则允许公司即时分析庞大的数据集，生成可能被忽视的洞察，并创建帮助更准确预测趋势的预测模型。从综合数据报告到创建高层次摘要，生成式AI加速了决策过程，使市场洞察更加易于获取。除了

利用 CrewAI 构建自主多代理系统

利用 CrewAI 构建自主多代理系统

Rifx.Online
Autonomous Systems , Programming , Data Science
14 Nov, 2024

什么是多智能体自主系统以及如何使用CrewAI和LangChain构建一个？动机实际上，我们对这些概念并不陌生；我们从电影中了解到它们。一个人指挥他们的AI，而AI通过使用各种工具来执行这些命令。这就是我们今天在AI系统崛起的道路上所走的方向。时代正在逐渐变化。在过去，人们无法独自完成一项任务，需要一个团队。没有团队，他们要么在一段时间后精疲力竭，要么达到能力的极限。最

满足 Qwen2.5-Coder-32B-Instruct -Coder - 开源比 gpt4o 更好

满足 Qwen2.5-Coder-32B-Instruct -Coder - 开源比 gpt4o 更好

Rifx.Online
Programming , Generative AI , Data Science
14 Nov, 2024

认识 Qwen2.5-Coder-32B-Coder，您新的 AI 编码伙伴您是否曾希望编码变得更简单、更快速，甚至更有趣？那么，准备好迎接您的新 AI 编码朋友 Qwen2.5-Coder。Qwen2.5-Code 专门开发了这个模型，作为一个尖端语言模型，以简化您的编码体验。想象一下，拥有一个知识渊博的助手，可以为您编写代码、调试、解释复杂概念，并处理多种语言。感兴

您必须了解的 25 个顶级生成式人工智能术语

您必须了解的 25 个顶级生成式人工智能术语

Rifx.Online
Generative AI , Machine Learning , Data Science
14 Nov, 2024

掌握关键概念，以清晰的解释、实际应用和深入的资源在生成性人工智能领域脱颖而出生成性人工智能确实是各行业中的关键技术；因此，理解生成性人工智能的核心概念对任何技术专业人士及其他领域的人士来说都是至关重要的。以下综合指南涵盖了25个必须了解的生成性人工智能术语，提供清晰的定义、实际的例子和其他资源，以加深您的知识。无论是为面试做准备、参与人工智能项目，还是跟上这个快速变化领域的动态，

新人工智能 Bolt 是否会取代 v0.dev

新人工智能 Bolt 是否会取代 v0.dev

Rifx.Online
Programming , Technology/Web , Data Science
13 Nov, 2024

AI工具不是会员？免费阅读这里。网页开发的世界正在快速发展，市场上涌现出多种AI工具。这些新AI工具通过自然

案例研究：将医生笔录转化为时态医疗记录知识图谱

案例研究：将医生笔录转化为时态医疗记录知识图谱

Rifx.Online
Health , Data Science , Machine Learning
13 Nov, 2024

您是否有兴趣将医生/患者的医疗记录和记录转化为可以跨多个医疗历史、时间段和患者进行复杂查询的时间性知识图谱？在本案例研究中，我们展示了如何将医疗记录转化为您可以依赖于 RAG 和分析目的的时间性知识图谱。我们展示了针对该系统的真实问答，以及您可以通过该系统实现的业务成果。据我们所知，这里步骤的组合是一种相对新颖的知识图谱实现。使用的数据出于数据隐私原因，我们使用了一个合成

LightRAG - GraphRAG 简单高效的竞争对手？

LightRAG - GraphRAG 简单高效的竞争对手？

Rifx.Online
Generative AI , Data Science , Technology/Web
13 Nov, 2024

传统的 RAG 系统通过索引原始数据来工作。这些数据被简单地切分并存储在向量数据库中。每当用户发出查询时，它会查询存储的片段并检索相关片段。如果您希望了解 RAG 的基本原理，我已经在 [这里](https://proxy.rifx.online/https://readmedium.com/retrieval-augmented-generation-rag-a-quick-a

Microsoft GraphRAG v0.4.0

Microsoft GraphRAG v0.4.0

Rifx.Online
Programming , Data Science , Machine Learning
13 Nov, 2024

微软最近发布了 GraphRAG 项目的 v0.4.0 版本，带来了几项重要更新。最显著的新增功能是增量索引特性和 DRIFT 图推理查询模块，这大大增强了系统的效率和功能。此次更新的核心亮点包括： 1. 增量索引：显著提高大规模数据处理的效率，实现更快的信息更新。 2. DRIFT 图推理查询模块：引入先进的图推理技术，增强复杂查询处理能力。此外，版本 0.4.

Gemma、Llama 和 Mistral：探索较小的 AI 模型

Gemma、Llama 和 Mistral：探索较小的 AI 模型

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
10 Nov, 2024

小规模语言模型的比较研究：在阅读理解任务中评估 Gemma、Llama 3 和 Mistral 引言大型语言模型（LLMs）正在快速发展。每个月，新的模型被开发出来，以超越当前市场上的顶尖模型。这种健康的竞争有利于创造新的方法，提高质量和速度。此外，各公司还专注于开发更小的模型，以便使其能够被没有强大计算资源的个人或组织所使用。就在几周前，苹果公司在其全球开发者大会上推出

Google Gemini：大上下文窗口是杀手级功能吗？

Google Gemini：大上下文窗口是杀手级功能吗？

Rifx.Online
Machine Learning , Natural Language Processing , Data Science
10 Nov, 2024

谷歌即将推出的 LLM 迈出了重大一步就在八个月前，一封泄露的谷歌电子邮件透露该公司在努力超越其 AI 竞争对手方面遇到了困难。他们的 AI 产品周围不仅没有护城河——换句话说，没有建立起商业优势——谷歌也没有[秘密武器](https://ww

Mojo，比 Python 快 90,000 倍，终于开源了！

Mojo，比 Python 快 90,000 倍，终于开源了！

Rifx.Online
Programming , Machine Learning , Data Science
10 Nov, 2024

2024年3月29日，Modular Inc.宣布开源Mojo的核心组件。 Mojo是一种专门为编写人工智能软件而设计的编程语言，去年八月正式发布。自那时以来，它已经吸引了超过175,000名开发者和50,000个组织。人工智能模型通常使用多种编程语言编写。开发者通常使用Python实现神经网络的最简单部分，因为它易于学习，但相对较慢。其余代码通常用C++编写，虽然速度更快，但学习起来更复

英伟达™（NVIDIA®）如何修剪和提炼 Llama 3.1 以创建 Minitron 4B 和 8B

英伟达™（NVIDIA®）如何修剪和提炼 Llama 3.1 以创建 Minitron 4B 和 8B

Rifx.Online
Programming , Machine Learning , Data Science
10 Nov, 2024

新模型采用了最先进的剪枝和蒸馏技术。我最近开始了一份专注于人工智能的教育通讯，目前已有超过170,000名订阅者。TheSequence是一份不做作（意味着没有炒作，没有新闻等）的机器学习导向通讯，阅读时间为5分钟。目标是让您及时了解机器学习项目、研究论文和概念。请通过下面的链接订阅试试：我们常常被大型语言模型（LLMs）特别是那些参数数量庞大的模型的进展所震撼。然

利用 LangChain 和 LangGraph 进行多代理对冲基金模拟

利用 LangChain 和 LangGraph 进行多代理对冲基金模拟

多智能体对冲基金模拟与 LangChain 和 LangGraph 该项目演示了如何使用多智能体设置来模拟对冲基金的分析过程。它展示了一种实用的方法来构建一个系统，该系统利用 AI 智能体收集和分析金融数据，这种设置可以进一步扩展和定制。在这里，我将分解该项目，其中涉及一个投资组合经理和三个分析师智能体（基本面、技术面和情绪面），每个智能体在收集和处理股票数据方面被分配了特定角色。

SmolLM2：Qwen2.5 和 Llama 3.2 的最佳替代品

SmolLM2：Qwen2.5 和 Llama 3.2 的最佳替代品

Rifx.Online
Technology , Machine Learning , Data Science
10 Nov, 2024

而且它是完全开放的！ Hugging Face 加大了对 SmolLM 计划的投入。他们发布了 SmolLM2：1.7B、360M 和 135M 模型，训练于 11T 令牌（相比 SmolLM 的 1T）。他们发布了基础版和指导版：Hugging Face Collection: [SmolLM2](https://huggingface.co/collections/

OpenAI SearchGPT：带有互联网和浏览工具的ChatGPT

OpenAI SearchGPT：带有互联网和浏览工具的ChatGPT

Rifx.Online
Technology/Web , Data Science , SearchGPT
08 Nov, 2024

一个更好的替代方案：Perplexity 和 Google 搜索备受期待的 OpenAI 产品 SearchGPT 昨晚发布，拥有一些重大功能，使其在竞争对手 Perplexity 之上更进一步。如 OpenAI 所宣布的，SearchGPT 不仅仅是带有互联网的 ChatGPT。它本身就是一个 AI 网络浏览器。谈到一些关键功能：高级过滤：为特定

采用 Phi-3-Vision-128K 的人工智能 OCR：文档处理的未来

采用 Phi-3-Vision-128K 的人工智能 OCR：文档处理的未来

Rifx.Online
Natural Language Processing , Computer Vision , Data Science
08 Nov, 2024

在快速发展的人工智能领域，多模态模型正在为视觉和文本数据的整合设定新标准。最新的突破之一是 Phi-3-Vision-128K-Instruct，这是一个最先进的开放多模态模型，推动了AI在处理图像和文本方面的能力边界。该模型专注于文档提取、光学字符识别（OCR）和一般图像理解，能够彻底改变我们处理PDF、图表、表格以及其他结构化或半结构化文档的信息方式。让我们深入探

LongRAG：让人工智能在信息海洋中捕捞更多鱼

LongRAG：让人工智能在信息海洋中捕捞更多鱼

Rifx.Online
Generative AI , Natural Language Processing , Data Science
08 Nov, 2024

在我之前的文章中，我介绍了RAG是否会因长上下文LLMs而变得过时。今天，让我们看看如何将长上下文LLMs应用于RAG场景。在检索增强生成（RAG）领域，传统方法一直依赖于短检索单元，通常约为100个单词，这迫

可视化你的 RAG 数据——使用 Ragas 评估你的检索增强生成系统

可视化你的 RAG 数据——使用 Ragas 评估你的检索增强生成系统

Rifx.Online
Natural Language Processing , Generative AI , Data Science
04 Nov, 2024

如何使用 UMAP 降维将嵌入可视化以展示多个评估问题及其与源文档的关系，结合 Ragas、OpenAI、Langchain 和 ChromaDB 检索增强生成（RAG）在 LLM 的工作流程中增加了一个检索步骤，使其能够在回答问题和查询时，从私人文档等额外来源查询相关数据 [1]。该工作流程不需要对额外文档进行昂贵的训练或微调。文档被拆分成片段，然后进行索引，通常使用紧凑的 M

Agentic RAG 如何解决当前 RAG 限制的问题

Agentic RAG 如何解决当前 RAG 限制的问题

Rifx.Online
Generative AI , Data Science , Machine Learning
04 Nov, 2024

在本卷咖啡休息概念的第 4 期中，我们将了解 AgenticRAG 如何帮助解决传统 RAG 的限制。 RAG框架 RAG（检索增强生成）框架按特定顺序操作：文档 -> 片段 -> 向量数据库 -> 片段检索（前K个） -> LLM 然而，这一顺序在处理某些类型的查询时会遇到障碍。问题 1：摘要考虑一个查询，比如“总结文档”。传统

解锁混合专家 (MoE) LLM：你的 MoE 模型可以免费嵌入模型

解锁混合专家 (MoE) LLM：你的 MoE 模型可以免费嵌入模型

Rifx.Online
Machine Learning , Natural Language Processing , Data Science
04 Nov, 2024

Mixture-of-experts (MoE) LLM 可以作为免费的嵌入模型使用。我最近发现了一篇有趣的论文，标题为“你的 Mixture-of-Experts LLM 秘密地是一个免费的嵌入模型。”[1] 最近的 LLM 架构趋势是解码器模型，这对于嵌入模型并不适用，因为它们的注意力方法。然而，作者揭示了 Mixture-of-Experts (MoE) LLM 可以作

OpenAI GPT-5：预计 2025 年将实现博士级智能

OpenAI GPT-5：预计 2025 年将实现博士级智能

Rifx.Online
Machine Learning , Ethics , Data Science
01 Nov, 2024

经过几个月的猜测，OpenAI终于揭示了备受期待的GPT-5的详细信息。最初预计在2024年发布，但其发布时间已推迟至2025年末或2026年初。OpenAI的首席技术官Mira Murati在与达特茅斯工程学院的采访中分享了有关这个新版本的能力和潜力的见解。以下是您需要知道的一切。智力的量子飞跃 Murati 将之前的 GPT 版本与不同水平的人类智力进行比较。GPT-

追求生产质量 Graph RAG：开始容易，完成难

追求生产质量 Graph RAG：开始容易，完成难

Rifx.Online
Programming , Data Science , Generative AI
01 Nov, 2024

克服图形 RAG 生产化的挑战当我阅读最近在 VentureBeat 上关于 Glean [刚刚在最新融资轮中获得超过 2.6 亿美元的文章](https://venturebeat.com/data-infrastructure/how-to-take-advantage-of-a-generative-tool-fueling-gleans-260m-raise-grap

认识 Ministral 3B 和 8B：边缘 AI 游戏规则改变者

认识 Ministral 3B 和 8B：边缘 AI 游戏规则改变者

Rifx.Online
Technology , Autonomous Systems , Data Science
01 Nov, 2024

Mistral AI在边缘AI和设备计算的新前沿在快速发展的AI领域，边缘计算变得越来越重要，适用于那些需要低延迟、以隐私为首的高效推理的应用，而不依赖于基于云的基础设施。 Mistral AI最新推出的Ministral模型家族，标志着AI领域的一次突破性进展。为庆祝其开创性的*

解锁 LLM 量化的 5 个关键点

解锁 LLM 量化的 5 个关键点

Rifx.Online
Machine Learning , Data Science , Technology/Web
24 Oct, 2024

大型语言模型的量化 LLM量化目前是一个热门话题，因为它在提高大型语言模型（LLMs）的效率和在各种硬件平台（包括消费级设备）上部署方面发挥着至关重要的作用。通过调整模型中某些组件的精度，量化显著减少了模型的内存占用，同时保持相似的性能水平。在本指南中，我们将探讨LLM量化的五个关键方面，包括将此技术应用于我们模型的一些实用步骤。 #1. 理解量化量