搜索的未来:人工智能搜索引擎的工作原理
- Rifx.Online
- Technology , Machine Learning , Data Science
- 27 Dec, 2024
厌倦了 Google 的错误答案?了解 AI 如何让网络搜索更智能、更好!
想象一下:你在 Google 中输入一个问题,但得到的却不是正确的答案,而是点击了一堆无关的链接。令人沮丧,对吧?搜索引擎确实已经通过机器学习和自然语言处理等工具取得了长足的进步,帮助它们提供更好的结果。但即便有了这些改进,它们仍然主要是被动的,等待你提出问题。它们是反应式的,仅在你输入查询时才作出回应,并且并不真正理解你可能长期需要什么。
这就是 AI 代理的用武之地。这些智能、目标驱动的系统正在将事情提升到一个新的水平——将搜索引擎从被动助手转变为主动助手。想象一下,一个搜索引擎不仅仅是等待你提问,而是实际上能够预测你的需求,主动搜索相关信息。这些新的 AI 代理将使在线搜索变得更快、更高效,而无需所有额外的步骤。
理解代理人工智能
AI代理是利用人工智能执行任务、回答问题并有效与环境互动的复杂软件程序。这些代理是根据人类提供的特定目标设计的,但它们独立确定实现这些目标的最佳方法。
AI代理由几个关键组件组成:
- 感知/学习: 从环境中收集和处理信息。在这里,代理基本上学习该做什么以及如何去做。
- 决策: 分析所有可用数据以做出明智的决策。代理的推理能力可以在这里得到利用,以优化决策过程。
- 执行: 根据做出的决策执行任务。代理利用其配备的工具来增强执行能力。
- 学习系统: 通过试错、反馈和强化学习来提高性能。
- 工具: 利用API、云应用程序和数据源来实现其目标。
AI代理以其独立规划的能力而著称——创建逐步的策略和里程碑——并从过去的错误中学习。它们的记忆能力范围从处理即时聊天互动到保留和回忆长期数据。这种独立性和自主性使它们能够作为智能助手运作,复杂性从简单的聊天机器人到能够解决复杂问题的高级AI系统各不相同。
关键特征
- 跨领域适应性: AI代理的一个显著特征是它们能够被指示在不同领域执行各种任务。这种多功能性使它们能够在各种环境中部署,以有效解决实际业务挑战。
- 决策能力: 代理型AI不仅仅是完成任务——它还根据处理的数据做出决策。例如,在处理大型数据库时,它不仅仅是组织信息;它还智能地分析模式,突出关键发现,并建议下一步。这种评估和行动的能力使其在复杂动态情况下尤其有价值。
这种适应和自主决策的能力是由强大的变压器架构驱动的。先进的神经网络、多头注意力机制和**多层感知器(MLP)**的结合——以及其他关键组件——赋予了AI代理卓越的推理能力。在某些领域,这种推理可以近似甚至匹配人类的推理能力。
Agentic AI在AI驱动搜索引擎中的角色
集成到搜索引擎中
今天搜索引擎中最令人兴奋的进展之一是Agentic AI的集成,它能够总结搜索结果并提供来自多个文章和来源的直接答案。无需再筛选无尽的链接或阅读冗长的文章——AI代理通过浓缩和聚合信息来完成繁重的工作。这意味着用户可以直接从网络上的高质量资源中获得清晰、准确和全面的答案。
功能增强
Agentic AI还增强了搜索引擎中的数据处理和实时分析能力,使其更快、更强大。通过几乎瞬时分析大量数据,这些AI系统能够识别模式并提取有意义的见解,速度远快于以往。这使得搜索引擎能够更好地理解上下文,准确解释更长的查询,并通过实时考虑来自不同文章的内容提供量身定制的响应。结果是?更智能、更有针对性的搜索结果,能够适应用户的需求。
例如,如果您正在研究气候变化并以查询*“气候变化的主要原因是什么?”*开始,AI驱动的搜索引擎可以立即总结出温室气体排放、森林砍伐和工业活动等关键因素。它甚至可能根据实时内容更新建议最近的研究或新数据。
像谷歌这样的公司已经朝着这个方向迈进。他们的项目Google MUM(多任务统一模型)旨在更好地理解复杂主题,总结冗长内容,提供直接答案,甚至整合图像和视频以提供全面的响应——所有这些都在一个流畅的体验中。此外,谷歌的新AI概述功能通过在搜索结果中提供简洁的AI生成摘要,进一步增强了这一点,使用户更容易快速掌握关键信息。
传统网络搜索与代理网络搜索的比较
传统网络搜索:
传统的网络搜索体验是我们都非常熟悉的。您在搜索引擎中输入一个搜索词或查询——我们以 Google 为例。Google 然后返回与您的搜索词相关的众多网站和文章列表。我们需要筛选每个结果,以确定哪些真正符合我们的需求。
例如,
如果您搜索“什么是 LLM 代理?”,您面临的是一个开放性问题。理解 LLM 代理可能需要阅读多篇文章,因为单一来源通常不足以满足需求。许多文章可能包含冗余信息,使得这个过程更加耗时。仅仅浏览前 10 篇文章以获取全面理解可能需要花费多达 30 分钟,没人希望在 2024 年还这样做。
Agentic Web Search
现在介绍基于Agentic的网络搜索,这是一种在LLM公开发布后不久引入的变革性方法,正在逐步重塑网络搜索行业。虽然它的运作方式与传统网络搜索类似,但真正的优势在于它如何处理和呈现信息。让我们继续之前的例子来说明这一点。
例子延续:
对于搜索词 What are LLM agents?,最初的步骤保持不变:Google将提供相关网站和文章的列表。然而,代理将更进一步,全面理解这些来源提供的内容。
代理的优势在于:
- 探索: 代理将为您访问所有相关来源,并检索与您的查询相关和不相关的信息,而不是手动筛选每篇文章。
- 内容生成: 代理吸收所有信息,进行整理,然后以简单明了的方式呈现给您。这种方法节省了您的时间和内存。 :)
- 总结: 当您在探索 What are LLM agents? 时,代理可以高效地审阅10篇文章并将其内容提炼成简明的总结。这样,您就可以在10-15分钟内阅读到一个全面的总结,而不是花费每篇文章5-10分钟(总计超过50分钟)。
通过简化研究过程,Agentic Web Search不仅节省了时间,还提高了您获得信息的质量,使您能够更快地掌握复杂主题。
以下是您现在可以免费使用的2个AI驱动的网络搜索工具的例子:
这两个工具的用户体验非常相似,如上面的工作流程所述。尽管表面下隐藏着复杂的层次,但这些主要旨在提高整个体验的准确性和效率。
BYO (自建) AI驱动的网络搜索
我们创建了自己的AI驱动网络搜索,以下是我们是如何做到的——以便您也可以构建一个符合您特定需求的搜索。
我们使用了一个叫做 CrewAI 的工具。以下是简要介绍:
CrewAI旨在让AI代理像一个协调良好的团队一样协同工作。无论您是在设置智能助手、自动化客户服务系统还是研究团队,CrewAI都提供了复杂多代理交互的框架。
通过CrewAI,我们使用两个关键工具创建了一个多代理系统:SerperDevTool 和 ScrapeWebsiteTool。
- SerperDevTool: 该工具在谷歌搜索引擎上运行查询,返回相关网站的列表。
- ScrapeWebsiteTool: 一旦SerperDevTool识别出网站,该工具便从这些来源抓取数据。
以下是一个简单的例子,以说明这些工具如何协同工作:
对于查询 “什么是LLM代理?”,SerperDevTool在谷歌上搜索并返回一个网站列表,默认情况下通常为10个。之后,ScrapeWebsiteTool从这些网站提取文本。
使用CrewAI,我们开发了三个代理:
- 网络搜索者: 该代理浏览网络以查找相关的文章。
- 摘要生成器: 该代理对文章内容进行浓缩。
- 答案生成器: 该代理从摘要内容中整合出一个连贯的答案。
每个代理在将简单查询转化为全面答案的过程中发挥着至关重要的作用,使网络搜索过程高效且用户友好。
这是我们测试的一个例子,结果出乎意料地好。
查询:
你能给我一些关于我们宇宙的非常有趣和非传统的事实吗?
响应:
以下是关于我们宇宙的一些有趣且非传统的事实:
- 宇宙中近96%的成分是暗物质(27%)和暗能量(68%),它们是不可见的,无法直接观察。
- 每个星系,包括银河系,中心都包含一个超大质量黑洞。
- 宇宙的温度为2.725°C,显示出其在大爆炸时的火热起源,宇宙显得非常均匀。
- 由于暗能量的存在,宇宙的扩张正在加速,其本质仍然是一个谜。
- 宇宙中的恒星数量超过地球所有海滩上的沙粒数量。
- 水星上的一天持续时间比其一年还要长。
- 宇航员在太空中会经历身体变化,例如由于脊椎减压而导致的身高增加。
- 多重宇宙的概念表明,我们的宇宙可能是众多宇宙中的一个,每个宇宙都有不同的物理法则。
- 天文学显示,一些自然现象如潮汐力受到月球的深刻影响。
- 尽管有大量潜在可居住的行星,但尚未发现外星生命的证据。
构建这个系统出乎意料地简单——我们甚至没有花费整整一天。借助像 CrewAI 这样的工具和框架,搭建复杂的AI系统变得对几乎每个人都可及。这些框架不断改进,使个人和企业能够利用AI能力,而无需深厚的技术专长。现在是参与这一技术进化的激动人心的时刻,每天都有更多的可能性在开启。
您可以查看代码 这里。
结论
Agentic AI 在搜索引擎中的崛起标志着我们访问和互动在线信息方式的变革性转变。通过简化搜索过程并提供简洁、相关的答案,这些 AI 系统正在为网络搜索设定新的效率和准确性标准。随着技术的不断发展,我们可以期待更多创新工具,进一步提升我们的数字体验。搜索的未来不仅仅是找到信息——而是理解信息,而 Agentic AI 正在引领这一潮流。
我们构建可以信赖的 AI 代理,因为当 AI 编造内容时,一切都会崩溃。 有了这些代理,您可以摆脱基本的繁琐工作,同时为您的客户和员工解锁有意义的体验。让我们 聊天.