Type something to search...
Rifx.Online

Rifx.Online

我们的核心是充满激情的创新者,致力于弥合尖端AI技术与全球开发者之间的差距。我们的AI API聚合平台作为一个中心枢纽,以前所未有的便捷性和效率将您连接到大量强大的AI模型和服务。

我们的使命

我们致力于使AI能力的获取民主化,使开发者、企业和研究人员能够利用人工智能的力量,而无需管理多个API集成的复杂性。通过提供统一的接口来访问多样化的AI服务,我们正在加速创新并赋予创造者构建下一代智能应用的能力。

我们提供的服务

  • 简化访问: 一个API统治所有。通过单一的标准化接口访问数百个AI模型。
  • 成本优化: 我们的平台智能地将您的请求路由到最具成本效益的提供商,而不影响质量。
  • 灵活性: 从广泛的AI服务中选择,包括自然语言处理、图像识别、语音转文本等。
  • 可靠性: 受益于我们强大的基础设施,确保您的AI驱动应用的高可用性和性能。

我们的承诺

我们致力于维护最高标准的安全性和隐私。您的数据和知识产权受到最谨慎的对待,我们不断更新我们的做法以符合最新的数据保护法规。

加入我们这个激动人心的旅程,一起塑造AI集成的未来。无论您是独立开发者、成长中的初创公司还是成熟的企业,我们的平台都旨在满足您的需求并推动您的创新。

让我们一起构建更智能的未来!

使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
10 个强大的 Perplexity AI 提示,让您的营销任务自动化

10 个强大的 Perplexity AI 提示,让您的营销任务自动化

在当今快速变化的数字世界中,营销人员总是在寻找更智能的方法来简化他们的工作。想象一下,有一个个人助理可以为您创建受众档案,建议营销策略,甚至为您撰写广告文案。这听起来像是一个梦想? 多亏了像 Perplexity 这样的 AI 工具,这个梦想现在成为现实。通过正确的提示,您可以将 AI 转变为您的 个人营销助理。在本文中,我将分享 10 个强大的提示,帮助您自动

阅读更多
10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

人工智能技术,如机器学习、自然语言处理和数据分析,正在重新定义传统设计方法。从自动化重复任务到实现个性化用户体验,人工智能使设计师能够更加专注于战略思维和创造力。随着这一趋势的不断增长,UI/UX 设计师越来越多地采用 AI 驱动的工具来促进他们的工作。利用人工智能不仅能提供基于数据的洞察,还为满足多样化用户需求的创新设计解决方案开辟了机会。 1. 用户角色开发 目的

阅读更多
在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能(AI)的快速发展改变了企业的运作方式,使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计,AI工具帮助专业人士节省时间,提高生产力,专注于创造力。以下是按功能分类的100个AI工具的全面列表,以及它们在现实世界中的使用实例。 1. 研究工具 研究可能耗时,但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

阅读更多
你从未知道的 17 个令人惊叹的 GitHub 仓库

你从未知道的 17 个令人惊叹的 GitHub 仓库

Github 隐藏的宝石!! 立即收藏的代码库 学习编程相对简单,但掌握编写更好代码的艺术要困难得多。GitHub 是开发者的宝藏,那里“金子”是其他人分享的精心编写的代码。通过探索 GitHub,您可以发现如何编写更清晰的代码,理解高质量代码的样子,并学习成为更熟练开发者的基本步骤。 1. notwaldorf/emoji-translate *谁需

阅读更多
2025 年企业数据与人工智能趋势:代理、平台和新产品

2025 年企业数据与人工智能趋势:代理、平台和新产品

*在数据和人工智能这样快速发展的领域中,做出预测尤其困难。然而,我们,Rajesh Parikh 和 Sanjeev Mohan 去年发布了我们的 [2024 趋势预测](https://sanjmo.medium.com/

阅读更多
2025:人工智能代理年--利用 CrewAi 和 Gemini 1.5 构建多代理系统

2025:人工智能代理年--利用 CrewAi 和 Gemini 1.5 构建多代理系统

正如许多专家预测的那样,2025年将成为自主人工智能的年份。这个新兴领域有望通过引入高度自主的系统来重新定义我们与技术的互动,这些系统能够在最小的人类干预下做出决策并执行复杂任务。受到这一理念的启发,我开始构建一个多智能体系统,该系统不仅执行特定任务,还能根据用户定义的主题创建有意义的内容。 在这篇文章中,我将带您了解我构建的系统、我面临的挑战,以及自主人工智能所蕴含的激动人心的未来。

阅读更多
2025年投资风口揭秘:AI代理的颠覆性未来!

2025年投资风口揭秘:AI代理的颠覆性未来!

2025年前值得关注的顶尖AI代理 时不时地,技术突破会改变游戏规则。目前,这一突破是AI代理。 这些自主工具正在悄然改变各个行业,包括金融,并且它们准备在即将到来的牛市中占据主导地位。 如果你还在思考什么是AI代理,不用担心——我来为你解答。 让我们探索这一新兴趋势、关键参与者,以及你如何能够为这波浪潮做好准备。 *我将提到的项目链接也可在文中找到。 AI

阅读更多
2025 年加密货币收益率将达到 40 倍的 4 种最佳人工智能替代币

2025 年加密货币收益率将达到 40 倍的 4 种最佳人工智能替代币

人工智能 在 AIXBT 和 CGPT 之后,我的新列表等待下一次运行 谈到加密货币的巨大潜力,实际上,作为下一个 40 倍的领先候选者,AI 代理是最好的领域之一。因为聊天机器人遵循人类构建的脚本,并且它会遵循这个脚本,不会偏离,而另一方面,AI 代理则更加自主。 人类设定目标,AI 代理决定达到该目标的最佳方式或路径。正如你可能已经注意到的,这些 AI 代理已经在各

阅读更多
本周末您可以构建的 5 个人工智能项目(使用 Node.js)

本周末您可以构建的 5 个人工智能项目(使用 Node.js)

5 个适合在周末用 Node.js 构建的令人兴奋的 AI 项目(非常适合初学者) 你是否对构建 AI 项目感兴趣,但时间不够? 只需 Node.js 和一个周末,你就可以投入到动手实践的 AI 项目中,这些项目将提升你的编码技能,并让你了解人工智能的实际应用。 这些适合初学者的项目将指导你设置聊天机器人、图像识别、情感分析等。 所以,拿起你的笔记本电脑,准备好用这五个令人兴奋的 A

阅读更多
人工智能代理的 5 个等级

人工智能代理的 5 个等级

自主 AI 代理是能够独立执行一系列复杂任务以实现目标的 AI 系统。 AI 代理、自主代理、代理应用程序或我所称的代理 X 这些术语是可以互换使用的。 一些背景 我喜欢敏捷在组织中崛起的例子,其中项目经理演变为Scrum Master,适应迭代开发周期。 同样,Conversational AI 也经历了转变,从基本的 **chatbot framew

阅读更多
💸 利用人工智能每分钟赚 5 美元:懒人轻松赚钱指南 💻

💸 利用人工智能每分钟赚 5 美元:懒人轻松赚钱指南 💻

轻松收入:AI如何让“悠闲”一代的生活更轻松 🦥 辛苦工作的时代已经过去。如今,懒人(没错,你没听错)正在利用数字革命赚取收益。如果你曾梦想在不费吹灰之力的情况下赚钱,人工智能(AI)就是你的黄金票据。 不需要华丽的学位,不需要10小时的工作日,绝对没有压力。只需聪明、简单的步骤,就能将你的沙发变成指挥中心。🛋️✨ 为什么懒惰是新的聪明 🤓 面对现实吧——我们中的

阅读更多
2024 年 10 个行业的 50 多个最佳生成式人工智能应用案例

2024 年 10 个行业的 50 多个最佳生成式人工智能应用案例

展望2024年,生成式AI(Gen AI)正日益被视为推动各行业转型的关键技术。这一演变标志着传统AI在预测和分析角色上的转变,转向Gen AI的创造性能力,使企业能够自动化复杂任务,促进创新,并提供高度个性化的客户体验。根据最近的分析,投资于AI的企业效率提升可达30%,而实施Gen AI的企业则进一步优化了他们的工作流程和成果。 在本文中,我们深入探讨了十大领先行业中50多个具有影响力

阅读更多
6 个优秀到让人觉得违法的人工智能代理

6 个优秀到让人觉得违法的人工智能代理

AI 代理是未来,因为它们可以用 100% 的准确性和快速的速度 替代所有的手动工作。 它们甚至在复杂任务上也在不断进步,比如 编码应用程序、市场营销、制作视频和其他创意工作。 如果你现在不使用 AI 代理,你可能会落后。记住这句话: AI 不会取代你,使用 AI 的人会。 这就是为什么我带来了一些 AI 代理,它们将帮助你成为你所在行业或当前工作的 前 1%

阅读更多
2025 年让你致富的 6 款最佳人工智能工具

2025 年让你致富的 6 款最佳人工智能工具

→ 在人工智能与技术领域 是时候利用人工智能开始你的事业,否则以后会后悔! 不管你喜欢与否, 机器人正在到来。 [根据高盛的说法,](https://www.forbes.com/sites/jackkelly/2023/03/31/goldman-sachs-predicts-300-million-jobs-will-be-lost-or-d

阅读更多
让AI为你写Python代码!六步解锁效率的奥秘!

让AI为你写Python代码!六步解锁效率的奥秘!

使用INSPIRe框架节省时间并获得竞争优势(ChatGPT-4 — Claude 3 — Gemini) AI不会取代你,但会取代那些更会写提示的人。 这是我告诉我在数据科学和软件工程领域的朋友们的话。有些人对此不以为然。“AI肯定无法生成多步骤的代码,”他们会说。其他人则大笑。“得了吧,这对初学者才有用!” 但不久之后,他们都开始寻求提示工程的建议。 到2022年底,L

阅读更多
使用克劳德模型上下文协议(MCP)和外部工具的 6 个步骤

使用克劳德模型上下文协议(MCP)和外部工具的 6 个步骤

通过MCP集成GitHub和Brave Search来增强Claude桌面的功能 模型上下文协议 (MCP) 是由Anthropic开发的开放标准,使像Claude这样的AI模型能够安全地与各种数据源和工具进行交互。 ![](https://wsrv.nl/?

阅读更多
关于人工智能船员的博客,写关于人工智能船员的博客 | 作者:Ryan A Ellis | Medium

关于人工智能船员的博客,写关于人工智能船员的博客 | 作者:Ryan A Ellis | Medium

介绍 这篇博客的目的是简要展示我使用 crewAI 框架构建的内容以及使其工作的组件。我想测试一下我从 DeepLearning.AI 的短期课程 Multi AI Agent Systems with crewAI 中学到的知识

阅读更多
揭秘AI加密代币:如何颠覆区块链世界?5大创新点助你掌握未来!

揭秘AI加密代币:如何颠覆区块链世界?5大创新点助你掌握未来!

探索AI代币及其功能、优势、使用案例和一些示例。 区块链技术经历了显著的演变。它为旨在增强去中心化、匿名性、保障数字交互以及使Web3对所有人可及的创新铺平了道路。此外,焦点越来越多地转向解决关键挑战,如用户体验、提升可

阅读更多
开发人员 2025 年人工智能入门路线图

开发人员 2025 年人工智能入门路线图

在我上一篇文章中,我写了关于初学者学习 AI 的路径,试图揭开其工具和日常任务应用的神秘面纱。 这次,我们将大幅度转向。 想象一下,完全独立构建、部署甚至货币化 SaaS 应用程序,但你不知道从哪里开始。本文主要面向寻找指南或课程的初级开发者,将介绍一些关键概念、工具和策略,帮助你入门。 和往常一样,我将文章组织成几个大类别和主题,这些内容并不需要按顺序阅读,所以如果你已经熟悉某些

阅读更多
与 Cursor 和 Claude-Dev 共度的一个月:我的想法

与 Cursor 和 Claude-Dev 共度的一个月:我的想法

我最近在使用两个新工具—— Cursor 和 Claude-Dev ——这两个工具在开发者社区中都引起了相当多的关注。它们都是通过 AI 驱动的助手来提高编码的速度和直观性,但它们采取了不同的方法,并各自有自己的优缺点。在使用这两者大约一个月后,我觉得是时候坐下来反思一下它们的优势和仍需改进的地方。 让我们从 Cursor 开始。 Cursor: 熟悉但更快速

阅读更多
使用 LangGraph 框架以多代理方式实施复杂的 LLM 应用程序

使用 LangGraph 框架以多代理方式实施复杂的 LLM 应用程序

将LangGraph添加到您的GenAI相关技能库中。这项技能可以立即使您能够创建复杂的AI系统。当然,前提是您需要了解LangChain的使用方法。介绍 LangGraph 是一个强大的工具,旨在使用大型语言模型 (LLMs) 创建有状态的多参与者应用程序。通过扩展 LangChain 库的功能,LangGraph 使得多个链(或参与者)能够在各种计算步骤中以循环方式进

阅读更多
多模态人工智能助手:结合本地模型和云模型

多模态人工智能助手:结合本地模型和云模型

使用 LangGraph、mlx 和 Florence2 构建一个能够回答复杂图像问题的智能体,支持本地运行。 *在本文中,我们将结合 LangGraph 和多个专业模型,构建一个基础的智能体,能够回答有关图像的复杂问题,包括图像描述、边界框和 OCR。最初的想法是仅使用本地模型构建,但经过一些迭代后,我决定添加对基于云的模型(即 GPT4o-mini)的连接,以获得更可靠的

阅读更多
新崛起红星:Qwen2.5来了

新崛起红星:Qwen2.5来了

一起测试新生的阿里云生成式AI Qwen2.5,使用Python和llama-cpp 在没有太多宣传和预期公告的情况下,阿里云于9月19日发布了他们的旗舰模型系列Qwen2.5。 阿里云在Qwen上的革命性旅程再次展示了通过创新的强大领导力。 怎么做的?它们有什么特别之处?我们应该期待什么? 在本文中,我们将探讨新模型并检查其性能。作为后续,在下一篇文章中,我们将使用`l

阅读更多
精细调优大语言模型:揭开HuggingFace的神秘面纱!如何克服GPU内存束缚?

精细调优大语言模型:揭开HuggingFace的神秘面纱!如何克服GPU内存束缚?

每次大型语言模型 (LLMs) 的新公告往往将性能推向新的高度,常常超越之前的基准(例如,巨量多任务语言理解或 MMLU)。这一进展激发了许多应用程序的出现,利用最大的和最优秀的模型。在我们之前的帖子中,我们讨论了 LLMs 的规模法则,并解释

阅读更多
在软件应用程序中使用 AutoGen 的实用指南

在软件应用程序中使用 AutoGen 的实用指南

更新:虽然这篇文章是在四个月前写的,但 AutoGen 自那时以来变化很大。对于我代码示例中可能过时的内容,我深感歉意。 如果您想了解 AutoGen,可以查看 文档、Colab 笔记本 和 [博客

阅读更多
机器人艺术家赚的钱比你整个创作生涯赚的钱还多

机器人艺术家赚的钱比你整个创作生涯赚的钱还多

我们已经达到了人工智能创造力和商业的新高度 首先,我们让计算机屏幕根据人类创作来创作艺术。现在,是一台真正的机器人在进行绘画。 没错——一位“超现实主义机器人艺术家”已经被训练成能够在画布上实际绘画。它描绘的已故计算机科学家艾伦·图灵最近在苏富比拍卖会上拍出了130万美元的高价。 正如IFLScience [报道](https://proxy.rifx.onl

阅读更多
使用 Llamaindex 和 AI ChatBot 构建可投入生产的 Agentic 人工智能聊天机器人的简单分步指南。

使用 Llamaindex 和 AI ChatBot 构建可投入生产的 Agentic 人工智能聊天机器人的简单分步指南。

介绍 在本文中,我们将了解如何使用 Llamaindex 和 Groq-Llama 3.3 构建一个端到端的代理型 AI 聊天机器人。 在本文的课程中,您将学习:拨开代理型 AI 和代理的神秘面纱:消除围绕代理型 AI 的炒作 了解 Llamaindex 中的 ReActAgent 和 FunctionCallingAgent 以及如何添加工具/函数 一个简

阅读更多
代理人工智能:从零开始构建自主系统

代理人工智能:从零开始构建自主系统

在生成式人工智能时代创建多智能体框架的逐步指南 本文由Rafael Guedes共同撰写。 介绍 生成式人工智能的崛起是数字时代的新平台转变。它解决了从大型企业的自动化到各种类型的研发和创意等问题。预计到2024年,全球市场将超过650亿美元,86%的IT领导者预计将发生重大组织变革[1]。到目前为止,最大的收益来自于聊天机器人(更为通用且广泛的应用案例)、代码助

阅读更多
使用 Autogen 进行代理人工智能金融分析:比特币和特斯拉哪个更好?

使用 Autogen 进行代理人工智能金融分析:比特币和特斯拉哪个更好?

你是否曾经想过,NVidia 和特斯拉,哪个投资更好?但是如果你懒得自己去分析,或者甚至不知道该如何开始呢? 这是个严肃的问题,我知道。如果我们能让 ChatGPT 来完成这个任务,那该多好,但如果你已经尝试过——你就知道它并不擅长这方面。你可以让它制定计划,但让它在多个步骤中坚持执行就很难。而且它在会计方面也不太擅长,所以分析财务数据并不是它的强项。有没有办法解决这个问题,还是说没有

阅读更多
模块化人工智能中的代理协调:设计不断发展的系统

模块化人工智能中的代理协调:设计不断发展的系统

虽然头条新闻聚焦于越来越大的语言模型和计算突破,但一种更为安静的演变正在塑造我们构建 AI 系统的方式。 这一转变并非关于规模——而是关于交响乐。 传统的单体 AI 架构,尽管无疑强大,但正面临实际限制。这些 AI 系统旨在在单一模型中处理多样化任务,但在面对真实企业环境的复杂性时,往往会出现问题。随着组织在多个领域和工作流程中部署 AI,单体系统的挑战变得显而易见:僵化的架构抵制修

阅读更多
代理 RAG 系列:探索 LangGraph 高级工作流程

代理 RAG 系列:探索 LangGraph 高级工作流程

介绍 在上一篇文章中,我们介绍了Agentic RAG的概念,强调它如何通过集成自主代理能力来扩展传统的检索增强生成(RAG)框架。在本期中,我们深入探讨LangGraph,这是一个用于协调逻辑工作流程的创新框架。LangGraph使得创建具有复杂推理能力的多代理系统成为可能,是构建Agentic RAG架构的理想工具。 ![](https://wsrv.nl/?u

阅读更多
从自然语言到 SQL 生成的代理反射

从自然语言到 SQL 生成的代理反射

作者:Atul Varshneya, Toby Fotherby, Shweta Keshavanarayana 介绍 自然语言到 SQL (NL2SQL) 的转换有望为非技术用户普及数据访问。然而,这一过程充满了挑战。自然语言中的模糊性、数据库架构的变化、数据库中表的数量庞大以及 SQL 语法的复杂性常常导致不准确和/或低效的 SQL 查询生成。即使是先进的 AI 模型也难以

阅读更多
Agentic Workflow and Retrieval-Augmented Generation:实时健康监测指南

Agentic Workflow and Retrieval-Augmented Generation:实时健康监测指南

探索这种模块化架构如何彻底改变实时医疗数据分析,增强对高风险老年人的监督。通过将多智能体系统(MAS)与检索增强生成(RAG)集成,本指南为医疗保健和人工智能领域的专业人士提供优化患者监测和提供准确、可操作见解的工具。 介绍 传统的医疗监测系统通常依赖于静态的线性管道。数据被处理,规则被应用,结果被生成。虽然这种线性方法有效,但可能显得僵化,适应性差,并且对患者不断变化的临

阅读更多
人工智能代理、代理人工智能和自主人工智能:它们一样吗?

人工智能代理、代理人工智能和自主人工智能:它们一样吗?

几周前,我在Medium上发布了一篇题为“AI代理与代理性AI:有什么区别,为什么重要?”的文章,没想到引起了比我预期更大的反响。 这篇文章获得了超过17,000次的

阅读更多
简化的人工智能代理:人工智能代理如何利用领域知识回答问题

简化的人工智能代理:人工智能代理如何利用领域知识回答问题

揭秘企业AI代理如何利用领域知识定制回答客户问题,并严格限制答案在领域知识范围内。 背景 你是否曾想过,今天最先进平台上的尖端 AI 代理是如何运作的?例如,在上面的截图中,我向 wealthsimple.com 的 AI 代理询问利率问题,它提供了特定于 Wealthsimple 产品的答案,并将其限制在 Wealthsimple 产品范围内。它没有告诉我美国银行的现

阅读更多
人工智能加密货币交易机器人:今天就实现交易自动化 | 作者:Trade Aria | 2024年12月 | Medium

人工智能加密货币交易机器人:今天就实现交易自动化 | 作者:Trade Aria | 2024年12月 | Medium

AI-驱动的加密货币交易自动化 加密货币交易的世界正在快速变化。人工智能 (AI) 正在产生重大影响。它利用先进的算法和机器学习使交易变得更加简单和智能。 自动化交易的基本原则 交易是由交易机器人

阅读更多
AI for BI:利用 CrewAI 和 OpenAI 构建商业信息报告

AI for BI:利用 CrewAI 和 OpenAI 构建商业信息报告

如何直接从CSV数据创建简单的BI报告 商业信息应用程序帮助企业将数据作为资源来做出关键决策,我们将利用AI构建一个这样的应用。 AI必将越来越多地在BI工具中发挥作用;更具体地说,基于LLM的应用程序将使BI应用能够创建可视化,通过数据分析提供洞察,并自动化商业报告。 因此,在本文中,我们将探讨LLM应用如何帮助创建商业信息。它不会是一个全面的BI应用;然而,它将直接从数

阅读更多
使用 FastAPI、Groq 和 Replicate 的 AI 图像生成器和故事生成应用程序

使用 FastAPI、Groq 和 Replicate 的 AI 图像生成器和故事生成应用程序

项目介绍:AI 图像生成器和故事创作工具 AI 图像生成器和故事创作工具是一个网络应用程序,利用先进的 AI 技术为用户提供一个基于音频提示生成图像和故事的互动平台。该应用程序使用 FastAPI 作为后端,能够高效处理请求和响应,而前端则采用 HTML、CSS(DaisyUI 和 Tailwind CSS)和 JavaScript 构建,以提供响应式用户体验。该应用程序利用 lla

阅读更多
代码审查中的人工智能

代码审查中的人工智能

我们都知道,少量的上下文可以完全改变我们对 AI 模型的回答。这不仅限于 AI,人类的运作方式也是如此。同样的原则适用于编码。如果没有上下文,代码审查可能会偏离目标。传统的方法往往关注表面问题,而更深层次、更复杂的问题却被忽视。 这就是 基于 AI 的代码审查 的作用。通过引入先进的人工智能,这些审查可以对问题有更深刻的理解,将例行检查转变为战略资产。基于 AI 的代码审查者可以彻

阅读更多
人工智能帮助我控制糖尿病前期病情

人工智能帮助我控制糖尿病前期病情

健康 | 血糖 | 糖尿病 我如何利用技术控制血糖、减肥和保持健康 免责声明:我不是医生,本文的任何部分都不应被视为医疗建议。我分享的是我自己在管理减肥和避免糖尿病方面的探索。 *您所有的健康护理问题和挑战应与您的个人健康护理专业人士讨论。本文仅应被视为娱乐内容,不应用于教育或医疗。* 现状 如果你一直在关注我,你会知道我处于糖尿病前期,并且体

阅读更多
采用 Phi-3-Vision-128K 的人工智能 OCR:文档处理的未来

采用 Phi-3-Vision-128K 的人工智能 OCR:文档处理的未来

在快速发展的人工智能领域,多模态模型正在为视觉和文本数据的整合设定新标准。最新的突破之一是 Phi-3-Vision-128K-Instruct,这是一个最先进的开放多模态模型,推动了AI在处理图像和文本方面的能力边界。该模型专注于文档提取、光学字符识别(OCR)和一般图像理解,能够彻底改变我们处理PDF、图表、表格以及其他结构化或半结构化文档的信息方式。 让我们深入探

阅读更多
2024 年人工智能驱动的网络抓取:用 Python 构建价值百万美元的自动化工具

2024 年人工智能驱动的网络抓取:用 Python 构建价值百万美元的自动化工具

精通下一代网络爬虫:从零到英雄,结合 AI 集成、反检测策略和真实案例研究 | 完整指南与代码示例 🚀 介绍:自动化数据收集的力量 在当今数据驱动的世界中,网页抓取已经从一种简单的数据收集技术演变为开发者、数据科学家和企业的重要技能。无论您是在构建一个人工智能驱动的研究工具、监控市场趋势,还是为机器学习模型收集训练数据,掌握网页抓取都是您开启网络数据巨大潜力的门户。

阅读更多
人工智能研究代理:2025 年将改变知识研究(外加三大免费工具)

人工智能研究代理:2025 年将改变知识研究(外加三大免费工具)

事情是这样的:一些重大变化即将动摇知识研究的世界。 在深入研究AI研究代理并在各个行业看到它们的实际应用几个月后,我可以肯定地告诉你——到2025年,这些工具不仅仅是有用的工具。它们将从根本上改变我们进行知识研究的方式(无论是营销还是科学!)。人类在一个小时内访问10,000个网站并研究数据在物理上是不可能的。然而,代理可以轻松做到这一点。在这篇文章中,我将向你展示3个

阅读更多
扎克伯格预测:到 2025 年,人工智能将像工程师一样编码

扎克伯格预测:到 2025 年,人工智能将像工程师一样编码

在技术以惊人速度发展的时代,Meta的创始人马克·扎克伯格做出了一个大胆的预测:到2025年,人工智能将像中级工程师一样进行编码。这一声明在科技巨头和初创企业的走廊中回响,描绘了一个未来的图景,在这个图景中,人工智能不仅仅是开发者工具箱中的一个工具,而是工程团队的全职成员。 AI在编码中的曙光 设想一个世界,在这个世界里,编码的琐碎任务由一个与普通中级工程师同样出色的AI系统来

阅读更多
利用 CrewAI Flows 实现人工智能工作流程自动化

利用 CrewAI Flows 实现人工智能工作流程自动化

CrewAI CrewAI 是一个尖端的 Python 框架,用于协调角色扮演和自主 AI 代理。通过构建“团队”由专业代理,我们可以自动化任务、生成创意文本格式,并以全新的方式访问信息。本文将指导您如何使用 CrewAI 的 Flow 功能创建简单项目。 流程 CrewAI 流程是一个强大的功能,旨在简化 AI 工作流程的创建和管理。流程允许开发人员与多个任务和团队协

阅读更多
阿里巴巴 Marco-o1:OpenAI-o1 的开源替代品

阿里巴巴 Marco-o1:OpenAI-o1 的开源替代品

LLM用于开放式问题 OpenAI-o1 是一次革命性的发布,使 LLM 能够对复杂任务进行详细推理,例如数学或物理问题,而不仅仅局限于通用文本生成。 但 OpenAI-o1 是收费的 正如预期的那样,开源竞争者并不遥远,而再次是阿里巴巴(在 Qwen 系列之后)最近推出了 Marco-o1。 什么是 Alibaba 的 Marco-o1? Marco-o1

阅读更多
阿里巴巴 QwQ:比 OpenAI-o1 更适合推理?

阿里巴巴 QwQ:比 OpenAI-o1 更适合推理?

32b 开源模型超越 o1 mini,并与 o1-preview 竞争 几天前,阿里巴巴发布了 Marco-o1,一个 7b 推理模型。现在,他们又发布了一个改进版本,称为 QwQ,甚至超越了 OpenAI-o1 mini,并与 o1-preview 持平。最棒的是什么? 它是开源的 什么是 Alibaba QwQ-32b-preview? QwQ-32B-

阅读更多
阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴开源 Qwen:它如何彻底改变人工智能以及如何使用它

阿里巴巴最近在人工智能领域引起了轰动,在2024年 Apsara 大会上开源了其 Qwen 2.5 模型。Qwen 拥有超过 100 个模型,涵盖语言、视觉、音频和代码等多种模态,使其成为最全面的开源人工智能解决方案之一。此次发布通过提供多样化应用的工具,赋能开发者,从文本到视频生成到实时问答。 阿里巴巴 Qwen 模型的关键特性多模态能力:Qwen 模型处

阅读更多
Anthropic 的克劳德人工智能现在可以复制你的写作风格

Anthropic 的克劳德人工智能现在可以复制你的写作风格

我作为多个组织的AI大使已经工作了几个月,如果有一个问题是大多数用户不断询问的,那就是如何让AI聊天机器人像他们一样写作。基本上,他们希望像ChatGPT、Claude和Gemini这样的聊天机器人能够模仿他们的写作风格,这样他们就不必每次都给AI提供详细的指示。 我总是告诉用户,他们可以通过两种方式做到这一点:简单的方法: 创建一个自定义聊天机器人,添加指示,例如以

阅读更多
Anthropic 的 MCP:使用 Claude Desktop 设置 Git MCP Agentic 工具

Anthropic 的 MCP:使用 Claude Desktop 设置 Git MCP Agentic 工具

在本详细指南中,我将带您了解如何设置和使用Model Context Protocol (MCP) Git与Claude Desktop的集成。这种工具使Claude能够直接分析和与您的Git仓库进行交互,提供先进的代码分析和版本控制功能。我们将涵盖从基本设置到高级用例、故障排除和最佳实践的所有内容。让我们先了解一下MCP是什么以及它的重要性。 以下是我们在本综合指南中将要涵盖的内容:

阅读更多
苹果的 LLM Siri:人工智能对话的新时代?

苹果的 LLM Siri:人工智能对话的新时代?

人工智能 近年来,人工智能的世界迅速发展,生成式AI(genAI)似乎被添加到一切事物中。苹果的Siri,曾是对话AI的先锋,正处于推出其自身生成式AI形式的边缘,称为“LLM Siri”。这一新版本承诺使Siri更加具有上下文意识,能够处理复杂的对话。 LLM Siri的想法并不完全新颖;苹果已经暗示将在2025年对Siri进行改造,作为其不断扩展的“苹果智能”套件的一部分。

阅读更多
你准备好迎接人工智能的未来了吗?OpenAI 的 Swarm 可能会改变一切

你准备好迎接人工智能的未来了吗?OpenAI 的 Swarm 可能会改变一切

学习如何配置和个性化 OpenAI 的 Swarm 框架,以创建强大的、协作的多代理系统,满足您的独特需求并推动更智能的自动化 想象一个复杂问题不是由单一 AI 而是由一个团队的智能代理无缝协作解决的世界。OpenAI 的 Swarm 使这一愿景成为现实。它是一个开创性的框架,利用 LLM 的力量创建一个协作的系统,其中每个代理都有独特的角色。 无论是自动化耗时的工作流程、解决多

阅读更多
文物:Claude 3.5 Sonent 最令人惊叹的用途

文物:Claude 3.5 Sonent 最令人惊叹的用途

Anthropic 最近推出了其最先进的 LLM,“Claude 3.5 Sonnet”,让人惊叹。社交媒体上的人们称这一模型为当前最先进的 LLM。这个 AI 模型在性能上超越了所有现有的 LLM,例如 GPT-4、GPT-4o mini、Llama 3 等等。Claude 3.5 Sonnet 的上下文窗口为 200K,最大输出为 8192 个 tokens。它可以生成一个包含大

阅读更多
AutoGen:智能自动化的代理开放源码框架

AutoGen:智能自动化的代理开放源码框架

AutoGen是微软提供的一个开源框架,用于构建能够通过对话模式协作完成任务的智能体。AutoGen简化了AI开发和研究,支持多种大型语言模型(LLMs)、集成工具和先进的多智能体设计模式。您可以在本地开发和测试智能体系统,然后根据需求将其部署到分布式云环境中。 该框架允许开发者通过多个智能体构建LLM应用,这些智能体可以相互对话以完成任务。AutoGen智能体是可定制的、可对话的,并

阅读更多
自动求职:人工智能一夜之间申请 1000 个职位,获得 100+ 个面试机会!

自动求职:人工智能一夜之间申请 1000 个职位,获得 100+ 个面试机会!

在当今快节奏和竞争激烈的就业市场中,寻找和获得理想工作既耗时又令人疲惫。这个过程通常涉及无休止的浏览职位列表、定制每一份申请以及重复填写表格——所有这些都可能导致求职疲劳和错失机会。这里有Auto_Jobs_Applier_AIHawk,您的AI驱动求职助手,旨在自动化申请过程,提供个性化推荐,并显著提高您获得心仪职位的机会。 本综合指南将带您了解有关Auto_Jobs

阅读更多
利用 CrewAI Agents 实现漫画创作自动化:创意内容生成

利用 CrewAI Agents 实现漫画创作自动化:创意内容生成

介绍 曾几何时,创作一本漫画书是一个繁琐的过程,需要作家、插画师和无数小时的努力。今天,人工智能作为一种强大的工具,增强了创意专业人士的能力。想象一下,将一个短故事交给人工智能,观看它如何帮助将这个故事转变为一个生动、视觉上令人惊叹的漫画书——同时保留创作者独特的视角。这不再只是一个幻想;这是由尖端的生成式人工智能模型实现的现实。在本博客中,我们将探讨CrewAI LLM代理如何提升

阅读更多
使用 CrewAI 自动分析 CSV

使用 CrewAI 自动分析 CSV

在本博客中,我们将探讨如何使用CrewAI自动化分析CSV数据集的过程。我们将构建一个工作流程,其中包括用于数据集上下文推断、数据清理、可视化和报告的代理,并最终形成一个精美的Markdown报告。 1. 初始化环境 我们首先导入必要的库,并为工作流程初始化工具和环境。 import os import pandas as pd import char

阅读更多
超越 Text2SQL:自然语言数据库查询的新领域

超越 Text2SQL:自然语言数据库查询的新领域

介绍 TAG,一个用于复杂问题回答的统一模型 缩小人工智能与数据库之间的差距 承诺与瓶颈 人工智能(AI)正在迅速改变我们与数据互动的方式。强大的语言模型(LMs)的出现为以更自然和直观的方式查询和分析信息开辟了新的可能性。想象一个世界,你可以用简单的英语提问,系统就能从庞大的数据库中检索到你所需的确切信息。这就是AI驱动的数据交互所带来的承诺。 然而,存在

阅读更多
颠覆想象!揭秘7维代理AI价值的强大潜力!

颠覆想象!揭秘7维代理AI价值的强大潜力!

推动现实世界影响的整体架构“想象一下,一个能够感知其环境、创造性地制定解决方案、协调多步骤工作流并不断学习的 AI——无需持续的人类微观管理。”欢迎来到代理型生成 AI的世界,在这里,系统可以自主感知、推理、行动、适应和解释它们的决策。 在这篇文章中,我将介绍一个高级概念架构,将这些能力提炼为7 个核心 AI 维度。把它想象成一个**全局指南

阅读更多
Bolt DIY + Deepseek V3 + Gemini 2.0:免费人工智能编码器

Bolt DIY + Deepseek V3 + Gemini 2.0:免费人工智能编码器

嘿,你听说过 Bolt DIY 吗? 它超级酷,我敢打赌你会喜欢它。 想象一下,在你的浏览器中有一个智能 AI 助手,可以帮助你编写全栈应用程序。 最棒的是?它是免费的,灵活性超高。 让我来解释一下它是如何工作的。 什么是 Bolt DIY? 所以,Bolt DIY 是一个开源工具(它以前被称为 oTToDev,如果你听说过的话)。 它允许你直接在浏览器中构建全栈应用

阅读更多
Bolt.new 和 Ollama:革新人工智能驱动的全栈式 Web 开发

Bolt.new 和 Ollama:革新人工智能驱动的全栈式 Web 开发

在快速发展的 Web 开发世界中,效率和创新至关重要。开发者、项目经理和设计师们都在不断寻找能够简化工作流程、降低成本和提高生产力的工具。Bolt.new 是一款突破性的 AI 驱动全栈 Web 开发代理,完全在您的浏览器中运行。与 Ollama 配合使用,后者允许您在本地运行开源 AI 模型,Bolt.new 将彻底改变我们构建和部署 Web 应用程序的方式。本文将深入

阅读更多
2025年冲击AI领域!6个月掌握LLM的必经之路!

2025年冲击AI领域!6个月掌握LLM的必经之路!

作为一名从电子工程背景转型为专注于大型语言模型(LLMs)和生成式AI的数据科学家,我理解进入AI领域的挑战与兴奋。到2025年,行业格局与我开始旅程时有了显著变化。让我分享一个实用的学习路径,无论您是全新起步还是从其他领域转型。结合我自身的经历和行业经验,我将重点介绍在当今AI领域中最重要的技能和知识。 为什么在2025年关注大型语言模型(LLMs)? 当我开始转向人工智能领域时

阅读更多
浏览器使用 + LightRAG 代理,可使用 LLM 抓取 99% 的网站!..!

浏览器使用 + LightRAG 代理,可使用 LLM 抓取 99% 的网站!..!

在这个故事中,我将提供一个快速教程,展示如何使用浏览器使用、LightRAG和本地LLM创建一个强大的聊天机器人,以开发一个能够抓取您选择的任何网站的AI代理。此外,您可以询问有关您的数据的问题,这将为您提供该问题的回答。免责声明:本文仅用于教育目的。我们不鼓励任何人抓取网站,特别是那些可能有反对此类行为的条款和条件的网络属性。现有的RAG系统存在显著的局限性,包括依赖扁平数据表

阅读更多
使用 Llama3.1 创建客户支持助理

使用 Llama3.1 创建客户支持助理

使用 LLM 代理和 Amazon Bedrock 解决客户查询的 AI:构建和部署支持助手的指南,使用 Llama3.1 介绍 问题 企业经常面临处理大量客户询问的挑战。这些询问可能从简单的问题“我的订单状态是什么?”到需要人工干预的更复杂的问题不等。重复询问的庞大数量可能会使客户支持团队不堪重负,导致响应时间延长和客户满意度降低。此外,利用人力资源处理简

阅读更多
5 分钟内构建财务报告分析器:LlamaIndex + 毕马威会计师事务所案例研究

5 分钟内构建财务报告分析器:LlamaIndex + 毕马威会计师事务所案例研究

在当今快速变化的金融世界中,快速而准确地从冗长的报告中提取有意义的见解至关重要。随着生成性人工智能的出现,我们现在拥有强大的工具来自动化和增强这一过程。在本文中,我将带您了解如何使用LlamaIndex构建一个复杂的财务报告分析系统,以KPMG关于财务报告中人工智能的报告作为我们的测试案例。如果您对提高生产力和机器学习技能的实用技巧感兴趣,请随时订阅我们的[LinkedIn页面]

阅读更多
使用 Python 免费构建营销专家聊天机器人!

使用 Python 免费构建营销专家聊天机器人!

使用 Python 和 DSPY 构建的营销聊天机器人 构建您的营销专家助手,专门用于回答您所有的营销相关问题,使用 Python 和 DSPy。***还不是会员?请随意访问完整文章 [here](https://readmedium.com/build-a-marketing-expert-chatbot-using-python-for-free-5fe04e0

阅读更多
使用 LangChain、Streamlit 和 PubMed 构建基于 RAG 的科学聊天机器人--第 4 部分(将所有...

使用 LangChain、Streamlit 和 PubMed 构建基于 RAG 的科学聊天机器人--第 4 部分(将所有...

您好,欢迎来到构建科学聊天机器人的系列最后一部分,使用Langchain、Streamlit和PubMed! 在前一部分中,我们构建了数据持久性和带有向量存储的RAG管道。现在,是时候将我们所构建的一切整合在一起,创建聊天机器人用户界面,利用我们构建的后端功能,帮助科学家回答他们的科学问题! 作为提醒,这就是我们在系列中构建的完整解决方案: ![](https://images.w

阅读更多
利用 Gemini 2.0 多模态实时 API 构建实时屏幕共享助手

利用 Gemini 2.0 多模态实时 API 构建实时屏幕共享助手

Gemini 开发教程 V3 在 Gemini 2.0 系列的最后几期教程中,我们建立了一个自托管的实时语音和视频聊天机器人的核心功能,并为其添加了功能调用特性,以便它能够调用外部工具和 API。这些都是具有快速响应、人性化互动和增强推理能力的实用应用,得益于 Gemini 2.0 多模态实时 API。 在本教程中,我们将重点关注模型的另一个实用应用,您可能已经在 Googl

阅读更多
用 Python 构建可投入生产的人工智能助理后台服务 - 第 1 部分

用 Python 构建可投入生产的人工智能助理后台服务 - 第 1 部分

— 学习构建生产就绪应用程序的最佳实践。 *免责声明 — 本文中的内容仅代表我个人观点,不代表我当前或过去雇主的观点。* 通过本综合教程的学习(请按照所有 4 个部分),您将能够使用以下架构中解释的框架开发后端服务: ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/

阅读更多
构建生产就绪的人工智能助理后台服务(Python)--第 2 部分

构建生产就绪的人工智能助理后台服务(Python)--第 2 部分

— 使用 LangGraph 构建多代理 RAG 系统 + 用授权密钥头保护您的应用程序 *免责声明 — 本文内容仅代表我个人观点,不代表我当前或过去雇主的立场。* 在上一部分([第 1 部分](https://readmedium.com/build-production-ready-ai-assistant-backend-service-in-python-part-

阅读更多
构建生产就绪的人工智能助理后台服务(Python)--第 3 部分

构建生产就绪的人工智能助理后台服务(Python)--第 3 部分

— 使用授权密钥保护您的应用程序 + 通过实际的 MongoDB 数据库和语义缓存能力提升后端吞吐量服务 *免责声明 — 本文中的内容仅代表我个人观点,与我当前或过去的雇主无关。* 回顾一下在 [第一部分](https://readmedium.com/build-production-ready-ai-assistant-backend-service-in-python

阅读更多
利用长期持久内存和原子代理打造更智能的人工智能代理

利用长期持久内存和原子代理打造更智能的人工智能代理

任何 AI 助手中最有用的功能之一无疑是拥有 持久的长期记忆。无论目标是了解用户更多信息、根据用户偏好调整 AI 的行为,还是记住重要事件,为您的 AI 助手 / 代理 / … 提供某种形式的 长期持久记忆存储 是实现这一目标的核心需求之一。 在我们深入之前:我们将使用 [Atomic Agents](https://github.com/Bra

阅读更多
使用 Python 构建您自己的个性化健身 RAG 代理!

使用 Python 构建您自己的个性化健身 RAG 代理!

AI代理 | RAG代理 | Python | DSPy | 健身代理 | 初学者友好 完整且适合初学者的指南:使用 Python 构建您完全个性化的健身 RAG 代理***还不是会员?请随时访问完整文章 [这里](https://readmedium.com/69fe37b803f6?source=friends_link&sk=13d4674246ba

阅读更多
在本地构建会说话的语音人工智能助理:具有流光溢彩用户界面的记忆保持聊天机器人...

在本地构建会说话的语音人工智能助理:具有流光溢彩用户界面的记忆保持聊天机器人...

开发您自己的具有上下文记忆和实时聊天功能的语音 AI 的逐步指南,基于 Llama3.1 和 Llama3.2 模型 👨🏾‍💻 GitHub ⭐️ | 👔LinkedIn |📝 [Medium](https://med

阅读更多
使用 Ollama 构建代码分析助手:本地 LLM 分步指南

使用 Ollama 构建代码分析助手:本地 LLM 分步指南

想要一个完全在本地机器上运行的 AI 驱动代码审查工具吗?在这个两部分的教程中,我们将使用 ClientAI 和 Ollama 来构建这样一个助手。 我们的助手将分析 Python 代码结构,

阅读更多

利用 CrewAI 为自动化 EDA 构建人工智能代理协作框架

引言:数据探索的新纪元 在当今这个数据驱动的世界中,企业不断寻求从庞大的数据集中提取可操作的洞察。传统上,这项任务一直是熟练数据科学家的领域,他们花费大量时间探索和分析数据。但如果我们能够自动化这个过程呢?如果一个由人工智能驱动的系统能够对数据提出有见地的问题,彻底分析数据,并呈现详细报告——所有这些都只需最少的人为干预?这正是我们的项目旨在通过利用CrewAI代理框架来实现的目标。

阅读更多
构建动态多代理工作流:利用 LangChain 和 LangGraph 实现人工智能协作

构建动态多代理工作流:利用 LangChain 和 LangGraph 实现人工智能协作

本文利用 LangChain 和 LangGraph 创建一个简单的多智能体系统。智能体协同工作以完成任务。第一个智能体生成一系列随机数字,第二个智能体将这些数字乘以 10。每个智能体使用 OpenAI 的 GPT-4o API 来执行这些任务。 本文遵循基于工作流的架构,智能体根据分配的任务进行交互。在这篇文章中,我们将逐步分析脚本的每个部分以及它如何为整体流程做出贡献。

阅读更多
使用 Ollama、Swarm 和 DuckDuckGo 构建本地 AI 新闻聚合器

使用 Ollama、Swarm 和 DuckDuckGo 构建本地 AI 新闻聚合器

使用OllamaSwarm和DuckDuckGo构建本地AI驱动的新闻聚合器 在当今快节奏的世界中,跟上特定领域最新新闻的步伐可能会很具挑战性。如果我们能够利用生成式AI和代理的力量,创建一个完全在本地机器上运行的个性化新闻聚合器呢?在本文中,我们将探讨如何使用Ollama的Llama 3.2模型、Swarm进行代理编排,以及DuckDuckGo进行网络搜索来构

阅读更多
利用 ClientAI 和 Ollama 构建本地人工智能任务规划器

利用 ClientAI 和 Ollama 构建本地人工智能任务规划器

在本教程中,我们将使用 ClientAI 和 Ollama 构建一个 AI 驱动的任务规划器。我们的规划器将把目标分解为可执行的任务,创建现实的时间表,并管理资源——所有这些都在您的机器上运行。

阅读更多
OpenAI的Swarm(第一部分):简短的参考实现

OpenAI的Swarm(第一部分):简短的参考实现

一个简短的代码参考,用于构建。 字数:1350 | 预计阅读时间:8分钟 目录简介:多智能体系统的挑战 OpenAI的群体框架概述 [环境设置](https://

阅读更多
构建基于多代理的 自动递归--计划、执行、再计划流程

构建基于多代理的 自动递归--计划、执行、再计划流程

本博客包含以下三个部分:问题陈述 解决方案方法 结论与参考文献问题陈述 计划、执行与重新计划过程在智能体解决方案的领域并不新鲜。自去年以来,我们一直在实施这些基于智能体的计划-执行-重新计划过程。 因此,当我的一位同事讨论实施这些过程的挑战时,我感到很有趣,因为我认为这是一个讨论得很充分的问题。 但是在与他交谈时,我理解了他计划要做的场景的性质和复杂性,我认

阅读更多
构建多代理互联网研究助手

构建多代理互联网研究助手

…使用 OpenAI Swarm 和 Llama 3.2(100% 本地)。让我们使用 OpenAI Swarm 和 Llama 3.2(100% 本地)构建一个多智能体互联网研究助手: 动手教程,构建一个多智能体互联网研究助手应用程序,该应用程序:接受用户查询。 在网上搜索相关信息。 并将其转化为一篇精心撰写的文章。我们在这个应用中使用了三个智能体:

阅读更多
利用来自 Hugging Face 的 SmolAgents 库构建多代理供应链模拟

利用来自 Hugging Face 的 SmolAgents 库构建多代理供应链模拟

“smolagents — 一个构建优秀智能体的小型库” 供应链管理是一个复杂的领域,其中多个实体需要有效协调,以便将产品交付给最终消费者。现代供应链是一个复杂的网络,涉及供应商、制造商、分销商和零售商。对这些网络的仿真可以帮助我们理解瓶颈、优化操作并提高效率。 在本

阅读更多
使用 CrewAI 构建多代理系统

使用 CrewAI 构建多代理系统

AI代理正在通过独立分析数据、做出预测和推荐最佳行动来改变各个行业。这些智能程序不仅擅长独立执行任务,还在与其他代理协作方面表现出色,使它们在销售、市场营销和教育等领域成为宝贵的资产。 例如,在市场营销中,AI代理可以评估客户偏好,识别个人兴趣,并制定个性化的活动,以促进客户参与和满意度。在教育中,这些代理同样可以被利用来个性化学习路径,通过将课程与学生的独特需求和目标对齐来增强教育体

阅读更多
使用 AutoGen 构建人工智能个人助理 - 第 1 部分

使用 AutoGen 构建人工智能个人助理 - 第 1 部分

探索 AutoGen v0.4:构建具有 Gmail 和 Google Calendar 集成的 AI 助手 TL; DR 在这篇文章中,我构建了Aura的基础,这是一个个人AI助手,旨在使用AutoGen管理电子邮件和日历。以下是我所涵盖内容的快速概述:动机:Aura解决了生产力挑战,如收件箱过载、日程安排以及跟上技术趋势。 框架选择:选

阅读更多
使用 Llama 3.2 构建强大的本地人工智能网络搜索助手:

使用 Llama 3.2 构建强大的本地人工智能网络搜索助手:

将大型语言模型与实时网络搜索相结合,以获取最新答案和上下文相关见解 👨🏾‍💻 GitHub ⭐️ | 👔 LinkedIn | 📝 [Medium](https://medium.com/@monsuraliran

阅读更多
使用 LLMs 构建可靠的文本分类管道:分步指南

使用 LLMs 构建可靠的文本分类管道:分步指南

克服基于LLM的文本分类中的常见挑战 在本分步教程中,我们将介绍如何使用大型语言模型(LLMs)构建一个准确且可靠的文本分类管道。LLMs是强大的通用模型,在各种自然语言处理任务中展示了卓越的能力,并且它们在许多人工智能应用中越来越多地取代了专业模型。然而,如果不谨慎处理,使用LLMs进行分类可能会很棘手。 在将LLMs应用于分类时,一个常见的问题是模型可能无法以预期的输出或

阅读更多
建立一个能写入 Google 文档的研究代理(第 1 部分)

建立一个能写入 Google 文档的研究代理(第 1 部分)

可能帮助您完成作业的工具 ***本文是两部分系列的第一部分,我们将使用 LangGraph 和 Tavily 构建一个简单的研究助手,该助手编写和完善短文。为了跟踪它生成的计划、文章和评论,我们添加了程序化创建和编辑 Google Docs 的功能。在本文中,我们将重点关注助手,将文档连接的内容留到第二篇文章。您可以在 [这里](https://github.com/rmart

阅读更多
构建一个能写入 Google 文档的研究助手(第 2 部分)

构建一个能写入 Google 文档的研究助手(第 2 部分)

可能对你的作业有所帮助的工具 ***本文是两部分系列的第二部分,我们使用 LangGraph 和 Tavily 构建一个简单的研究代理,该代理可以撰写和完善短文。为了跟踪它生成的计划、文章和评论,我们增加了以编程方式创建和编辑 Google Docs 的能力。在第一篇文章中,我们构建了代理。现在我们将构建文档连接。你可以在 [这里](https://github.com/rma

阅读更多
构建人工智能代理,实现企业级软件开发自动化:实用视角

构建人工智能代理,实现企业级软件开发自动化:实用视角

Randy Zhang 和 Shamin Aggarwal Agentic AI 是一款基于大型语言模型(LLMs)的软件应用,通过模拟类人推理和决策来自动化任务。它在自动化小型和简单脚本的软件开发方面显示出了显著的能力 [1]。AI 代理能否用于自动化企业级软件开发?在大型复杂的软件开发环境中,我们会遇到什么样的挑战? 企业级软件项目通常是旨在满足复杂业务需求的大规模软件开发计划。这

阅读更多
OpenAIs Swarm(第二部分):使用 Ollama 和 Pydantic 的直接、本地优先方法

OpenAIs Swarm(第二部分):使用 Ollama 和 Pydantic 的直接、本地优先方法

一个简短的代码参考以供构建。 TLDR: 结合Ollama和Swarm框架,呈现了一种以本地为优先的构建智能AI代理的方法。 Ollama可以在本地运行大型语言模型,确保隐私和控制,而Swarm则提供了一个结构化的环境,用于设计和管理AI代理。 我们以第一性原理的编程方法强调简单性和高效性,避免使用带来不必要抽象的复杂框架,从而增加使用的tokens数量,并延迟首次tok

阅读更多
2025 年构建人工智能驱动的推荐系统!

2025 年构建人工智能驱动的推荐系统!

本博客深入探讨部署 AI 驱动的个性化引擎的复杂性,重点介绍如何利用 AI 和机器学习技术进行实时、高度针对性的推荐。无论您是在电子商务、媒体还是其他行业,理解这些系统对于保持竞争力至关重要。 AI驱动的个性化引擎介绍 AI驱动的个性化引擎改变了企业与客户互动的方式。通过利用先进的算法,这些系统分析用户行为和偏好,以提供量身定制的体验。这种个性化增强了用户参与度,提高了转化率

阅读更多
如何用Agentic AI颠覆医疗支持?探秘Doctolib的高效智能系统!

如何用Agentic AI颠覆医疗支持?探秘Doctolib的高效智能系统!

在 Doctolib,我们的使命不仅仅是构建我们所梦想的医疗体系——我们正在改变健康专业人员与技术之间的互动方式。两个雄心勃勃的目标驱动着我们:让使用我们解决方案的健康专业人员感到满意,并加快我们的创新步伐。但雄心壮志伴随着巨大的责任,尤其是在支持我们的用户方面。 随着我们平台的增长,支持请求的数量也在增加。传统的方法是简单地根据需求线性扩展我们的支持团队。然而,我们看到了不同思考的机会:

阅读更多
利用 LangGraph 和 OpenAI 打造代理金融分析师

利用 LangGraph 和 OpenAI 打造代理金融分析师

在股票交易的世界中,投资者依赖各种工具和方法来做出明智的决策。其中一种方法是 基本面分析,它评估公司的财务健康状况和股票表现,以提供可操作的见解。随着 AI 和机器学习的进步,股票分析现在可以在很大程度上实现自动化。在这篇文章中,我们将探讨如何使用 LangChain、LangGraph 和 Yahoo Finance 创建一个 股票表现分析代理,利用实时股票数据和关键技

阅读更多
利用 Docling、Ollama、Phi-4 | ExtractThinker 构建企业内部文档智能堆栈

利用 Docling、Ollama、Phi-4 | ExtractThinker 构建企业内部文档智能堆栈

在这个大型语言模型(LLM)的新时代,银行和金融机构在某种程度上处于劣势,因为前沿模型由于其硬件要求几乎无法在本地使用。然而,银行数据的敏感性带来了显著的隐私问题,尤其是当这些模型仅作为云服务提供时。为了解决这些挑战,组织可以转向**本地或小型语言模型(SLM)**设置,以将数据保留在内部,避免敏感信息的潜在泄露。这种方法使您能够利用先进的LLM(本地或通过最少的外部调用),同时

阅读更多
利用 CrewAI 构建自主多代理系统

利用 CrewAI 构建自主多代理系统

什么是多智能体自主系统以及如何使用CrewAI和LangChain构建一个? 动机 实际上,我们对这些概念并不陌生;我们从电影中了解到它们。一个人指挥他们的AI,而AI通过使用各种工具来执行这些命令。这就是我们今天在AI系统崛起的道路上所走的方向。时代正在逐渐变化。在过去,人们无法独自完成一项任务,需要一个团队。没有团队,他们要么在一段时间后精疲力竭,要么达到能力的极限。最

阅读更多
惊人进化!用Gemini 2.0与LangGraph构建您的多工具自主代理!

惊人进化!用Gemini 2.0与LangGraph构建您的多工具自主代理!

一个实用的教程,包含完整代码示例,用于构建和运行多工具代理 大型语言模型(LLMs)非常出色——它们可以记忆大量信息,回答常识性问题,编写代码,生成故事,甚至修正你的语法。然而,它们并非没有局限性。它们会幻觉,知识截止日期可能从几个月到几年不等,并且仅限于生成文本,无法与现实世界互动。这限制了它们的实用性,尤其是在需要实时数据、来源引用或超出文本生成功能的任务中。这

阅读更多
利用多代理 RAG 构建企业人工智能应用程序!

利用多代理 RAG 构建企业人工智能应用程序!

作者: Pavan Belagatti 和 Madhukar Kumar 在快速发展的AI领域中,[多智能体检索增强生成](https://readmedium.com/how-to-build-enterprise-ai-apps

阅读更多
为结构化和非结构化数据构建图形 RAG。

为结构化和非结构化数据构建图形 RAG。

RAG 架构迄今为止是解决 LLM 缺乏上下文化的最适应和复杂的解决方案。通过 RAG,几乎不需要微调,就在很大程度上解决了使用未训练知识库的 LLM 所面临的问题。 尽管向量 RAG 可以建立上下文化,但其能力是有限的。在复杂的关系和高度互联的数据中,向量 RAG 的召回率并不令人印象深刻。其主要原因之一是构成知识库的简单向量嵌入,仅考虑几何接近性。 另一方面,图形天生结构化,以捕

阅读更多
构建面向人类的代理系统:超级智能的心理学和社会学

构建面向人类的代理系统:超级智能的心理学和社会学

Soundcloud 播客 执行摘要“权力在于将人类的思想撕成碎片,然后按照你自己选择的新形状将它们重新组合。”

阅读更多
使用 crewAI 构建多代理 LLM 系统:分步指南

使用 crewAI 构建多代理 LLM 系统:分步指南

多智能体简介使用 crewAI 的多智能体系统正在改变我们处理复杂决策的方式。通过整合多个人工智能智能体,这些系统实现了自主决策,正在革新医疗、金融和交通等行业。在本博客中,我们将深入探讨多智能体系统的世界,探索其应用、优势以及 crewAI 在这一创新技术中的角色。什么是多智能体系统?多智能体系统(MAS)由多个自主智能体组成,这些智能体相互作用

阅读更多
使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

Pydantic 是 Python 生态系统中的一股强大力量,拥有超过 2.85 亿次的月下载量,一直是 Python 项目中稳健数据验证的基石。现在,它的创造者正在进军前沿的 AI 领域,推出 Pydantic AI,这是一个旨在构建由生成式 AI 驱动的生产级应用程序的框架。在本文中,我们将深入探讨 Pydantic AI 的独特之处、其关键特性,以及它与其他

阅读更多
使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

Pydantic是Python生态系统中的一大力量,拥有超过2.85亿次的月下载量,一直是Python项目中稳健数据验证的基石。现在,它的创造者们正在前往AI的前沿领域,推出Pydantic AI,这是一个旨在构建由生成式AI驱动的生产级应用程序的框架。在本文中,我们将深入探讨Pydantic AI的独特之处、其关键特性以及与其他智能体框架的比较。 Pyd

阅读更多
使用 Autogen 0.4 构建我自己的概念验证代理

使用 Autogen 0.4 构建我自己的概念验证代理

Autogen 0.4 — 使用代理创建和执行 Python 代码 我的目标是看看我是否可以让代理团队完成我的一些工作,并且我可以将工作委托给代理。目前这只是一个实验。需要更多的工作来创建一个可在生产规模使用的稳定版本。 概述创建一个由代理执行各种任务的协调 首先创建一个可以由代理执行的 Python 脚本 然后执行脚本并存储输出 基于之前的输出创建预测

阅读更多
利用 Chrome 浏览器的设备上人工智能构建项目

利用 Chrome 浏览器的设备上人工智能构建项目

使用 Gemini-nano-in-Chrome 进行原型设计指南 在Chrome上使用实验性提示API构建具有AI功能的原型 设备端 / 边缘 AI 设备端 AI 是指直接在终端用户设备上运行的 AI 模型,例如智能手机、平板电脑或物联网设备,而不依赖于云计算或服务器来托管这些模型。 这在很多方面都很有用:由于模型在设备上,我们可以进行离线推理

阅读更多
用Google Gemini 2.0 API构建RAG!推荐系统的未来在哪里?

用Google Gemini 2.0 API构建RAG!推荐系统的未来在哪里?

LangChain与Vertex AI RAG引擎在亚马逊产品数据上的比较 谷歌在人工智能竞赛中似乎一直处于落后,但在2025年之前发布的Gemini 2.0让人感觉他们终于在某种程度上赶上了。我起初不确定会有什么期待,但在试用后,我对其能力感到由衷的印象深刻。它甚至让我怀疑像ChatGPT、Claude或Llama这样的工具是否仍然必要。**Gemini实时[

阅读更多
使用 LangGraph 构建 RAG 研究多重代理

使用 LangGraph 构建 RAG 研究多重代理

❓引言 — 天真的 RAG 与 代理 RAG 🧠 项目概述 📊 结果 🔚 结论在本文中,我们介绍了一个实用项目,使用 LangGraph 开发了一个 RAG 研究多代理 工具。该工具旨在解决需要 多个来源 和 迭代步骤 才能得出最终答案的 复杂问题。它采用 混合搜索 和 Cohere **重新排序步

阅读更多
利用 Gen AI(OpenAI API)构建智能测试自动化

利用 Gen AI(OpenAI API)构建智能测试自动化

我们都知道 UI 测试非常脆弱。它们可能因各种原因而失败,其中一个最大的问题是 UI 定位器的变化。很难想象我们如何能让它们足够智能,以理解定位器何时发生变化,并在测试中出现定位器问题之前防止测试运行。你没听错!现在是 2024 年,自动化测试工具已经取得了长足的进步。在与这些工具打交道近 18 年后,从 Mercury Winrunner 到 Playwright,我们现在可以利用

阅读更多
构建更智能的 API:CrewAI 与 FastAPI 集成指南

构建更智能的 API:CrewAI 与 FastAPI 集成指南

目录 · 1. 引言 ∘ 客户支持代理 ∘ 个人财务顾问 ∘ 医疗助手 ∘ 学习伴侣 ∘ 项目管理助手 ∘ 创意合作伙伴 ∘ 智能家居管理器 ∘ 网络安全助手· 2. 搭建基础· 3. 理解 CrewAI ∘ 1. AI 代理 ∘ 2. 工具 ∘ 3. 过程 ∘ 4. 任务· 4. 使用 CrewAI 设置 Fast API· 结论· 了解更多 1. 引言 在2025

阅读更多
打造未来:使用 LangGraph 开发自己的语音助手

打造未来:使用 LangGraph 开发自己的语音助手

今天,语音助手已经发展成为智能系统中需要先进自然语言处理的基本组成部分。本文提供了使用 LangGraph 开发语音助手的技术指南,LangGraph 是一个旨在管理复杂代理系统的编排框架。在整个文本中,我们将探讨 LangGraph 如何实现多个节点的协调,从而创建高效且高度可扩展的流程。本指南面向希望利用 LangGraph 功能在 AI 环境中实施解决方案的开发者。 什么是 L

阅读更多
打造你的专属AI API!深入浅出Spring Boot与Google Gemini的完美融合!

打造你的专属AI API!深入浅出Spring Boot与Google Gemini的完美融合!

创建一个智能网络服务,利用生成式 AI 的力量回答问题 在本教程中,我们将整合 Spring Boot 和 Spring AI/Gen AI,构建一个利用 Google’s Gemini 生成式 AI 模型的网络服务。我们的目标是创建一个简单的网络服务,能够基于生成式 AI 的能力智能地回答用户问题。借助 Gemini 的强大功能,我们可以利用尖端 AI 提

阅读更多
打造您的社交媒体内容机器:CrewAI 的方法

打造您的社交媒体内容机器:CrewAI 的方法

实施 CrewAI 的分步指南 介绍🚀 AI 协作的力量有太多可以提供的。CrewAI旨在使AI代理能够承担角色、共享目标,并在一个紧密的单位中运作——就像一个运转良好的团队。 无论您是在构建一个智能助手平台、一个自动化的客户服务团队,还是一个多代理研究团队,CrewAI为复杂的多代理交互提供了基础。 如果您想深入了解CrewAI:

阅读更多
ByteDance 发布开源唇语同步人工智能模型

ByteDance 发布开源唇语同步人工智能模型

字节跳动最近推出了 LatentSync,这是一个新的最先进的开源视频唇动同步模型。它是一个基于音频条件的潜在扩散模型的端到端唇动同步框架。 这听起来有点复杂,但它的意思是你可以上传一个人说话的视频和一个你想用来替代原始音频的音频文件。然后,AI 会覆盖新的音频,并调整说话者的唇部动作,以完美匹配上传的音频。 最

阅读更多
使用自动生成的 MCP 服务器的 C++ RESTful 网络服务与 LLM 连接

使用自动生成的 MCP 服务器的 C++ RESTful 网络服务与 LLM 连接

这是一个 5 分钟的教程,介绍如何将 MCP (Model Context Protocol) 服务器添加到您现有的 Oat++ 应用程序,以便 LLMs 可以查询您的 API。 前提条件 在开始之前,您需要一个使用 Oat

阅读更多
人工智能真的能思考吗?DeepSeek R1的惊人揭秘!

人工智能真的能思考吗?DeepSeek R1的惊人揭秘!

想象一下,一台电脑不仅仅是进行数字运算和遵循指令,而是实际上像你一样逐步“思考”事情。这就是“推理模型”的令人兴奋的承诺——一种正在改变游戏规则的新型人工智能。而引领这一潮流的是DeepSeek的R1,这是一款来自中国研究公司的强大AI,它不仅挑战了OpenAI等大牌,还让我们得以窥探其内部运作的机制。 不仅仅是计算器:推理人工智能是如何工作的 多年来,人工智能以其翻译语言、识

阅读更多
案例研究:将医生笔录转化为时态医疗记录知识图谱

案例研究:将医生笔录转化为时态医疗记录知识图谱

您是否有兴趣将医生/患者的医疗记录和记录转化为可以跨多个医疗历史、时间段和患者进行复杂查询的时间性知识图谱? 在本案例研究中,我们展示了如何将医疗记录转化为您可以依赖于 RAG 和分析目的的时间性知识图谱。我们展示了针对该系统的真实问答,以及您可以通过该系统实现的业务成果。据我们所知,这里步骤的组合是一种相对新颖的知识图谱实现。 使用的数据 出于数据隐私原因,我们使用了一个合成

阅读更多
ChatGPT 4 与 Claude 3.5 Sonnet:谁更胜一筹?让我们回顾一下

ChatGPT 4 与 Claude 3.5 Sonnet:谁更胜一筹?让我们回顾一下

我进行了测试 — ChatGPT 4 与 Claude 3 Sonnet,谁胜出? 热议中,城里出现了一个新的聊天机器人玩家,Claude 3 Sonnet。它被描述为比 ChatGPT 更好,但也有相互矛盾的评价,比如 ChatGPT 依然是王者。 注意:随着 2024 年 6 月的最新更新,Claude 3.5 Sonnet 已发布,它比 GPT-4o 和 Claude

阅读更多
ChatGPT Pro 和完整 o1 模型:您不容错过的新功能

ChatGPT Pro 和完整 o1 模型:您不容错过的新功能

OpenAI 发布了新模型和新的无限订阅计划! 最近,OpenAI 发布了以下推文,表示在接下来的12天里,每天都会添加新功能!真是一段旅程!让我们一起关注

阅读更多
ChatGPT 搜索与 Perplexity AI:哪个才是日常首选?

ChatGPT 搜索与 Perplexity AI:哪个才是日常首选?

AI 对决 嘿,AI 朋友们和关注者们。 探索 ChatGPT 搜索与 Perplexity AI 之间的差异,以实现更智能的浏览和更好的搜索体验。 我不仅仅是一个 AI 爱好者和日常用户,我相信它是未来,并将塑造我们工作、生活和使用互联网的方式。我正在使用 ChatGPT、Notion AI、一些较小的 AI 服务以及 RemNote 中的 AI 功能,当然还有 Perple

阅读更多
ChatGPT Vision 将图片转化为 1000 个字

ChatGPT Vision 将图片转化为 1000 个字

如何将这些文字转化为商业价值 我有这个想法快十年了。一切始于我搭建网站的时候,一位旅馆老板给我发了一根装满近千张照片的U盘,还有一盒35mm的照片让我扫描。这些都是惊人的照片——客人们展示他们的珍贵捕获、令人惊叹的湖景,以及向导们带领的户外冒险。我知道,如果我们能把这些照片放到网上,它们将为旅馆创造一场口碑营销的浪潮。但事情变得复杂了:每张照

阅读更多
[ChatGPT vs Claude]Cursor + Claude 3.5 如何颠覆科技行业?5 个疯狂的使用案例

[ChatGPT vs Claude]Cursor + Claude 3.5 如何颠覆科技行业?5 个疯狂的使用案例

探索 Cursor 和 Claude 3.5 如何通过自动视频编辑到以闪电般的速度构建加密货币交易界面,变革编码和设计的五种革命性方式。 Cursor 和 Claude 3.5 的强大力量:改变编码游戏的 5 个突破性用例 Cursor 和 Claude 3.5 的结合显著改变了编码领域,使开发者能够以无与伦比的速度和效率实现创新成果。这些工具在多个行业中证明了它们的颠

阅读更多
ChatGPT 的搜索功能正在改变我们查找在线信息的方式

ChatGPT 的搜索功能正在改变我们查找在线信息的方式

想象一下,向搜索引擎询问巴黎的最佳隐秘景点,它会在你说出“羊角面包”之前迅速给出一个可靠的答案。 — 欢迎来到 SearchGPT 的世界!🥐 ‎‎ 我们在线查找信息的方式正在演变,而 ChatGPT 的最新创新——SearchGPT——正在引领这一变革。 ‎‎ 这一新工具将对话式 AI 与实时互联网搜索相结合,提供了一种与传统搜索引擎截然不同的新选择,让你无需再打开

阅读更多
在 LLM 代理框架之间进行选择

在 LLM 代理框架之间进行选择

定制代码代理与主要代理框架之间的权衡 代理正在迎来一个重要时刻。随着多个新框架和新的 投资 的涌入,现代 AI 代理正在克服 [不稳定的起源](https://arxiv.org/html/2405.

阅读更多
选择合适的人工智能代理框架:LangGraph vs CrewAI vs OpenAI Swarm

选择合适的人工智能代理框架:LangGraph vs CrewAI vs OpenAI Swarm

对使用 3 种不同框架构建的相同 Agentic Finance 应用程序进行深入比较。 我们将涵盖的内容什么是代理? 深入了解我们如何定义代理,以及它们与AI管道和独立LLM的区别。 使用3个流行的代理框架构建的实践示例: LangGraph、CrewAI和OpenAI Swarm([完整代码](https://github.com/relari-a

阅读更多
选择适合您的双子座人工智能模型:从 Flash 到专业

选择适合您的双子座人工智能模型:从 Flash 到专业

原文 发布于 Premier Cloud 博客谷歌发布了多个 Gemini 模型,彻底改变了 AI 驱动工具的格局,使生成性 AI 对个人、开发者和企业而言更加可及和强大。这些模型由 DeepMind 开发,代表了生成性

阅读更多
Claude 3.5 Haiku:人类的 速度之魔 脑力大增

Claude 3.5 Haiku:人类的 速度之魔 脑力大增

在人工智能进步的无情竞赛中,Anthropic刚刚推出了一位新的竞争者。认识一下Claude 3.5 Haiku,这是他们最快AI模型的最新版本。就像他们把短跑运动员送到了脑力训练营。结果呢?一个不仅在行动上迅速,而且在某些智力领域能够超越其更强大兄弟的模型。让我们深入了解一下这个新生事物的运作原理。 速度(和智慧)的需求 Anthropic 之前的 Haiku 模型已经是他

阅读更多
Claude 3.5 Sonnet(新):利用计算机控制能力开拓人工智能的未来

Claude 3.5 Sonnet(新):利用计算机控制能力开拓人工智能的未来

Anthropic于2024年10月22日发布了最新的AI模型Claude 3.5 Sonnet。此次发布引入了革命性的计算机控制能力,并在多个基准测试中实现了显著改进,为AI行业设定了新标准。 革命性的计算机控制:新前沿 Claude 3.5 Sonnet 的突出特点是其能够像人类一样与计算机进行交互。这一突破性的能力使得 AI 可以:使用鼠标和键盘输入导航桌面界面

阅读更多
Claude 3.5 Sonnet on Amazon Bedrock:人工智能知识库的新时代

Claude 3.5 Sonnet on Amazon Bedrock:人工智能知识库的新时代

在不断发展的人工智能领域,保持领先意味着要以热情和战略眼光拥抱最新的创新。其中一个在人工智能社区引起轰动的创新是 Anthropic 的 Claude 3.5 Sonnet 模型与 Amazon Bedrock 知识库的最近整合。这不仅仅是一次例行升级——这是我们管理、检索和生成上下文准确响应的方式的重大飞跃。 但是,是什么让 Claude 3.5 Sonnet 如此开创性?为什么

阅读更多
Claude 3.5 Sonnet Unleashed:你不能错过的人工智能革命 | 作者 Ahmed Bahaa Eldin | Medium

Claude 3.5 Sonnet Unleashed:你不能错过的人工智能革命 | 作者 Ahmed Bahaa Eldin | Medium

被称为人工智能的技术领域是一个相对年轻的领域,发展速度异常迅猛,其中最新的一个例子被称为 Claude 3. 5 Sonnet. 这是科技行业中最强大的 AI 模型之一,具有这些非凡的特性和功能。我们将重点关注 [***C

阅读更多
Claude 3.5 Sonnet V/S GPT-4O:哪一个更好

Claude 3.5 Sonnet V/S GPT-4O:哪一个更好

在2022年11月,OpenAI推出了ChatGPT,这一模型彻底改变了我们搜索和与信息互动的方式。次年3月,由前OpenAI员工创办的美国初创公司“Anthropic”推出了他们自己的AI模型“Claude”。自发布以来,这两家AI公司一直在竞争,以通过其AI模型为客户提供最佳的功能和体验。最近,OpenAI推出了“GPT-4o”,这是一个令人惊叹的模型,能够出色地处理文件、语音和视频数据

阅读更多
克劳德 3.5 与 GPT-4o:您需要了解的主要区别

克劳德 3.5 与 GPT-4o:您需要了解的主要区别

Anthropic 最新发布的 Claude 3.5 Sonnet 进入了一个市场,在这个市场中,OpenAI 的 GPT-4o 已经设定了高标准,已有 92% 的财富 500 强 公司利用 Open

阅读更多
克劳德 3.5 的计算机使用功能:改变工业自动化的游戏规则

克劳德 3.5 的计算机使用功能:改变工业自动化的游戏规则

在不断发展的人工智能领域,Anthropic 的 Claude 3.5 已成为一个强大的参与者,拥有一个引起各行业关注的功能:像人类一样使用计算机。这不仅仅是人工智能的另一个渐进式改进;这是一个重大变革,承诺将重塑企业在数字时代的运营方式。 AI驱动的计算机交互的曙光 让我们直截了当:Claude 3.5的计算机使用能力并不是普通的AI技巧。我们谈论的是一种能够浏览用户界面、操纵

阅读更多
Claude与Neo4j的动态数据交互与模型上下文协议应用

Claude与Neo4j的动态数据交互与模型上下文协议应用

赋予 LLM 知识图谱的能力,使用 Anthropic 的模型上下文协议 上周,Anthropic 发布了一个新的 模型上下文协议 (MCP),使得像 Claude 这样的 LLM 能够与外部数据源进行通信。 该协议允许本地应用程序,如 Claude.ai、Zed、R

阅读更多
克劳德的新款 3.5 Sonnet 性能超过了 OpenAI 的 O1-mini。我很震惊。

克劳德的新款 3.5 Sonnet 性能超过了 OpenAI 的 O1-mini。我很震惊。

Claude更新的3.5 Sonnet模型的并排比较 当OpenAI发布GPT-4o时,我充满期待……但很快就失望了。尽管GPT-4o比GPT-4更快且成本更低,但其表现明显不如前者。如果不考虑成本,原始的GPT-4(和Claude 3.5)显然是更好的模型。 今天,Anthropic发布了更新的3.5 Sonnet模型。像Reddit这样的在线社区对此赞不绝口,解释它比之前的版

阅读更多
🔌 Cline + MCP:VS Code 的人工智能助手获得代理超能力

🔌 Cline + MCP:VS Code 的人工智能助手获得代理超能力

“嘿,Cline,你能检查一下我们在 CI 中测试失败的原因吗?”到目前为止,AI 编码助手只能分析您手动共享的代码。但通过 Cline 最新的模型上下文协议(MCP)集成,您的 AI 助手现在可以调查问题、部署修复,并管理您整个开发工作流程——这一切都可以在 VS Code 中完成。“多亏了 Claude 3.5 Sonnet 的代理编码能力,Cline 可以逐步处理复杂的软

阅读更多
Cline v3.1:Cursor 和 Windsurf 的高性价比替代品

Cline v3.1:Cursor 和 Windsurf 的高性价比替代品

如果你在寻找一种可以替代像 Cursor 或 Windsurf 这样的 AI 编码器的工具,因为它们价格昂贵且需要下载软件。 那么在这篇文章中,让我们讨论一些可能解决我们问题的东西。 我说的是…… Cline v3.1 这不仅仅是另一个工具;它是一个改变游戏规则的工具,将 Visual Studio Code (VS Code) 转变为一个完全自主的 AI 编码代理——免费!

阅读更多
Codiums Windsurf:最佳光标对手

Codiums Windsurf:最佳光标对手

你知道在代码中平衡速度、效率和创新的挑战。Codium最新发布的Windsurf彻底改变了游戏。被称为“最佳Cursor竞争者”,这个新的集成开发环境(IDE)结合了速度、智能和无与伦比的API支持。无论你是深入复杂项目还是为你的初创公司优化代码,Windsurf都承诺成为一个改变游戏规则的工具。 现在,让我们来看看为什么*W

阅读更多
用于构建多代理系统的 LangGraph、Autogen 和 Crewai 比较研究

用于构建多代理系统的 LangGraph、Autogen 和 Crewai 比较研究

随着我们进入多智能体系统(MAS)的领域,了解专门为此目的设计的各种编程语言至关重要。在本文中,我们将通过比较 LangGraph、Autogen 和 Crewai —— 该领域的三大重要参与者,深入探讨 MAS 开发的世界。 介绍 多智能体系统(MAS)在各个行业中变得越来越重要。MAS是由多个智能体组成的系统,这些智能体相互之间以及与环境进行交互,以实现特定目标。在可用于构建M

阅读更多
比较人工智能编码平台:用于关键视觉生成系统的 Cursor、V0、Bolt.new 和 Windsurf

比较人工智能编码平台:用于关键视觉生成系统的 Cursor、V0、Bolt.new 和 Windsurf

随着基础模型(如VLMs,例如Minimax、Qwen-V)和尖端图像生成技术(如Flux 1.1)的快速发展,我们正进入一个创造性可能性的新纪元。结合像T5这样的模型以增强对潜在空间中文本提示的理解,这些工具使得生产广告级别的关键视觉(KVs)成为可能,且具有显著的真实感。在我们组织中,我们测试了结合这些模型生成高质量KVs的潜力。我的任务是开发一个KV生成系统,能够复制特定风格,利用

阅读更多
比较为图像添加文本的主要文本到图像生成模型

比较为图像添加文本的主要文本到图像生成模型

九个领先图像生成模型在图像中渲染准确文本(单词和短语)的能力比较 在这篇文章中,我们将评估来自多个提供商的九个最先进的文本到图像生成模型在不同托管平台上的能力。具体来说,我们将根据给定的提示评估它们在图像中生成准确文本(单词和短语)的能力。测试的模型包括以下内容(按字母顺序排列):Adobe Firefly Image 3(通过 [firefly.adobe.com](htt

阅读更多
使用 LangGraph 和 Waii 进行复杂 SQL 连接

使用 LangGraph 和 Waii 进行复杂 SQL 连接

在快速发展的数据分析领域,通过自然语言与数据互动的能力变得愈发重要。会话式分析旨在使复杂的数据结构对没有专业技术技能的用户更易于访问。 LangGraph 是一个用于构建有状态的多代理应用程序的框架,使用语言模型。Waii 提供文本到 SQL 和文本到图表的功能,使与数据库和数据可视化的自然语言交互成为可能。 本文探讨了 Waii 的功能如何增强 LangGraph 应用于会话式分析

阅读更多
揭秘:加密货币AI交易机器人,24/7不眠不休的交易奇迹!

揭秘:加密货币AI交易机器人,24/7不眠不休的交易奇迹!

加密AI交易机器人正在彻底改变交易者在加密货币市场中的导航方式,提供无与伦比的效率。 在不断发展的加密货币世界中,走在前沿通常需要创新工具。在Cryptokeek,我们理解利用尖端技术提升您的交易体验的重要性。其中一种创新就是使用加密AI交易机器人。这些自动化程序正在改变交易者与市场互动的方式。以下是您需要了解的所有信息。 为什么考虑加密货币AI交易机器人? 首先,加密货

阅读更多
客户服务对话式人工智能:成功的最佳实践和关键步骤

客户服务对话式人工智能:成功的最佳实践和关键步骤

在当今快节奏的商业环境中,客户服务在建立和维护客户忠诚度方面发挥着至关重要的作用。随着企业努力提供个性化和高效的支持,对话式人工智能作为一种革命性解决方案应运而生。通过将人工智能(AI)集成到客户服务运营中,公司可以简化流程,提供即时响应,并显著改善整体客户体验。Gartner 的一份报告估计,到 2025 年,40% 的客户服务互动 将通过人工智能和机器学习技术实现

阅读更多
对话式商业智能:Text2SQL 的挑战与解决方案

对话式商业智能:Text2SQL 的挑战与解决方案

用自然语言查询 SQL 数据库/数据仓库的艺术 介绍 BI的未来是对话式的 — 这是Gartner和其他分析师在过去几年中告诉我们的。对话式BI在赋能业务用户自主查询数据存储(使用自然语言)方面具有巨大的潜力,无需依赖数据工程团队。随着大型语言模型(LLMs)的出现,我们似乎已经达到了一个转折点。让我们首先了解实现Text2SQL的挑战。 Text2SQL 挑战

阅读更多
Crawl4AI:释放高效网络抓取功能

Crawl4AI:释放高效网络抓取功能

在当今数据驱动的世界中,高效收集和处理信息的能力对于人工智能(AI)应用的成功至关重要。随着人工智能的不断发展,对结构化数据以训练大型语言模型(LLMs)的需求前所未有地高。 引入 Crawl4AI,一个创新的开源 Python 库,旨在简化网页爬取和数据提取,使其成为开发者和人工智能爱好者不可或缺的工具。本文将探讨 Crawl4AI 的功能、特性和使用案例,强调它如何使用户能够利

阅读更多
Crawl4AI:您的终极异步网络爬行伴侣 🕷️🤖

Crawl4AI:您的终极异步网络爬行伴侣 🕷️🤖

Crawl4AI 是一个 开源 Python 库,旨在简化网络爬虫并轻松提取网页上的有价值信息。无论您是将其集成作为 REST API,还是直接在您的 Python 项目中使用,Crawl4AI 都提供了一种 强大、灵活 和 完全异步 的解决方案,专为大型语言模型(LLMs)和人工智能应用量身定制。 介绍 Crawl4AI 旨在 **简化

阅读更多
使用 PydanticAI 创建人工智能代理 CRUD 应用程序:逐步进行

使用 PydanticAI 创建人工智能代理 CRUD 应用程序:逐步进行

很高兴再次回到 Skolo Online!在我们2025年的第一篇教程中,我们将深入探讨 PydanticAI。在本文中,我们将涵盖以下内容:如何开始使用 Pydantic AI — “你好,世界”教程 设置 PostgreSQL 数据库 更复杂的 PydanticAI 实现,其中两个代理协同工作以执行用户请求。代理 1 理解用户意图,代理 2 执行该意图。最后,我们

阅读更多
轻松打造高效研究助手!AutoGen与Panel UI结合的神奇旅程

轻松打造高效研究助手!AutoGen与Panel UI结合的神奇旅程

🎉 新年快乐,大家好!在开始之前,衷心感谢大家对我们之前故事的支持和反馈——这对我们意义重大!🙌 现在,让我们以一个有趣的项目开始新的一年。在人工智能和数据科学的世界中,打造智能和动态的代理可以为自动化研究工作流程带来重大变化。利用 AutoGen 和 Panel UI,您可以构建一个研究代理,与多个子代理协作,每个子代理都设计用于特定任务,如编码、规划或批评。✨ 让我

阅读更多
使用 GPT-4o 创建 WhatsApp 人工智能代理

使用 GPT-4o 创建 WhatsApp 人工智能代理

如何使用 Meta API 构建您自己的 LLM 驱动的 Whatsapp 聊天机器人 在人工智能和商业管理领域,AI 代理与广泛使用的通信工具的整合是一个颠覆性的变化。想象一下,您可以通过 WhatsApp 直接与您业务的管理或个人助手 AI 进行实时数据请求、更新和任务自动化,这一切都通过熟悉的聊天界面实现。 在我们关于创建 AI 驱动的业务管理器系列的第三部分中,我将引

阅读更多
CrewAI 和 Criteo API - 第 1 部分

CrewAI 和 Criteo API - 第 1 部分

介绍 本文是一个系列的第一篇,展示如何使用CrewAI和Criteo API。我们将看到如何获取凭证,使用这些凭证获取访问令牌,并使用该令牌调用端点以获取账户、零售商和品牌,所有这些都来自CrewAI团队。CrewAI 是一个 “最先进的框架,用于协调角色扮演的自主AI代理。通过促进协作智能,CrewAI使代理能够无缝协作,处理复杂任务。”***C

阅读更多
CrewAI 示例项目 - AI 技术博客

CrewAI 示例项目 - AI 技术博客

在本教程中,基于 AI 的博客写作助手为内容创作者开发,使用 CrewAI 平台。该项目的结构旨在自动提供和建议用户在创建技术博客文章时可能需要的基本和高级信息。这种方法旨在减轻内容创作者的工作负担,提高质量,并确保一致性。 目标开发一个人工智能驱动的系统,以加快用户创建技术博客文章的过程。 通过扫描谷歌上最受欢迎和最新的发展来创建博客文章。 通过提高内容质量来帮

阅读更多
CrewAI 实例教程:使用人工智能代理自动创建 YouTube 频道(第 3/4 部分)

CrewAI 实例教程:使用人工智能代理自动创建 YouTube 频道(第 3/4 部分)

在上一篇文章中,我们探讨了我们打算构建的 AI 系统的前几个元素。本文将继续介绍剩余元素的 CrewAI 代码,以实现所需的 AI 系统。请查看本教程系列的[Git

阅读更多
CrewAI:由人工智能代理组成的个人军队,为您协同工作

CrewAI:由人工智能代理组成的个人军队,为您协同工作

CrewAI框架是什么? AI协作的力量有太多值得提供的。CrewAI旨在使AI代理能够承担角色、共享目标,并以一个紧密合作的单位运作——就像一支运转良好的团队。无论您是在构建智能助手平台、自动化客户服务团队,还是多代理研究团队,CrewAI都为复杂的多代理交互提供了基础。 换句话说,CrewAI是一个代理框架,允许我们创建代理来帮助我们解决简单(优化)或复杂的任务(例如开发

阅读更多
CrewAI 的任务工具与代理工具:您必须知道的区别

CrewAI 的任务工具与代理工具:您必须知道的区别

在 CrewAI 中,工具本质上是代理可以利用的技能或功能,以执行各种操作。可以将其视为为您的 AI 代理提供一个装满专业工具的工具箱。这些工具在扩展 CrewAI 代理的能力方面至关重要,使他们能够承担广泛的任务并有效协作,例如访问互联网、查询数据库中的数据或运行 Python 代码。 CrewAI 提供了灵活性,您可以以多种方式为代理配备工具:**A) 代理

阅读更多
如何用AI简化Jira管理?揭秘定制AI Jira助手的惊艳新境界!

如何用AI简化Jira管理?揭秘定制AI Jira助手的惊艳新境界!

我如何使用 Google Mesop、Django、LangChain Agents、CO-STAR 和 Chain-of-Thought (CoT) 提示结合 Jira API 更好地自动化 Jira 这个项目的灵感来自于我为内部用户开发的一个网页应用上的 Jira 工单创建工具。我还在系统错误发生时添加了自动创建 Jira 工单的功能。 用户和系统错误通常会创建类似的工

阅读更多
使用人工智能代理进行数据探索:使用 SmolAgents 探索泰坦尼克号数据集

使用人工智能代理进行数据探索:使用 SmolAgents 探索泰坦尼克号数据集

十年前,当我开始我的机器学习之旅时,和许多人一样,我是从泰坦尼克号数据集开始的。我清晰地记得进行第一次探索性数据分析(EDA)的兴奋,发现模式和关联。快进到今天,数据分析的格局已经以我无法想象的方式演变。在这个智能AI的时代,我们现在可以将大部分的EDA委托给智能代理。问题不再是我们能否自动化EDA?而是我们能将这些能力推向多远? 简短的回答是:相当远。借助由尖端AI模型驱动的

阅读更多
深入了解 LlamaIndex 工作流程:事件驱动的 LLM 架构

深入了解 LlamaIndex 工作流程:事件驱动的 LLM 架构

实践后的进展与不足 最近,LlamaIndex 在其某个版本中引入了一个新功能,称为 Workflow,为 LLM 应用提供了事件驱动和逻辑解耦的能力。 在今天的文章中,我们将通过一个实际的迷你项目深入探讨这个功能,探索新内容和仍然不足之处。让我们

阅读更多
DeepSeek-R1-Lite-Preview:人工智能推理的新时代

DeepSeek-R1-Lite-Preview:人工智能推理的新时代

人工智能(AI)在突破界限方面并不陌生,但偶尔会出现一些创新,让我们停下脚步,仔细关注。其中一个创新就是 DeepSeek-R1-Lite-Preview,这是由中国AI实验室 DeepSeek 开发的先进推理AI模型。该模型不仅提升了推理能力的标准,还在基准测试中取得了令人印象深刻的成绩,使行业巨头如OpenAI也感受到了压力。 在本文中,我们将更深入地了解De

阅读更多
DeepSeek V3:超6710亿参数挑战ChatGPT,如何颠覆AI市场?

DeepSeek V3:超6710亿参数挑战ChatGPT,如何颠覆AI市场?

Ali Shaker- 中国初创公司DeepSeek凭借其大型语言模型DeepSeek V3在全球AI界引起了广泛关注。该模型拥有6710亿参数,声称能够与OpenAI的GPT-4、Meta的Llama 3.1和Claude 3.5 Sonnet等重量级竞争对手抗衡。更引人注目的是

阅读更多
DeepSeek V3:超越竞争对手的开源大语言模型技术解析

DeepSeek V3:超越竞争对手的开源大语言模型技术解析

优于 Claude 3.5 Sonnet、GPT-4o、Llama3.1 405B 年末将至,刚刚,中国的 DeepSeek 发布了其开源模型 DeepSeek-v3,该模型在性能上超越了所有主要竞争者,包括 Claude3.5 Sonnet、GPT-4o、Qwen2.5 Coder 等等。该模型的表现如同怪兽,显然,我们可以说 DeepSeek-V3 是迄今

阅读更多
DeepSeek-VL2:利用专家视觉语言混合模型促进多模态理解

DeepSeek-VL2:利用专家视觉语言混合模型促进多模态理解

DeepSeek-VL2 在视觉语言模型领域代表了一个重要的飞跃,提供了先进的多模态理解能力。这一创新系列的大型混合专家(MoE)视觉语言模型在其前身 DeepSeek-VL 的基础上,提供了在广泛任务中的卓越性能。让我们深入探讨 DeepSeek-VL2 的关键方面,探索其架构、能力和潜在应用。在开始之前,如果您正在寻找一个一体化的 AI 平台,可以在一个地方管理您所有的 A

阅读更多
揭开生成式人工智能代理的神秘面纱

揭开生成式人工智能代理的神秘面纱

从单一交互到复杂的多代理系统概述 在生成式人工智能代理的热潮中迷失了吗?你并不孤单。这篇文章穿透噪音,提供了对代理的清晰定义及其工作原理。我们分解了关键组件,包括“工具”的重要角色,并提供了从单次交互到复杂的多代理系统的构建和部署的实用见解。我们还探讨了多代理架构如何在企业环境中实施,并与微服务进行类比。未来的文章将深入探讨代理与运营(AgentOps)以及如何为企业规模的

阅读更多
揭开人工智能代理框架概念的神秘面纱

揭开人工智能代理框架概念的神秘面纱

在生成性人工智能领域,这一年可谓风起云涌。随着OpenAI、Google和Apple等公司继续争相构建更复杂的大型语言模型,我们看到了一种新的**“代理人工智能”**范式的兴起,期望解锁人工智能系统的自主决策功能。 代理人工智能是指能够独立操作的系统,能够根据上下文和推理进行适应和战略规划,而无需直接的人类监督。这些框架为创建这样的人工智能代理提供了基础。与依赖人类指导和干预的

阅读更多
面向真实世界应用的高级代理人工智能设计考虑因素

面向真实世界应用的高级代理人工智能设计考虑因素

从基于课堂的代理到语言链代理 随着人工智能(AI)系统的发展,代理人工智能的概念——即由模块化、特定任务的代理协作工作的AI系统——已成为可扩展和可适应AI解决方案的基石。本文探讨了代理人工智能背后的设计考虑,研究了代理、工具、记忆、状态和规划如何结合在一起创造智能工作流。我们将比较三种实现——CODE1、CODE2和CODE5——以揭示其中的实用性

阅读更多
使用开源模型构建医疗聊天机器人:通过人工智能改变医疗保健

使用开源模型构建医疗聊天机器人:通过人工智能改变医疗保健

人工智能正在改变医疗保健,聊天机器人提供快速可靠的医疗信息。随着我对生成式人工智能的了解不断加深,我希望构建一个完全100%开源的医疗聊天机器人。我的目标是让这个医疗机器人能够通过丰富的医学文献回答医疗问题。然而,我面临了一些挑战和突破,稍后将进行讨论。我采取了以下步骤来实现这个项目。 步骤 1:环境和需求设置 首先,我在我的GitHub上创建了一个新的代码库,并将其克隆到我

阅读更多
顶点人工智能 Gemini 2.0 Flash 开发人员入门指南

顶点人工智能 Gemini 2.0 Flash 开发人员入门指南

Gemini 2.0 已经到来,带来了为这个新代理时代构建的下一代能力。Gemini 2.0 Flash 现在可以通过 [Vertex AI Gemini API](https://cloud.google.

阅读更多
揭开DeepSeek-V3的神秘面纱:如何以超低成本提升大语言模型的推理效率?!

揭开DeepSeek-V3的神秘面纱:如何以超低成本提升大语言模型的推理效率?!

介绍 DeepSeek-V3 已成为开源爱好者和企业用户的新重磅产品。该模型由一家中国的人工智能研究公司开发,致力于“开源精神 + 长期主义以实现包容性AGI”,旨在缩小封闭源巨头(如 GPT-4o 和 Claude-Sonnet-3.5\)与开源社区之间的差距。 DeepSeek-V3 采用 Mixture-of-Experts (MoE) 设

阅读更多
使用 Google 双子座 2.0 轻松进行网络抓取

使用 Google 双子座 2.0 轻松进行网络抓取

网页抓取从未如此简单,这都要感谢谷歌开创性的多模态实时 API——Gemini 2.0\。 使用这个工具,您可以轻松地从任何网页中提取数据,无论是复杂的、非结构化的,还是某些非常特定的数据。 今天,我将逐步带您体验我自己尝试过的实际示例,这样您就会确切知道该怎么做。 即使您是完全的初学者,您也会在短时间内感觉像个专业人士。 让我们开始吧! 入门:设置 Google AI

阅读更多
ElevenLabs 对话式人工智能:在几分钟内构建智能、可扩展的语音代理

ElevenLabs 对话式人工智能:在几分钟内构建智能、可扩展的语音代理

你好,创作者们! 🗣️ 我们与技术的互动方式正在改变,对话式 AI 正处于这场革命的最前沿。ElevenLabs 推出了一个尖端平台,使构建 AI 驱动的语音代理 比以往任何时候都更快、更简单。无论是用于客户支持、虚拟助手还是其他任何用例,ElevenLabs 让您可以专注于创造力,同时处理技术上的繁重工作。 让我

阅读更多
未来工程:数据、软件和人工智能的共同点

未来工程:数据、软件和人工智能的共同点

识别跨学科共性不仅增强招聘策略,还支持灵活的IT架构。 我注意到IT部门中存在过度专业化的趋势。然而,多年来我学到的一个重要教训是这种孤立专业化的负面影响。 虽然这主要是一个组织问题,但对供应商专业平台产品的盲目追求也[导致了我们企

阅读更多
颠覆AI代理!如何借助Browser Use 实现网络互动的全新突破

颠覆AI代理!如何借助Browser Use 实现网络互动的全新突破

赋能AI代理无缝导航和与网站互动 🖥️🔗🤝在快速发展的人工智能领域,使AI代理能够像人类一样与网络互动是一项重要的进展。 Browser Use 是一个旨在促进这种互动的Python库,使AI代理能够自主导航网站、提取信息和执行任务。 浏览器使用的关键特性 🌟🔧📋视觉和HTML提取:使AI代理能够解释和提取网页中的信息,包括视觉内容和

阅读更多
企业就绪的 Java 和 Spring Boot 人工智能代理:综合指南

企业就绪的 Java 和 Spring Boot 人工智能代理:综合指南

最新一波 AI 代理——包括 Auto-GPT、BabyAGI、AgentGPT、Jarvis (HuggingGPT) 以及 LangChain 等框架——展现了在规模化自动化和决策制定方面的巨大潜力。然而,这些解决方案大多以 Python 为中心,使得企业 Java 开发者渴望寻找同样 强大、可扩展 和 实时 能力的代理。本文详细介绍了如何将基

阅读更多
本地探索 Swarm 多智能体框架

本地探索 Swarm 多智能体框架

Swarm 是一个实验性样本框架,用于模拟轻量级多智能体框架,旨在教育目的。通常它与 Open AI Key 一起使用,但我们可以更改为使用本地的 Ol

阅读更多
探索 DeepSeek 工件:革新前端代码生成

探索 DeepSeek 工件:革新前端代码生成

人工智能领域充满了创新,其中一个突出的工具是 DeepSeek V3。因其在 LLM 排行榜上名列前茅而闻名,这个开放权重模型在 AI 社区中因其价格实惠和卓越表现而获得了显著关注。虽然 DeepSeek V3 备受赞誉,但它的兄弟

阅读更多
探索 DeepSeek 第 3 版:技术概览

探索 DeepSeek 第 3 版:技术概览

DeepSeek 版本 3 的发布在 AI 社区引发了相当大的兴奋,得益于其卓越的能力和成本效益。作为一个在中国开发的先进开放权重大型语言模型 (LLM),它利用专家混合 (MoE) 架构来优化性能,在处理过程中仅激活其 6710 亿参数中的 370 亿。多头潜在注意力 (MLA)、FP8 混合精度和多令牌预测等创新进一步提升了其效率和有效性。DeepSeek V3 在 MMLU-Pro、M

阅读更多
探索类比数据配色方案的人工智能生成建议

探索类比数据配色方案的人工智能生成建议

类比色彩和谐是指在色轮上相邻的至少三种颜色。这种色彩方案可以创造出令人愉悦的色彩组合,但在应用于数据可视化时,可能会面临色盲测试不合格的风险。生成式AI能否通过提供通过色彩缺陷测试的类比建议来帮助数据色彩方案设计?在这里,我将探讨这个问题。让我们首先更详细地回顾一下类比色彩和谐、色彩缺陷以及生成式AI系统的概念。 类比色彩和谐: 色彩和谐是选择在色轮上能很好地配合在一起的颜色

阅读更多
探索 GitHub Copilot 工作区:改变开发游戏规则的早期见解

探索 GitHub Copilot 工作区:改变开发游戏规则的早期见解

(免责声明:本文撰写于 GitHub Copilot Workspace 成为主流之前。发布时,Copilot Workspace 处于技术预览阶段,已上线大约三周。) 当 GitHub 在 2024 年 10 月的 GitHub Universe 事件中宣布 “GitHub Copilot Workspace” 时,我不禁将其视为改善 IDE 中开发者体验的下一步

阅读更多
使用人工智能提取和分析您的 Chrome 浏览器历史记录

使用人工智能提取和分析您的 Chrome 浏览器历史记录

有没有想过您的浏览历史对您说了什么?无论您是想了解自己的在线习惯,反思自己的工作效率,还是需要记录自己的活动,分析浏览历史都能提供有价值的见解。在本文中,我们将探讨如何提取您的 Chrome 浏览历史,并利用 AI 进行聚类和分析。我们将介绍一种无代码的方法以及一种更技术性的方式,适合那些熟悉命令行的用户。 为什么浏览历史? 在之前的帖子中,我讨论了使用 Logseq 或 Obsi

阅读更多
使用 Gemini 2.0 提取任何文档 | 使用 ExtractThinker 提取文档智能

使用 Gemini 2.0 提取任何文档 | 使用 ExtractThinker 提取文档智能

在本文中,我们将探讨 Google 的 Gemini 2.0 模型如何与 [ExtractThinker](https://github.com/enoch3712/ExtractThinker

阅读更多
微调 Llama-3 LLM 并将其部署为 CloudFlare 上的无服务器 API

微调 Llama-3 LLM 并将其部署为 CloudFlare 上的无服务器 API

两年前,我(像许多数据科学家一样)对构建网站一无所知。 我擅长构建机器学习模型,但完全不知道如何将这些模型实际部署到像 mywebsite.com 这样的域名上。机器学习工程师负责这个,对吧? 错了! 如果你想在竞争激烈的就业市场中脱颖而出,拥有公开可见的代码是展示你技能的绝佳方式。 在这篇文章中,我将向你展示我是如何构建一个基于 Llama 3 的聊天机器人,并通过 Cloud

阅读更多
利用模态微调 LLaMA-3 实现文本到 SQL 的生成:综合指南

利用模态微调 LLaMA-3 实现文本到 SQL 的生成:综合指南

微调大型语言模型(LLMs)传统上是一项复杂的工作,需要大量的基础设施设置和管理。然而,借助Modal的云平台和Axolotl的微调框架,您现在可以直接从本地机器对强大的模型如LLaMA-3进行微调,而无需处理基础设施的复杂性。 在本指南中,我们将通过使用Modal的远程GPU功能和Axolotl的先进训练优化,逐步演示如何对LLaMA-3 8B进行SQL查询生成的微调。 ![](htt

阅读更多
使用 Unsloth 对 LLama 3 进行微调

使用 Unsloth 对 LLama 3 进行微调

在本文中,我将向您展示如何使用 Unsloth 微调 LLM(Meta 的 Llama 3)。我还将提供使用您自己自定义数据集的方法。 注意: Unsloth 是一个加速 LLM 在 NVIDIA GPU 上微调的库(与传统方法相比,内存使用减少 40%)。与 Hugging Face 兼容,支持 Ll

阅读更多
从知识到行动:为什么特定领域的法律硕士需要代理人工智能?

从知识到行动:为什么特定领域的法律硕士需要代理人工智能?

在人工智能不断发展的领域中,有两股强大的力量正在塑造未来:领域特定的大型语言模型 (LLMs) 和 自主 AI。虽然它们各自带来了显著的能力,但当它们协同工作时,其真正潜力得以释放。这种协同作用将 AI 从一个被动的知识库转变为一个能够做出明智决策和采取自主行动的积极问题解决者。 在本文中,我们将探讨为什么单靠领域特定的 LLM 是不够的,并探讨将其与自主 AI 结合如

阅读更多
从 LangChain 到 LangGraph:让多模型药物机器人具有个性化和可教性

从 LangChain 到 LangGraph:让多模型药物机器人具有个性化和可教性

为人机协作聊天机器人添加记忆和学习能力 药物试验测试新药物在人类中的安全性、有效性和疗效。这些关键研究对于开发和批准拯救生命的疗法至关重要。虽然药物试验为无数患有严重疾病的患者带来了希望,但许多人仍然不知道自己是否符合条件或潜在的好处。一个用户友好的药物试验信息系统可以弥补这一差距。它应该包含一个具有权威信息的数据库和一个易于使用的前端,患者可以通过它在复杂的临床研究世界中导航

阅读更多
从帖子到报告:利用 LLM 进行社交媒体数据挖掘

从帖子到报告:利用 LLM 进行社交媒体数据挖掘

如何指导LLMs过滤餐厅帖子并提取对业务增长至关重要的见解。 应用概述 我们正处于自动化的黄金时代,这得益于大型语言模型(LLMs)的崛起。从改变行业到解锁无尽的应用,LLMs彻底改变了我们与数据的互动方式,主要通过自然语言。 在本文中,我将向您展示如何指示LLM穿透社交媒体的噪音,提取最重要的信息。具体来说,我们将深入探讨如何挖掘Instagram上的餐厅帖子,以

阅读更多
从处方到语音:帮助服务老年人和视障人士的 Python 解决方案...

从处方到语音:帮助服务老年人和视障人士的 Python 解决方案...

学习如何构建一个结合OCR、计算机视觉和谷歌文本转语音的Fast API后端解决方案,以读取处方标签 在正常情况下,阅读处方药物上的标签不应该是一个具有挑战性的任务。通常,最重要的指示——剂量,通常会以粗体字打印,如:“每天需要时服用1.5片,分3次服用”另一方面,考虑到视觉障碍和/或老年患者的异常情况。他无法在没有帮助的情况下阅读他的处方标签。 作为

阅读更多
从零到英雄:使用 LangGraph 快速构建智能聊天机器人

从零到英雄:使用 LangGraph 快速构建智能聊天机器人

在这个全面的快速入门指南中,我们将使用 LangGraph 构建一个支持聊天机器人,它可以:通过搜索网络回答常见问题 在调用之间保持对话状态 将复杂查询路由到人工进行审查 使用自定义状态来控制其行为 回溯并探索替代对话路径我们将从一个基本的聊天机器人开始,逐步添加更复杂的功能,同时介绍关键的 LangGraph 概念。

阅读更多
全新 Gemini 1.5 FLASH 型号:绝对的 Google 游戏规则改变者

全新 Gemini 1.5 FLASH 型号:绝对的 Google 游戏规则改变者

他们的新 Gemini 1.5 Flash 模型远远超过了 GPT-4o,其能力令人难以置信。 闪电般快速。 比 GPT-4o 便宜 33 倍,但上下文容量大 700% — 100 万个令牌。 在现实世界中,100 万个令牌是什么概念?大约:超过 1 小时的视频 超过 30,000 行代码 超过 700,000 个单词![](https://i

阅读更多
Gemini 2.0 Flash + 本地多模式 RAG + 上下文感知 Python 项目:文档的简易人工智能/聊天

Gemini 2.0 Flash + 本地多模式 RAG + 上下文感知 Python 项目:文档的简易人工智能/聊天

在这个视频中,我将展示一个超级快速的教程,教你如何创建一个本地多模态 RAG、Gemini 2.0 Flash 和上下文感知响应,以便为你的业务或个人使用打造一个强大的代理聊天机器人——一个不需要强大笔记本电脑的聊天机器人。 年末时,大模型产品之间的竞争再次加剧。在我上一个视频中,我介绍了 LLama3.3\。 在12月11日,谷歌发布了 **Gemini 2.0 Flash。

阅读更多
Gemma、Llama 和 Mistral:探索较小的 AI 模型

Gemma、Llama 和 Mistral:探索较小的 AI 模型

小规模语言模型的比较研究:在阅读理解任务中评估 Gemma、Llama 3 和 Mistral 引言 大型语言模型(LLMs)正在快速发展。每个月,新的模型被开发出来,以超越当前市场上的顶尖模型。这种健康的竞争有利于创造新的方法,提高质量和速度。此外,各公司还专注于开发更小的模型,以便使其能够被没有强大计算资源的个人或组织所使用。 就在几周前,苹果公司在其全球开发者大会上推出

阅读更多
GenAI Studio:构建、管理和分析用于 POC 和生产的生成式人工智能用例

GenAI Studio:构建、管理和分析用于 POC 和生产的生成式人工智能用例

您构建和管理生成式 AI 解决方案的中心 什么让 Gen AI Studio 令人兴奋? 生成式 AI 正在重新塑造我们对问题解决、创造力和效率的思考。然而,构建 AI 解决方案可能会因为技术复杂性而让人感到畏惧。Gen AI Studio 弥补了这一差距——让您能够创建、完善和分析 AI 用例,而不必被编码的复杂性所困扰。 **Gen AI Studio 的主要

阅读更多
使用 GPT Vision 和 Langchain 从图像生成结构化数据

使用 GPT Vision 和 Langchain 从图像生成结构化数据

在当今这个视觉数据丰富的世界中,从图像中提取有意义信息的能力变得越来越重要。Langchain是一个强大的框架,用于构建大型语言模型(LLMs)应用程序,提供了一套多功能的工具来应对这一挑战。在本文中,我们将探讨如何使用Langchain从图像中提取结构化信息,例如计算人数和列出主要物体。 在深入代码之前,让我们先了解一下任务的背景。想象一下你有一张场景的图像,比如城市街道。你的目标是

阅读更多
生成式人工智能在市场研究和情报领域的应用:优势、用例和策略

生成式人工智能在市场研究和情报领域的应用:优势、用例和策略

利用AI转变市场情报 生成式AI正在改变企业进行市场研究和情报的方式,使数据分析变得更快、更深入。传统的市场研究方法高度依赖手动数据收集、调查分析和竞争对手研究,这些方法往往耗时且范围有限。生成式AI则允许公司即时分析庞大的数据集,生成可能被忽视的洞察,并创建帮助更准确预测趋势的预测模型。从综合数据报告到创建高层次摘要,生成式AI加速了决策过程,使市场洞察更加易于获取。 除了

阅读更多
生成式人工智能用户体验--为企业开发创新使用案例

生成式人工智能用户体验--为企业开发创新使用案例

实用设计创新 一个用于设计创新且合适的企业生成式AI体验的框架 为了创建用户会采用和使用的创新生成式AI体验,我们需要确保这些体验能够提供适当的响应。为此,这些体验需要接受如何运作的业务培训,如何进行评估,公司的目标、流程和过程,如何在不同情境中讨论公司,以及如何将活动如计划和项目相互关联。 消费者使用场景往往简单且专注于满足个人需求。复制简历美化体验并不能帮助企业

阅读更多
生成式人工智能与社交媒体

生成式人工智能与社交媒体

不明显的出路 在我们新的人工智能世界中,最大的恐惧之一是我们会失去人性。社交媒体将完全失去社交的方面。我想这会使其变成“媒体”。 主要的担忧是,人工智能将生成社交媒体帖子,然后其他人会使用人工智能进行回复。这将创造一种垃圾内容循环,慢慢将真实的人类推开。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com

阅读更多
让 ChatGPT 听起来更有人情味:创建自然、引人入胜的人工智能对话的基本技巧

让 ChatGPT 听起来更有人情味:创建自然、引人入胜的人工智能对话的基本技巧

你是否发现你的 AI 助手听起来有点过于……机械?虽然 ChatGPT 的能力令人印象深刻,但有时它的语言过于正式或通用。但通过一些调整,你可以引导 ChatGPT 给出更人性化、对话式和易于共鸣的回应。 以下是一个实用指南,帮助 ChatGPT 听起来不那么像机器人,而更像一个博学的朋友。 1. 限制过度使用的词汇和短语 某些词汇和短语在AI生成的文本中经常出现,因为它们

阅读更多
GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

如何设置 GLM-4-Voice 9B 以实现无缝的实时语音交互,支持英语和中文,并探索其独特的架构、低延迟响应和可定制的声音属性。 介绍 近年来,语音启用的人工智能取得了显著进展,使对话代理能够更好地理解和响应人类语言。从虚拟助手到客户服务机器人,语音人工智能已成为各个行业的重要工具。然而,大多数模型在流利地切换语言、理解口语查询的细微差别以及提供高质量响应方面仍然

阅读更多
Google Chrome AI转型大揭秘:你的上网体验将惊艳升级吗?

Google Chrome AI转型大揭秘:你的上网体验将惊艳升级吗?

1. Chrome中的Google Lens - 将词汇添加到您的Google Lens搜索中- 在不离开标签页的情况下选择、搜索和询问网络上的任何内容。

阅读更多
Google Gemini:大上下文窗口是杀手级功能吗?

Google Gemini:大上下文窗口是杀手级功能吗?

谷歌即将推出的 LLM 迈出了重大一步 就在八个月前,一封泄露的谷歌电子邮件透露该公司在努力超越其 AI 竞争对手方面遇到了困难。他们的 AI 产品周围不仅没有护城河——换句话说,没有建立起商业优势——谷歌也没有[秘密武器](https://ww

阅读更多
Google Gemini-Exp-1206:新的最佳法律硕士

Google Gemini-Exp-1206:新的最佳法律硕士

Beats GPT-4.0, OpenAI-o1, Claude3.5 Sonnet and Gemini 1.5 on LMArena 谷歌的 Gemini 在几个月前在生成式 AI 领域的首次亮相表现平平,但如今其发展速度相当快。现在,它发布了一个新的实验模型 Gemini-1206-Exp,该模型在 ChatArena 排行榜上超越了所有其他模型,从而在生成

阅读更多
Google 发布 Gemma — 轻量级开源模型

Google 发布 Gemma — 轻量级开源模型

在短短一周内,世界见证了两家科技巨头带来的最具突破性的AI进展。OpenAI推出了令人惊叹的AI视频生成器Sora,而谷歌则揭晓了其[Gemini 1.5模型](https://generativeai.pub/google-releases-gemini-1-5-with-1m-context-window-

阅读更多
揭秘Google Video Analyzer:如何用AI技术实现视频内容的高效分析!

揭秘Google Video Analyzer:如何用AI技术实现视频内容的高效分析!

人工智能工具的进步正以惊人的速度发展,而Google AI Studio的Video Analyzer正是这一创新的证明。如果你对视频分析感兴趣,这个工具及其基础框架是探索人工智能在处理和理解视频内容方面能力的绝佳方式。我在我之前的[文章](https://readmedium.com/googles-new-model-gemini-2-0-gemini-2-0-beats-claude-

阅读更多
Goover - 一种挑战人工智能复杂性的新搜索引擎

Goover - 一种挑战人工智能复杂性的新搜索引擎

在 2024 年,搜索引擎市场经历了一次重大变革。谷歌搜索作为最大和最受欢迎的搜索引擎,在推出其新的 AI 驱动概览功能后,面临了一波批评,许多用户认为该功能匆忙上线且不够完善。 与此同时,AI 驱动的搜索引擎 Perplexity AI 快速获得了人气,因其备受赞誉的功能而积累了忠实用户群。最近,甚至 OpenAI 也通过在 ChatGPT 中整合新的搜索功能加入了搜索领域。 随着越来

阅读更多
GPT-4o Python 疯狂制图:即时数据可视化提示

GPT-4o Python 疯狂制图:即时数据可视化提示

来自联合国人口预测数据集的无代码可视化实操 GPT-4o 的自动数据可视化生成工具越来越先进。 您可以上传多个 CSV(和 XSLX)文件,并要求 GPT-4o 查看它们并为您提供文件中的结构和数据值列表。 然后,您可以提示这个 LLM 创建 Python 代码来清理数据,并提供图表和地图的数据可视化。 这非常有用。让我来给您演示一下它是如何工

阅读更多
GPT 4o- with Canvas:让我们创建一个金融流应用程序!

GPT 4o- with Canvas:让我们创建一个金融流应用程序!

使用 GPT-4o 和 Canvas 以及 Streamlit 创建金融应用 ChatGPT 今年发布了多个模型,因此有很多可以探索和利用的内容。 在本文中,我们将探索 GPT 4o 和 Canvas 模型,并构建一个预测股票价格的 Streamlit 应用。听起来很有趣,对吧?我也很兴奋,因为我在写作过程中也会尝试,所以让我们一起探索吧。 GPT 4o- wit

阅读更多
实践:使用 LangGraph 构建代理工作流(Langchain-academy 的主要学习内容) | 第 1 部分

实践:使用 LangGraph 构建代理工作流(Langchain-academy 的主要学习内容) | 第 1 部分

介绍 Langchain 最近推出了一门令人印象深刻的课程,专注于 LangGraph 及其在开发强大的代理和多代理工作流中的关键特性。 在本系列中,我们将探索课程中的基本见解,并创建利用代理工作流的应用程序。在第一部分中,我们将涵盖 LangGraph 的基本概

阅读更多
构建 Agentic RAG(检索-增强生成)管道的实践演示

构建 Agentic RAG(检索-增强生成)管道的实践演示

插图展示了自主代理如何参与 RAG 系统,以检索最相关的信息片段。 什么是Agentic RAG? 我们都知道什么是检索增强生成(Retrieval Augmented Generation,RAG)。但让我们快速回顾一下。检索增强生成是一种强大且流行的管道,通过从大型语言模型中增强响应来提升其表现。它通过将从向量数据库中检索到的相关数据作为上下文添加到提示中,并将其发送给LLM进

阅读更多
代理混合搜索如何创建更智能的 RAG 应用程序

代理混合搜索如何创建更智能的 RAG 应用程序

By Ryan Michael 如果您正在构建一个 [retrieval-augmented generation (RAG)](https://www.datastax.com/guides/what-is-retrieval-augmented-generation?utm

阅读更多
Agentic RAG 如何解决当前 RAG 限制的问题

Agentic RAG 如何解决当前 RAG 限制的问题

在本卷咖啡休息概念的第 4 期中,我们将了解 AgenticRAG 如何帮助解决传统 RAG 的限制。 RAG框架 RAG(检索增强生成)框架按特定顺序操作: 文档 -> 片段 -> 向量数据库 -> 片段检索(前K个) -> LLM 然而,这一顺序在处理某些类型的查询时会遇到障碍。 问题 1:摘要 考虑一个查询,比如“总结文档”。传统

阅读更多
人工智能代理如何帮助简化工作流程自动化?

人工智能代理如何帮助简化工作流程自动化?

在当今快速变化的商业环境中,组织必须高效运作以保持竞争力。实现这种效率的一个关键是自动化。然而,自动化已经超越了简单的任务调度和数据输入,特别是在AI代理进入自动化领域之后。这些智能系统不仅增强了传统的自动化过程,还彻底改变了企业对工作流程管理的方式。 在这篇博客中,我们将探讨AI代理如何简化工作流程自动化,它们为何成为游戏规则的改变者,以及企业如何利用它们推动创新和提高运营效率。

阅读更多
DeepSeek-R1-Lite 预览版的推理能力如何?

DeepSeek-R1-Lite 预览版的推理能力如何?

DeepSeek-R1-Lite-Preview (R1LP) 是中国公司 DeepSeek 最近发布的一款 LRM(大型推理模型)。根据该模型的 发布说明,R1LP 在多个数学和推

阅读更多
我如何使用 ElevenLabs、Make.com 和 Twilio 快速构建客户支持语音机器人

我如何使用 ElevenLabs、Make.com 和 Twilio 快速构建客户支持语音机器人

作为一个自称的代码爱好者,我通常习惯于以传统方式构建项目——编写代码行,以便让我拥有完全的控制权和灵活性。从零开始解决问题带来了一种特殊的满足感。但偶尔,我会遇到一些工具,让我停下来重新思考我的方法。 最近,我测试了 ElevenLabs 的 AI agent feature,我必须承认——它让我印象深刻。在短短几个小时内,我能够创建一个能够 自动安排会议 和

阅读更多
如何用Pydantic AI与Google Gemini构建强大的SWOT分析代理?惊人架构揭秘!

如何用Pydantic AI与Google Gemini构建强大的SWOT分析代理?惊人架构揭秘!

在当今快节奏的世界中,快速收集和综合信息变得至关重要。我构建了一个 AI 代理,以现代技术栈提供战略洞察。本文将带您了解这一过程,突出技术和设计选择,并演示您如何在 Google Cloud 上构建它。 一个 AI 代理 是一种能够感知其环

阅读更多
我如何利用 ChromaDB 和 Chainlit 构建基于 Graph-RAG 系统的 LLM 应用程序

我如何利用 ChromaDB 和 Chainlit 构建基于 Graph-RAG 系统的 LLM 应用程序

一个端到端的应用,带有 GUI,并且仅用 3 个脚本将新知识存储在向量数据库中 大型语言模型(LLMs)和知识图谱是处理自然语言的宝贵工具。检索增强生成(RAG)作为一种强大的方法,能够通过上下文知识增强 LLM 的响应。上下文知识通常嵌入并存储在向量数据库中,用于创建上下文以增强提示。然而,这种方式下,知识被映射在一个概念空间中,但并没有真正组织起来。知识图谱捕捉了领域内数据点或实体

阅读更多
我如何为制药业打造更智能的人工智能工具:从生成式人工智能到代理式人工智能

我如何为制药业打造更智能的人工智能工具:从生成式人工智能到代理式人工智能

当我首次开始为制药行业开发AI工具时,我的想法很简单:解决现实中的日常挑战。我花了多年时间观察合规团队在文书工作中挣扎,医学写作人员努力向患者传达复杂信息,以及无数人在医疗旅程中迷失。生成式AI似乎是答案——在许多方面,它确实是。但随着我们看到这些工具的部署,我开始意识到它们的局限性。它们确实强大,但却是被动的——总是等待下一个命令,下一个提示。这个认识促使我探索自主AI

阅读更多
我如何使用 Figma 的新人工智能在 48 小时内设计并构建一个可运行的移动应用程序

我如何使用 Figma 的新人工智能在 48 小时内设计并构建一个可运行的移动应用程序

本周,我挑战自己尽可能多地使用 Figma 的新 AI 功能来完成我的产品设计和开发过程——从用户研究和分析到生成我的 UI 设计,原型制作,然后将所有内容转化为一个真实的工作应用——我尝试在 仅仅 48 小时 内完成这一切。以下是发生的事情…… 问题 上周,我和我的会计见面,他指出我记账的方式并不是“最佳的”。我心想:“我希望有一种简单的方法来查看我的资金流入,并将其

阅读更多
我如何利用人工智能在几秒钟内从任何网站提取信息

我如何利用人工智能在几秒钟内从任何网站提取信息

使用 Langchain、OpenAI、Bright Data 和 NextJS 构建一个免费的 AI 工具,用于抓取、提取和分析数据。 “有用”的数据是任何成功企业进行明智决策和战略规划的基础。然而,真正的挑战不仅仅在于抓取数据——而在于从收集到的数据中提取有价值的信息。这一步通常需要大量的时间和精力,成为了过程中的瓶颈。 在本文中,您将学习如何构建一个不仅能提取网页数据,

阅读更多
我如何修复提示,让人工智能每次都能做出无懈可击的回应

我如何修复提示,让人工智能每次都能做出无懈可击的回应

当ChatGPT首次推出时,几乎每个行业和职业的提示模板都涌入了互联网。你可能见过类似“最佳[N] ChatGPT提示用于[行业/职业]”的帖子。 这些帖子帮助许多人接触到AI工具,使得提问和获得答案变得简单。然而,现在我们中的大多数人已经掌握了这一点,并希望进一步推进。简单的提示会导致简单的结果,因此我们开始撰写更详细和复杂的提示。 然而,这也带来了挑战:有时,“AI”根本

阅读更多
我如何用 ChatGPT 在不到 3 小时内写完一整本书?

我如何用 ChatGPT 在不到 3 小时内写完一整本书?

解密人工智能热潮 我叫亚历克斯,我只是一个在金融科技(Fintech)领域工作的小伙子,这个行业不可避免地让你对一切充满好奇,尤其是新趋势。我无法摆脱人工智能的热潮,或者说,我无法不去观察人们对它的疯狂反应。 “人工智能会抢走你的工作!”,“这就是结束!”,“到2024年,你将不再见到医生。机器将为你诊断和治疗!”,“我如何利用ChatGPT创建了一家全新的公司!”,最后,“我

阅读更多
Jupyter Agent 让我大开眼界。你未曾预见的人工智能革命。| 作者:Savvas Theocharous | 2024年12月 | 人工智能的进步

Jupyter Agent 让我大开眼界。你未曾预见的人工智能革命。| 作者:Savvas Theocharous | 2024年12月 | 人工智能的进步

易于获取,但难以置信。一旦你亲自体验过,你就会明白我在说什么! 我想我们都听说过 AI Agents。它正在进入主流,并且已经成为一个新兴的流行词。不过,我向你保证,在我自己尝试过 Jupyter Agent 之后,它的能力绝对不容小觑。 什么是 Jupyter Agent? [Jupyter Agent](https://huggingface.co/spaces/da

阅读更多
AI智能代理:如何让团队合作更高效?探索多智能体系统的奇妙之旅!

AI智能代理:如何让团队合作更高效?探索多智能体系统的奇妙之旅!

注意:本文适用于正在构建数字产品的产品经理、产品设计师和工程师,特别是在AI领域,目标是构建多AI代理系统,以优化产品和业务的价值,同时通过AI对话解决复杂的用户问题。 当你查看界面时,构建AI对话似乎很简单,包括AI与用户之间的双向互动,以及供用户提问的输入占位符。但在这背后,对于产品开发团队来说,这是一个巨大的挑战。发现用户期望、改进并不断迭代,以便每天更清晰地提供价值,需要许多步

阅读更多
英伟达™(NVIDIA®)如何修剪和提炼 Llama 3.1 以创建 Minitron 4B 和 8B

英伟达™(NVIDIA®)如何修剪和提炼 Llama 3.1 以创建 Minitron 4B 和 8B

新模型采用了最先进的剪枝和蒸馏技术。我最近开始了一份专注于人工智能的教育通讯,目前已有超过170,000名订阅者。TheSequence是一份不做作(意味着没有炒作,没有新闻等)的机器学习导向通讯,阅读时间为5分钟。目标是让您及时了解机器学习项目、研究论文和概念。请通过下面的链接订阅试试:我们常常被大型语言模型(LLMs)特别是那些参数数量庞大的模型的进展所震撼。然

阅读更多
打造你的智能Bluesky机器人!利用Langflow、TypeScript和Node.js畅游新世界!

打造你的智能Bluesky机器人!利用Langflow、TypeScript和Node.js畅游新世界!

作者 Phil Nash Bluesky 是一个建立在 AT Protocol 上的社交网络:一种开放的、去中心化的构建社交应用程序的方式。AT Protocol

阅读更多
如何利用实时事件处理打造主动式代理

如何利用实时事件处理打造主动式代理

发现如何将流媒体数据库与大型语言模型结合起来,创建在您甚至未询问之前就能采取行动的智能代理。 由大型语言模型(LLMs)驱动的问答代理,如ChatGPT,已经成为我们日常生活中不可或缺的一部分,帮助我们解决各种问题——无论是编写代码、撰写论文还是回复电子邮件。但是,所有这些“神奇”的能力都有一个关键要求:我们必须向LLM提供高质量、精确描述的问题。 那么,是否有可能创建一个能

阅读更多
如何利用交互式画布构建实时双子座 2.0 学习助手

如何利用交互式画布构建实时双子座 2.0 学习助手

Gemini 开发教程 V5 在本教程中,我们将继续使用 Gemini 2.0 及其多模态 Live API 构建迷人的实时聊天应用程序。这次我们将基于绘图画布构建一个具有实时语音和文本交互的学习助手。 您可能已经看过 OpenAI 的旧视频 https://youtu.be/_nSmkyDNulk,演示了 got-4o 如何通过提出引导性问题和提供提示来帮助学生在 Kh

阅读更多
如何使用 CrewAI 和 Langchain 构建代理 RAG

如何使用 CrewAI 和 Langchain 构建代理 RAG

在快速发展的 AI 领域,提供准确、上下文感知的用户查询响应能力是一个游戏改变者。检索增强生成(RAG)作为一种强大的范式,结合了从外部来源检索相关信息与大型语言模型(LLMs)的生成能力。然而,随着查询变得越来越复杂和多样化,静态 RAG 设置可能并不总是足够。这就是 Agentic RAG 发挥作用的地方。 Agentic RAG 引入了一个智能的模块化框架,其中专门的代理协同

阅读更多
如何使用 LangGraph 构建人工智能代理:分步指南

如何使用 LangGraph 构建人工智能代理:分步指南

介绍 在人工智能的世界中,检索增强生成(RAG)系统已成为处理简单查询和生成上下文相关响应的常用工具。然而,随着对更复杂的人工智能应用需求的增长,出现了超越这些检索能力的系统的需求。AI代理应运而生——这些自主实体能够执行复杂的多步骤任务,在交互中保持状态,并动态适应新信息。LangGraph,作为LangChain库的强大扩展,旨在帮助开发人员构建这些先进的AI代理,通过启

阅读更多
如何使用 LangChain 和 CrewAI 构建人工智能驱动的 SQL 数据分析代理

如何使用 LangChain 和 CrewAI 构建人工智能驱动的 SQL 数据分析代理

在当今数据驱动的世界中,自动化数据提取、分析和报告的工作流程对于节省时间和提高效率至关重要。本教程将指导您使用 LangChain 和 CrewAI 构建一个 AI 驱动的 SQL 工作流程。通过集成强大的 Llama 3 模型、SQL 数据库工具和基于代理的自动化,您将学习如何创建一个无缝的管道,以处理数据库查询、分析结果和生成高管报告 — 所有这些都需要最少的手动干预。无论您是数据爱好者

阅读更多
如何使用 Streamlit 和 Llama 3.2-Vision 构建自己的 OCR 助手

如何使用 Streamlit 和 Llama 3.2-Vision 构建自己的 OCR 助手

通过示例学习 OCR(光学字符识别)是一种帮助自动化将图像转换为文本的工具。你一定在手机上使用过它,因为现在它非常普遍。从数字化文档到自动化业务工作流程,OCR 是许多现代解决方案的核心。在本指南中,我们将引导您使用 Streamlit、Llama 3.2-Vision 和 Ollama 创建一个简单但强大的 OCR 助手,因为为什么不参与机器学习模型的竞争呢。有趣的是,不

阅读更多
如何选择 LLM 驱动的产品创意,以在激烈的竞争环境中蓬勃发展

如何选择 LLM 驱动的产品创意,以在激烈的竞争环境中蓬勃发展

欢迎来到我系列文章的第三篇(最后一篇),探讨的问题是:“哪些 GenAI 产品值得开发?”第一篇文章 从用户体验(UX)和产品采用的角度探讨了这个问题。

阅读更多
如何使用 CrewAI 和 Gemini Pro 创建 AI 团队来撰写引人入胜的故事

如何使用 CrewAI 和 Gemini Pro 创建 AI 团队来撰写引人入胜的故事

你是否对AI生成引人入胜的故事这一想法感到着迷?如果是这样,你并不孤单!在本文中,我们将深入探讨一个结合CrewAI和Gemini Pro力量的入门项目,创建一个代理网络,通过用户输入的帮助来创作短篇故事。无论你是一个初出茅庐的程序员,一个希望探索数字前沿的讲故事者,还是仅仅对人工智能的潜力感到好奇,这本指南都适合你。 CrewAI 和 Gemini Pro 是什么? 在我们深入探

阅读更多
如何为 CrewAI 应用程序创建交互式 Web UI(新版已更新)

如何为 CrewAI 应用程序创建交互式 Web UI(新版已更新)

CrewAI + Panel UI 实现的快速更新 今年早些时候,我写了一篇关于为 CrewAI 应用程序创建交互式 Web UI 的教程。在那个教程中,我实现了一个简单的 Web 服务器,用于可视化 CrewAI 代理和工作流,并允许用户通过消息与它们进行交互。从那时起,CrewAI 从版本 0.28 更新到最新版本 0.80,经历了许多变化和改进。不仅 API 的用法

阅读更多
如何开发具有自动互联网搜索功能的免费人工智能代理

如何开发具有自动互联网搜索功能的免费人工智能代理

使用 Groq 的免费 API 和 LangGraph 开发一个 AI 代理,以回答用户的问题并根据问题自动调用互联网搜索 如果您不是 Medium 会员,您可以通过此链接阅读完整故事。 生成性人工智能中的代理 AI 方法正在取得进展,并发现多个潜在应用。AI 代理就像数字助手,可以代表用户执行多项任务。它们可以理解用户的问题、整体目标,推理并决定选择最佳行动,并相互沟通

阅读更多
如何根据自己的数据微调 Llama-3.2:详细指南

如何根据自己的数据微调 Llama-3.2:详细指南

介绍 Meta发布的Llama-3.2系列在开源AI领域标志着一个重要的里程碑。到目前为止,该系列中下载量最多的模型是臭名昭著的meta-llama/Llama-3.2–11B-Vision-Instruct。不幸

阅读更多
如何使用 RAG 提高 LLM 成绩

如何使用 RAG 提高 LLM 成绩

初学者友好的介绍 w/ Python 代码 本文是关于在实践中使用大型语言模型的更大系列的一部分。在[上一篇文章](https://towardsdatascience.com/qlora-how-to-fine-tune-an-ll

阅读更多
如何将人工智能和数据科学融入企业战略

如何将人工智能和数据科学融入企业战略

数据科学咨询 内部咨询指南:如何成功举办为期两天的高管研讨会“我们的行业不尊重传统——它只尊重创新。” — *Satya Nadella,微软首席执行官,2014年致员工的

阅读更多
如何利用人工智能制作更可靠的报告--技术指南

如何利用人工智能制作更可靠的报告--技术指南

技术指南,分享我与AI合作的经验 在过去的一年里,我一直在经营自己的AI软件开发和咨询公司,与各种客户合作——从创业公司创始人到学术界人士。在此期间,我承担了来自多个领域的项目,包括数字营销、SaaS和网络安全。尽管每个项目的目标和目的各不相同,但一个共同的请求是需要使用AI为利益相关者或最终客户创建可靠的报告。几乎所有客户在项目中都有一个里程碑是制作报告。 通过这些经验,我

阅读更多
如何在本地运行 Nvidia 的 llama-3.1-nemotron-70b-instruct

如何在本地运行 Nvidia 的 llama-3.1-nemotron-70b-instruct

在开发者、研究人员和 AI 爱好者中,本地运行大型语言模型(LLMs)变得越来越受欢迎。其中一个引起广泛关注的模型是 llama-3.1-nemotron-70b-instruct,这是 NVIDIA 定制的强大 LLM,旨在增强生成响应的有用性。在本综合指南中,我们将探讨多种方法,以便在您的本地机器上运行此模型,首先介绍用户友好的 Ollama 平台。在开始之前,如果您正在寻找一个

阅读更多
如何使用人工智能免费抓取和分析数据:从收集到洞察

如何使用人工智能免费抓取和分析数据:从收集到洞察

学习如何结合网络爬虫、代理和人工智能语言模型来自动化数据提取,轻松获得可操作的洞察。 虽然有些网站可以通过使用Selenium、Puppeteer等工具轻松抓取,但其他实施了先进安全措施的网站,如验证码和IP封禁,可能会变得困难。为了克服这些挑战,并确保您可以免费抓取99%的网站,您将在本文中构建一个集成[代理工具](https://get.brightdata.com/bd-

阅读更多
如何了解人工智能的最新趋势(无需花大量时间上网)

如何了解人工智能的最新趋势(无需花大量时间上网)

如今,跟上人工智能(AI)趋势的感觉有点像试图从消防栓中小口喝水——只不过消防栓喷出的却是机器生成的术语、研究论文和未来预测,以超音速的速度涌出。但别担心,亲爱的朋友!保持对AI的了解并不一定要像全职工作一样。通过一些巧妙的策略,你可以在不牺牲空闲时间(或理智)的情况下走在前沿。让我们以隐喻、幽默和高效的方式来解析一下。 1. 订阅精选新闻通讯:你的AI备忘单 把新闻通讯想象

阅读更多
如何使用 CrewAI 从任务和流程的角度思考问题

如何使用 CrewAI 从任务和流程的角度思考问题

自动化使用 CrewAI 中的代理、任务和工具需要了解的事项 技术研究: 我们在机器上有一些例行任务。我是新技术的热心学习者。这意味着 YouTube 是我收集技术主题视频的最爱去处,并以 2 倍速观看。 [(YT 链接收集的代码在这里)](https://github.com/insightbuilder/codeai_fusion/blob/main/crews_fl

阅读更多
如何使用 ChatGPT 写博客

如何使用 ChatGPT 写博客

(我测试过的9个步骤) 每个人都在使用AI进行写作。市场营销人员、首席执行官、内容开发者、小型企业主。 我们所有人。 阅读免费故事 想想三年前我们坚定地认为:AI不会取代作家

阅读更多
如何使用克劳德 3.5 进行数据分析(秘密工具)

如何使用克劳德 3.5 进行数据分析(秘密工具)

大多数人对这个功能并不了解 在本文中,我们将讨论 Claude,这是一款由 AI 驱动的数据分析工具,可以帮助我们分析数据并制作酷炫的交互式可视化。 我们将涵盖您需要了解的所有内容,从启用特殊功能到使用较小的数据集。 让我们开始吧! 什么是Claude:一个AI数据分析师 想象一下,口袋里有一个非常聪明的助手,可以查看数据并给你答案。 这就是Claude的样子!Clau

阅读更多
如何使用 Claude 3.5 Sonnet API 进行创意写作

如何使用 Claude 3.5 Sonnet API 进行创意写作

让我们谈谈开发过程中我们都面临的一个问题:为您的开发团队使用 Postman 进行 API 测试。 是的,我也听说过,Postman 每年都在变得更糟,但是,您作为一个团队,需要一些协作工具来支持您的开发过程,对吧?

阅读更多
如何用Cursor颠覆你的iOS开发之旅

如何用Cursor颠覆你的iOS开发之旅

最近,关于 AI 的讨论和热议很多,关于它是否能改善你的开发工作流程。我想谈谈 AI 及其在 Cursor 中的实现是如何显著提高我的速度和效率的。 简而言之,Cursor 是 VSCode 的一个分支,内置了许多代码编辑的 AI 辅助功能。如果你在 VSCode 中使用过 Copilot,你可能知道我在说什么。嗯,想象一下 Copilot

阅读更多
如何在克劳德桌面应用程序上使用 MCP 工具并自动执行日常任务

如何在克劳德桌面应用程序上使用 MCP 工具并自动执行日常任务

Model Context Protocol (MCP) 是一种新的标准,用于在 AI 助手(如 Claude)和数据所在系统之间建立安全连接。这包括 代码仓库(Github, Gitlab)、API(Google Maps, Youtube, Brave)、业务工具(Slack, Notion, Bluesky)甚至您自己计算机上的 **本地

阅读更多
如何使用结构化生成进行法律硕士即法官评估

如何使用结构化生成进行法律硕士即法官评估

结构化生成是构建复杂的多步骤推理代理在LLM评估中的基础——尤其是对于开源模型 披露:我是Opik的维护者,这是本文后面使用的开源项目之一。 在过去几个月里,我一直在为语言模型开发基于LLM的评估(“LLM作为评判者”指标)。到目前为止,结果非常令人鼓舞,尤其是在像幻觉检测或内容审核这样的评估中,这些

阅读更多
如何使用 Google DeepMind Gemini 2.0 Flash Live API 进行实时对话

如何使用 Google DeepMind Gemini 2.0 Flash Live API 进行实时对话

Google DeepMind 的 Gemini 2.0 Flash API 代表了实时 AI 驱动对话领域的重大突破。它使开发者能够构建能够无缝处理实时音频交互的应用程序,提供了语音输入和输出的无与伦比的集成。无论您是在创建客户服务聊天机器人、增强无障碍工具,还是开发互动 AI 导师,这个 API 都是一个强大的基础。在本博客中,我们将探讨 Gemini 2.0 Flash API

阅读更多
Wren AI:Uber如何利用Text-to-SQL每月节省14万个小时?揭秘你的企业也能获得的强大力量!

Wren AI:Uber如何利用Text-to-SQL每月节省14万个小时?揭秘你的企业也能获得的强大力量!

在数据驱动决策至关重要的世界中,企业正在争相寻找从庞大数据集中提取可操作洞察的最有效方法。Uber,作为实时物流和运输的全球领导者,最近分享了他们的内部Text-to-SQL平台 — QueryGPT(如果你还没有查看这篇文章,[请在这里查看](https://www.uber.com/en-

阅读更多
HuggingFace smolagents:迄今为止最好的多代理框架?

HuggingFace smolagents:迄今为止最好的多代理框架?

比较 Autogen、Langraph、CrewAI、Magentic-One 等 正如你在多个地方所读到的,2025 年是 AI Agents 的年份。马克·扎克伯格甚至公开表示,Meta 将会有中高级工程师担任 AI Agents。 从过去几次发布中可以清楚看出,微软现在拥有 3 个多智能体编排框架(AutoGen、Magentic-One、Tiny-Troupe),Op

阅读更多
以人为本的人工智能:用户体验设计师的 5 个关键框架

以人为本的人工智能:用户体验设计师的 5 个关键框架

优先考虑用户需求并采用结构化的方法进行人工智能项目 2024年是人工智能进步的显著一年,这项技术迅速融入我们的职业和个人生活,令人惊叹。 在家中,我很高兴看到我三个年幼的儿子以他们自己的玩耍方式沉浸在人工智能中。他们被最新一波的人工智能玩具所吸引,尤其是我们家新的“宠物”机器人Loona,它

阅读更多
我请 5 位人工智能预测 2025 年--他们是怎么说的,为什么这么说?

我请 5 位人工智能预测 2025 年--他们是怎么说的,为什么这么说?

我没有预料到这些回应 随着2024年即将结束,我们谁也无法确定明年会带来什么。每次想到新的一年——2025年,我脑海中都会浮现出许多未解的问题:这一年会给人类带来财富和卓越成就吗?……还是会给我们带来挑战?或者两者兼而有之? 为了大致回答这些问题,我决定询问10个最先进和最流行的AI模型,预测2025年,问同样的问题——“你能提供2025年最准确的预测吗?”以下是***他们所

阅读更多
AI自动化时代来临!如何将SEO工作流提升至前所未有的效率?

AI自动化时代来临!如何将SEO工作流提升至前所未有的效率?

利用AI自动化10个创收的SEO工作流程 搜索引擎优化(SEO)已经从一种营销策略演变为一种基本的商业必要性。 然而,作为一个在网页开发和数据科学领域工作多年的从业者,我亲眼目睹了传统SEO的复杂与繁琐。 在手动任务上花费的无数小时让我开始思考:我们真的可以利用AI来彻底改变这个过程吗? SEO工作负载的现实 每个数字营销人员都知道这个流程。你开始一天的工作时进行关键

阅读更多
不可思议!DeepSeek-R1开源模型超越GPT-4的秘密!

不可思议!DeepSeek-R1开源模型超越GPT-4的秘密!

如果你一直关注AI领域,你就会知道,构建最强大、具备推理能力的模型的竞争一直由OpenAI、Anthropic和Google等大公司主导。但请保持冷静,因为游戏规则刚刚改变。中国AI公司DeepSeek发布了一颗重磅炸弹:DeepSeek-R1,一个完全开源的推理模型,不仅与OpenAI的O1竞争——它的表现让人大吃一惊。最棒的是?它完全在MIT许可证下开源。没错,你没看错。

阅读更多
我将区块链和人工智能结合起来创造艺术。接下来发生了什么?

我将区块链和人工智能结合起来创造艺术。接下来发生了什么?

教程 使用 LLM 创建数据的艺术表现 观察彩虹 如果可以通过图像来可视化,区块链会是什么样子? 区块链是分布式账本的技术实现,最常与金融交易相关联。这远不是我们可能认为的美丽的东西。尤其是因为存储在区块链上的数据大多由复杂的数字、字母和与价值、发送者和接收者地址(钱包)以及元数据相关的符号组成。 然而,我之前曾致力于*

阅读更多
我刚刚试用了 OpenAI 的升级版 o1 模型。这项技术将重创华尔街

我刚刚试用了 OpenAI 的升级版 o1 模型。这项技术将重创华尔街

当我第一次尝试o1-preview模型时,发布于九月中旬,我并没有留下深刻的印象。与传统的大型语言模型不同,o1系列模型不会立即响应。它们会“思考”问题和可能的解决方案,这个过程非常漫长。 再加上使用该模型的费用异常高昂以及缺乏基本功能(如函数调用),我很少使用这个模型,尽管我已经展示了如何使用它来创建超越市场的交易策略。 然而,OpenAI刚刚发布了最新的o1模型。与其前身(o1-prev

阅读更多
我训练人工智能成为我聪明的同性恋闺蜜 💅

我训练人工智能成为我聪明的同性恋闺蜜 💅

使用 ChatGPT 帮助我发现盲点 听着,我知道我们都厌倦了谈论人工智能,但每次我和朋友谈论我如何使用 ChatGPT 时,他们似乎都大吃一惊。所以,我想在这里记录一下。 首先,让我们谈谈我不使用人工智能的事情:写作。我试着把我书中的章节输入给它,并要求它复制我的写作风格,但结果很糟糕。此外,我之所以是一个作家,是因为,我喜欢写作。为什么我要把我喜欢的任务外包出去呢?

阅读更多
通过多模态 LLM 模型进行图像推理

通过多模态 LLM 模型进行图像推理

多模态人工智能 | LLM | OPENAI | GEMINI | 视觉 本博客探讨了多模态模型在图像推断中的能力,强调它们整合视觉和文本信息以改善分析的能力 多模态人工智能的出现显著改变了数据处理的格局。在过去,我们在光学字符识别(OCR)等任务中严重依赖文本提取库,如 PyTesseract。然而,视觉变换器和其他多模态模型的进步彻底改变了我们处理和解释数

阅读更多
使用光标人工智能实现简单的 YouTube 视频摘要应用程序

使用光标人工智能实现简单的 YouTube 视频摘要应用程序

介绍 Cursor AI 正在通过将先进的人工智能集成到熟悉的编码环境中,彻底改变软件开发。作为 Visual Studio Code (VS Code) 的一个分支,Cursor AI 保留了开发者所喜爱的用户友好界面和广泛的生态系统,同时通过 OpenAI 的 ChatGPT 和 Claude 等模型增强了功能。

阅读更多
智能代理:Langchain、CrewAI 和 AutoGen 比较

智能代理:Langchain、CrewAI 和 AutoGen 比较

1. AI代理框架概述 在人工智能快速发展的领域,选择合适的框架是每个数据科学家和开发者必须做出的关键决策。AI代理生态系统正在迅速演变,提供越来越复杂的解决方案来自动化和优化复杂的流程。 智能代理革命带来了几种框架,每种框架都有其独特的特点。Langchain、CrewAI、AutoGen和Swarm在这个场景中脱颖而出,各自提供了管理和协调AI代理的独特方法。 本次基准

阅读更多
Atomic Agents 1.0 简介:构建 Agentic AI 的模块化框架

Atomic Agents 1.0 简介:构建 Agentic AI 的模块化框架

想象一下,构建 AI 应用程序就像组装乐高积木一样轻松。这就是 Atomic Agents 的理念,一个基于 Atomic Design 原则的模块化框架,用于构建 AI 代理。随着 1.0 版本 的发布,Atomic Agents 引入了一个强大的 CLI,称为 **Ato

阅读更多
介绍 LightRAG:检索增强一代的新时代

介绍 LightRAG:检索增强一代的新时代

在快速发展的自然语言处理领域,检索增强生成(RAG)系统已成为提供准确、上下文丰富的响应的关键。然而,传统的 RAG 系统在更新知识库或处理复杂查询时,往往面临效率低下的问题。 引入 LightRAG,这是一个新颖的系统,旨在通过提供高效、增量更新和优化的检索过程来解决这些挑战。 传统 RAG 系统的问题 在我们深入了解 LightRAG 之前,先来理解一下我们为什么

阅读更多
微软 Magentic-One 代理框架介绍

微软 Magentic-One 代理框架介绍

一个可以执行复杂任务的多智能体系统 大约一周前,微软发布了一种名为 Magentic-One 的新智能体系统,旨在“解决复杂任务”,这似乎完全没有引起注意。在最近关于Anthropic计算机使用能力的热议中,微软似乎希望重新确立其在这一领域的信誉。 在本文中,我们将介绍Magentic-One,解释其能力,并讨论如何使用它来完成有用的工作。 根据微软自己的公告(文章

阅读更多
Swark 简介:从代码自动生成架构图

Swark 简介:从代码自动生成架构图

软件架构很难做到正确。团队之间的脱节、不清晰的图表以及耗时的流程常常导致挫折和次优的设计决策。随着工程团队采用去中心化的协作架构方法,风险变得更高。 在我之前的文章 “软件架构很难” 中,我深入探讨了这些挑战,强调了困扰许多团队的沟通和图表标准中的关

阅读更多
代理人工智能及其设计模式简介

代理人工智能及其设计模式简介

人工智能已经从基于规则的系统发展到能够做出决策并适应复杂环境的复杂自主代理。这个演变中的一个关键概念是 Agentic AI,这是一个专注于创建能够独立感知、推理和行动以实现特定目标的系统的领域。在本文中,我们将探讨 Agentic AI 的含义,深入其基础设计原则,并揭示推动其有效性的 Agentic Design Patterns。 什么是代理人工智能? 在其核

阅读更多
LLaVA 简介:一种多模式 AI 模型

LLaVA 简介:一种多模式 AI 模型

LLaVA是一个端到端训练的大型多模态模型,旨在理解和生成基于视觉输入(图像)和文本指令的内容。它结合了视觉编码器和语言模型的能力,以处理和响应多模态输入。 ![](https://images.weserv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1*mjzqL0BHzdPoN-Jjruh52A.pn

阅读更多
Anthropic 的模型上下文协议 (MCP) 是我们期待已久的互操作性标准吗?

Anthropic 的模型上下文协议 (MCP) 是我们期待已久的互操作性标准吗?

向Anthropic团队致敬!他们不断推出新功能,吸引了开发者社区的关注。首先是Artifacts,然后是Computer Use。现在,他们又推出了另一个突破性的新增功能:模型上下文协议(MCP)。 模型上下文协议(MCP)引入了一种标准化的方法,以实现AI应用程序、数据源和

阅读更多
文本到 SQL 的数据建模已死?Wren AI 如何连接现代商业智能与传统实践

文本到 SQL 的数据建模已死?Wren AI 如何连接现代商业智能与传统实践

数据建模在文本到SQL时代是否已经过时?Wren AI如何弥合现代商业智能与传统实践之间的差距 来自Wren AI团队的用户最常问的问题是:“我们可以直接将Wren AI的文本到SQL解决方案连接到我们的原始数据吗?现在AI可以处理一切,数据建模还有必要吗?”虽然现代AI驱动的工具如Wren AI确实改

阅读更多
Perplexity Pro 是一种更智能、更高效的网络搜索方式吗?

Perplexity Pro 是一种更智能、更高效的网络搜索方式吗?

搜索的未来 Perplexity Pro 是一种更智能、更高效的网络搜索方式吗? 它与传统搜索引擎相比如何,值得花费吗? 嘿,AI朋友们和关注者们。 我受够了。我已经厌倦了传统搜索。 我不想通过数百个链接来找到我想要的那一条信息,它被埋在第三页的广告之间。 传统搜索已经结束。一个停产的模型。过去的遗物。 现代答案引擎是未来。 Perplexity承诺将彻底

阅读更多
解锁 LLM 量化的 5 个关键点

解锁 LLM 量化的 5 个关键点

大型语言模型的量化 LLM量化目前是一个热门话题,因为它在提高大型语言模型(LLMs)的效率和在各种硬件平台(包括消费级设备)上部署方面发挥着至关重要的作用。 通过调整模型中某些组件的精度,量化显著减少了模型的内存占用,同时保持相似的性能水平。 在本指南中,我们将探讨LLM量化的五个关键方面,包括将此技术应用于我们模型的一些实用步骤。 #1. 理解量化 量

阅读更多
免费商用TTS模型:Kokoro TTS,让你的应用声动全球!

免费商用TTS模型:Kokoro TTS,让你的应用声动全球!

在文本转语音(TTS)技术的突破性发展中,Kokoro TTS模型已成为首个免费且可商业使用的TTS解决方案。Kokoro TTS建立在广受欢迎的开源StyleTTS框架之上,提供了无与伦比的灵活性和功能,适用于多种使用场景。让我们来探讨一下这个模型的独特之处、它的特点以及如何充分利用它。 什么是 TTS? TTS,即文本转语音,是一种将书面文本转换为口语的技术。它广泛应用于以

阅读更多
LangChain 与 LlamaIndex:检索增强生成(RAG)的综合比较

LangChain 与 LlamaIndex:检索增强生成(RAG)的综合比较

介绍 Retrieval-Augmented Generation (RAG) 结合了信息检索与生成模型,使其成为一个强大的技术,适用于问答、摘要及其他自然语言处理任务。要实现 RAG,目前最流行的两个框架是 LangChain 和 LlamaIndex。这两个框架旨在处理文档的摄取、拆分、索引以及将步骤链在一起,以实现无缝的 RAG 工作流程。但哪个框架更适合您

阅读更多
Langflow 1.1 发布

Langflow 1.1 发布

对代理管道的愉快邀请! 🚀 我们很高兴地分享 Langflow 1.1!此版本包含使 genAI 开发更加灵活、互动和愉快的更新。无论您是在构建语言模型管道、开发 RAG 系统,还是深入多代理编排,Langflow 1.1 都提供了强大的增强功能,让您的项目更上一层楼。让我们深入了解新内容吧! 全新视角:重新设计的用户界面 Langflow 1.1 引入了全新

阅读更多
用于医疗保健的 LangGraph:综合技术指南

用于医疗保健的 LangGraph:综合技术指南

构建生产就绪的医疗运营代理 LangGraph简介什么是 LangGraph? LangGraph 是一个 Python 库,旨在构建具有状

阅读更多
LangGraph Studio:您的第一个代理 IDE

LangGraph Studio:您的第一个代理 IDE

LangGraph Studio 是一个开创性的代理集成开发环境,用于生成和控制代理 AI 应用程序。这个 [IDE 是由 LangChain 引入的](https://bakingai.com/blog/langgraph-studio-ai-agen

阅读更多
LangGraph 系统检查员:用于测试和验证 LangGraph 代理的人工智能代理

LangGraph 系统检查员:用于测试和验证 LangGraph 代理的人工智能代理

🔗 探索完整的系统检查器代码教程 — 深入代码,学习如何自己实现这个前沿的 AI 代理! 🤔 为什么您应该关注 AI 测试 想象一下,使用 AI 助

阅读更多
LangGraph:高级多代理工作流的未来

LangGraph:高级多代理工作流的未来

人工智能的世界正在迅速发展,像 LangChain 和 LangGraph 这样的工具处于使开发者高效构建智能系统的前沿。如果你听说过 LangGraph,但不确定它是什么或如何充分利用它的潜力,这个指南适合你。 在这篇全面的文章中,我们将涵盖你需要了解的关于 LangGraph 的所有内容——从其核心概念到实际应用。无论你是初学者还是高级开发者,这个指南将帮助你理解为什么 LangGra

阅读更多
LangGraph:调用代理的工具

LangGraph:调用代理的工具

本文假设读者对 LangGraph / 多代理设计有基本的了解。在此基础上,让我们尝试理解实现工具调用代理的基本原理。 对生成式 AI 感兴趣的人应该对函数调用/工具调用等概念有所了解。这个概念非常简单,模型可以借助一个或多个工具根据用户的提示生成推理。工具就是作为催化剂的函数,帮助模型提供所需的信息以便进行更好的推理。此外,工具可以是内置工具或自定义定义的工具。 在我寻找实现多代理

阅读更多
构建惊艳的文本分析管道!LangGraph的奇妙能力揭秘!

构建惊艳的文本分析管道!LangGraph的奇妙能力揭秘!

在本文中,我将向您介绍 LangGraph,这是一个用于构建基于图的工作流的应用程序的令人难以置信的框架,这些工作流在其他情况下将是不可行的。我将分享我对 LangGraph 的经验,它的重要特性,并最终创建一个文本分析管道,以展示 LangGraph 的能力。 理解 LangGraph 本质上,LangGraph 是围绕图形工作流程的概念构建的,其中每个节点作为特定的过程或

阅读更多
LangGraph、LangChain、LangFlow、LangSmith:使用哪一个以及为什么?

LangGraph、LangChain、LangFlow、LangSmith:使用哪一个以及为什么?

探索 LangGraph、LangChain、LangFlow 和 LangSmith 之间的关键区别,了解哪种框架最适合您的语言模型应用——从工作流构建到性能监控。 👨🏾‍💻 GitHub ⭐️ | 👔LinkedIn

阅读更多
大型语言模型变得更小了

大型语言模型变得更小了

这将如何改变软件初创企业的游戏规则 本文与 David Meiborg 共同撰写。 *TLDR: 大型语言模型(简称 LLMs)目前体积庞大,运行成本高,并且具有 显著的碳足迹。然而,最近在模型压缩和系统级优化方法上的进展可能会增

阅读更多
LazyGraphRAG:高效和有效 RAG 的新时代 | 作者:Ankush k Singal | 2024年11月 | Medium

LazyGraphRAG:高效和有效 RAG 的新时代 | 作者:Ankush k Singal | 2024年11月 | Medium

介绍 在人工智能领域,检索增强生成(RAG)已成为一种强大的技术,以增强大型语言模型(LLMs)的能力。RAG使LLMs能够访问和处理来自外部知识源的大量信息,从而提供更具信息性和综合性的响应。然而,传统的RAG方法在处理大型数据集时可能计算成本高且耗时。 为了解决这些限制,提出了一种称为LazyGraphRAG的新方法。这种创新技术在效率和有效性方面提供了显著的优势,使其成为广泛

阅读更多
少即是多:使用 ChatGPT 生成中途人工智能提示的艺术 o1

少即是多:使用 ChatGPT 生成中途人工智能提示的艺术 o1

作为一名 AI 艺术创作者,当 OpenAI 发布了声称具有博士学位水平智能的 ChatGPT o1 时,我自然感到非常兴奋。虽然许多人急于测试其编码或写作能力,但我有一个不同的关注点:它在帮助生成 Midjourney AI 提示方面表现如何? 我在 AI 提示生成方面的旅程是逐步发展的。最初,使用之前的 ChatGPT 版本时,我系统地工作,逐个生成提示,并在 AI 的帮助下仔细改

阅读更多
利用 Gemini 1.5 API 进行自动测试用例生成逆向工程

利用 Gemini 1.5 API 进行自动测试用例生成逆向工程

摘要 本报告探讨了利用 Gemini 1.5 API 与 Google Apps Script 结合,自动化脚本逆向工程中的示例输入创建。传统上,这一过程是手动且耗时的,特别是对于具有大量测试用例的函数。通过将逆向工程技术应用于 Google Apps Script 示例,探讨了 Gemini 1.5 API 在自动化输入生成方面简化开发的潜力。 介绍 随着 Gemin

阅读更多
在 B2C 行业中利用大型语言模型 (LLM):在 B2C 行业中利用大型语言模型 (LLM):...

在 B2C 行业中利用大型语言模型 (LLM):在 B2C 行业中利用大型语言模型 (LLM):...

在金融服务、零售和电子商务等B2C行业快速发展的环境中,客户对个性化和即时响应的期望达到了前所未有的高度。随着人工智能技术的进步,尤其是大型语言模型(LLMs)的发展,企业在处理客户互动方面发生了剧烈变化。在银行和信用卡服务等行业,客户经常寻求有关产品、福利或交易的详细信息,因此采用基于LLM的自主代理提供了显著的优势。这些代理能够提供实时、智能的响应,转变客户参与方式,同时提高运营效率

阅读更多
LightRAG - GraphRAG 简单高效的竞争对手?

LightRAG - GraphRAG 简单高效的竞争对手?

传统的 RAG 系统通过索引原始数据来工作。这些数据被简单地切分并存储在向量数据库中。每当用户发出查询时,它会查询存储的片段并 检索 相关片段。如果您希望了解 RAG 的基本原理,我已经在 [这里](https://proxy.rifx.online/https://readmedium.com/retrieval-augmented-generation-rag-a-quick-a

阅读更多
Llama 3.1 405B——如何免费使用

Llama 3.1 405B——如何免费使用

无需本地安装 Llama 3.1 405B 是Meta于2024年7月发布的最先进的AI模型——但你可以在哪里试用它?** LLama 3.1 有不同的版本,包括参数最多的4050亿模型以及较小的70B和8B模型。 试用70B和8B模型的最简单方法是在Groq上——你可

阅读更多
Llama 3.2:下一代轻量级、指令调整语言模型:实践……

Llama 3.2:下一代轻量级、指令调整语言模型:实践……

探索 LLaMA 3.2 在剪枝、知识蒸馏和多语言性能方面的关键创新,以及本地运行或通过 Google Colab 的实用教程 👨🏾‍💻 GitHub ⭐️ | 👔LinkedIn |📝 [Medium](https

阅读更多
Llama 3.2 vs GPT-4 vs OpenAI O1 vs Gemini Ultra vs Claude 3.5:哪种人工智能模型适合您?

Llama 3.2 vs GPT-4 vs OpenAI O1 vs Gemini Ultra vs Claude 3.5:哪种人工智能模型适合您?

人工智能已经取得了长足的进展,每一个新模型似乎都在不断突破极限。今天,我想分享我对五个领先 AI 模型的看法:Meta 的 Llama 3.2、OpenAI 的 GPT-4、OpenAI 的新 O1、DeepMind 的 Gemini Ultra,以及 Anthropic 的 Claude 3.5. 这些模型各自带来了独特的优势,从处理多模态输入到道德决策。让我们深入探讨它们的优

阅读更多
LLM 代理:CrewAI 简介

LLM 代理:CrewAI 简介

由 LLM 驱动的代理框架承诺将自主任务解决提升到前所未有的水平。与其说是僵化的编程,不如说 LLM 反映任务、利用工具,并检查彼此的输出以创造性地解决任务。 这篇博客文章探讨了使用 CrewAI 框架开发的 LLM 代理。文章首先以纯 Python 和 YAML 文件的基本定义开始。然后展示了现有的预定义工具以及如何使用它们,还包括如何实现自定义工具。作为一个运行示例,开发了一个代理

阅读更多
LLM 代理:多代理自生聊天

LLM 代理:多代理自生聊天

代理是经过定制的语言模型,通过系统提示使其以特定方式行为。提示通常详细说明任务类型、预期的任务解决行为和约束条件。通常情况下,代理由人类用户调用,每次交互都需要进行调节。但是,当代理 LLM 与其他代理互动时会发生什么?当代理能够访问额外工具时,例如读取额外数据源或执行程序代码时,代理又会如何表现? 本文探讨了使用 Autogen 框架的多智能体对话。探讨了三个方面:首先,您将了解不同

阅读更多
Llm 微调指南:您是否需要以及如何进行微调

Llm 微调指南:您是否需要以及如何进行微调

在使用LLM时,我们最常收到的问题之一就是关于微调。每第二位客户都会问他们是否应该对他们的模型进行额外的训练。 在大多数情况下,答案是否定的,他们不需要。现代LLM在许多商业应用中已经足够好,无需微调,比如帮助客户从花店订购鲜花的机器人。此外,他们没有数据来进行微调,而他们拥有的20个对话样本并不算数(200个也是如此)。 训练和微调模型是一项昂贵的工作,如果可以的话,你真的应该避免它,

阅读更多
LongRAG:让人工智能在信息海洋中捕捞更多鱼

LongRAG:让人工智能在信息海洋中捕捞更多鱼

在 我之前的文章 中,我介绍了RAG是否会因长上下文LLMs而变得过时。今天,让我们看看如何将长上下文LLMs应用于RAG场景。 在检索增强生成(RAG)领域,传统方法一直依赖于短检索单元,通常约为100个单词,这迫

阅读更多
Magentic-One、AutoGen、LangGraph、CrewAI 或 OpenAI Swarm:哪种多人工智能代理框架最好?

Magentic-One、AutoGen、LangGraph、CrewAI 或 OpenAI Swarm:哪种多人工智能代理框架最好?

流行的多智能体编排框架的优缺点 生成式人工智能中的多智能体话题正在升温,每个主要科技巨头都发布了一些相关框架。 但是,应该选择哪个多智能体框架呢?选择实在太多了!!随着OpenAI发布Swarm和微软的Magentic-One,这个领域变得非常拥挤。因此,为了消除任何疑虑,我将尝试解释每个框架的关键特性、优缺点,让您决定哪个最适合您。我们将讨论:AutoG

阅读更多
Magentic-One:执行复杂任务的通用多代理系统的崛起

Magentic-One:执行复杂任务的通用多代理系统的崛起

本期内容:Magentic-One 的革命性是什么? 协调者在任务解决中的角色 多代理系统的优势和局限性 对未来自主协作的影响👋 介绍 在历史的很大一部分时间里,人类的创造力依赖于合作。从建设城市到进行复杂的科学研究,我们的物种在专业化团队合作中蓬勃发展。今天,人工智能正进入这一领域,不再是作为解决孤立问题的个体代理,而是作为能

阅读更多
Magnetic-One 如何重新定义多代理人工智能系统

Magnetic-One 如何重新定义多代理人工智能系统

如果你像我一样,总是对 AI 的发展充满好奇,你会知道我们已经到了一个单一模型无法解决高度复杂任务的阶段。引入 Magnetic-One,微软研究院的多智能体 AI 系统,最近引起了广泛关注。我花了一些时间来探索它,相信我,这不仅仅是另一个流行词——它确实有真正的潜力。 以下是我对 Magnetic-One 突出的看法,它如何与我的问题解决方法相一致,以及最重要的,你如何让

阅读更多
利用 Claude AI 的模型上下文协议🤖🧠,让 Playwright UI 测试变得更智能

利用 Claude AI 的模型上下文协议🤖🧠,让 Playwright UI 测试变得更智能

我们在之前的文章中讨论了Claude Anthropic的模型上下文协议(MCP)。本质上,MCP是一个标准化框架,旨在增强AI

阅读更多
MarkItDown:LLMs 项目必备的强大工具包,已通过 OpenAI 和 Gemini 2.0 测试

MarkItDown:LLMs 项目必备的强大工具包,已通过 OpenAI 和 Gemini 2.0 测试

MarkItDown 是微软开发的一款多功能工具,可以将各种文件格式转换为 Markdown,使其成为从事大型语言模型(LLMs)开发人员的必备工具。无论您想利用文档进行微调还是创建提示前言,这都是您不可或缺的工具。让我们看看如何在 OpenAI 和 Gemini 模型的实际应用中利用它。 核心能力 该 [toolkit](https://github.com/microso

阅读更多
掌握Mastodon机器人!用Python轻松创建社交媒体助手的实用指南

掌握Mastodon机器人!用Python轻松创建社交媒体助手的实用指南

我最近在 Mastodon 上发布了一条帖子,在两分钟内被六个其他账户分享。出于好奇,我访问了这些账户的个人资料,发现至少其中一个是技术机器人——这些账户会根据标签(如 #datascience 或 #opensource)自动分享帖子。 Mastodon 目前作为 X(前身为 Twitter)的去中心化替代品正在迅速增长。在这样一个平台上,机器人如何能让我们的日常生活更轻松?风险又是什么

阅读更多
掌握人工智能代理:CrewAI 和 Google Search API 实用指南

掌握人工智能代理:CrewAI 和 Google Search API 实用指南

你知道最近大家都在谈论 AI 代理吗?它们在各个行业层出不穷,承诺改变工作方式。但说实话,试图理解这一切是如何运作的,确实让人感到不知所措。我也曾有过这种感觉——在一片流行词汇、新技术和随之而来的行话中迷失,直到我看到了 CrewAI。亲身体验 CrewAI 让我觉得 AI 代理变得实用而不再令人畏惧。如果你和我一样,是个被 AI 热潮淹没的技术爱好者,我的 CrewAI 体验可能会帮助

阅读更多
掌握 CrewAI:利用多代理系统实现内容创作和营销工作流程自动化的综合指南 | 作者:Kshitij Kutumbe | Medium

掌握 CrewAI:利用多代理系统实现内容创作和营销工作流程自动化的综合指南 | 作者:Kshitij Kutumbe | Medium

CrewAI 是一个先进的框架,旨在以协调和高效的方式编排自主智能体。通过利用基于角色的智能体、任务和工具,CrewAI 使开发人员能够在内容创作、研究、客户服务等多个领域自动化复杂的工作流程。 完整代码链接: [https://github.com/kshitijkutumbe/Marketing\-AI\-Agent](https://github.com/kshitijkutu

阅读更多
掌握 CrewAI:第 1 章 - 您的第一个智能工作流程

掌握 CrewAI:第 1 章 - 您的第一个智能工作流程

代理和任务的基础 CrewAI 是一个平台,允许我们创建和管理 AI 代理团队。它提供企业级和开源解决方案。在这篇博客文章中,我们将深入探讨开源 CrewAI,当然。 那么,代理到底是什么? 代理被建模以模拟人类在解决问题、执行任务和互动中的行为。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v

阅读更多
掌握CrewAI秘籍 2:如何用“Flows”打造智能化工作流?惊艳实用技巧大揭秘!

掌握CrewAI秘籍 2:如何用“Flows”打造智能化工作流?惊艳实用技巧大揭秘!

事件驱动的 AI 工作流 工作流允许我们协调任务并管理团队。 上一章:我们可以将多个团队和任务串联在一起,构建 AI 工作流。 工作流在不同任务之

阅读更多
掌握CrewAI秘籍 3:如何让你的AI代理获取知识,实现智能对话?

掌握CrewAI秘籍 3:如何让你的AI代理获取知识,实现智能对话?

知识 — CrewAI 在 CrewAI 中,“知识”是允许 AI 代理在执行任务时访问和利用外部信息源的系统。我们可以把它看作是为我们的代理提供了一个参考图书馆,以便在工作时咨询。文本来源:原始字符串、文本文件、pdf 等… 结构化数据:CSV、excel、json 等…上一章: 让我们创建一个新项目来使用“知识” (*openai >> gpt-4o

阅读更多
揭秘CrewAI 4:三种流程的前所未有效率!你准备好提升你的AI协作能力了吗?

揭秘CrewAI 4:三种流程的前所未有效率!你准备好提升你的AI协作能力了吗?

顺序与层级流程 在CrewAI中,流程的概念对于管理AI代理之间的协作和任务执行至关重要。 上一章: 流程定义了协调代理执行任务以实现共同目标的工作流策略。 主要有三种流程类型:顺序流程 层级流程 协商流程(已规划,但尚未实施)首先,让我们创建一个新项目来处理流程 (openai >> gpt-4o-mini).

阅读更多
掌握 CrewAI:第 5 章--训练、测试、回放和计划 | 作者:Okan Yenigün | 2025年1月 | 人工智能浅析

掌握 CrewAI:第 5 章--训练、测试、回放和计划 | 作者:Okan Yenigün | 2025年1月 | 人工智能浅析

训练、测试、重放与计划 在本章中,我们将探讨CrewAI的训练、测试、重放和计划功能。 上一章: 让我们为这篇文章创建一个新项目。 crewai create crew train_test_example这将创建一个模板项目。 训练 在训练过程中,我们使用人机协作技术。团队生成结果,我们对其提供反馈。通过迭代反馈,结果随着时

阅读更多
掌握 CrewAI:第 6 章--记忆基础 | 作者 Okan Yenigün | 2025 年 1 月 | 中

掌握 CrewAI:第 6 章--记忆基础 | 作者 Okan Yenigün | 2025 年 1 月 | 中

CrewAI中的内存类型 在CrewAI中,内存系统通过使AI代理能够记住、推理和从过去的互动中学习来增强其能力。 前一章: 该系统由几个关键组件组成:短期记忆:该组件暂时存储最近的互动和结果,使代理能够在进行中的任务中回忆相关信息。例如,它有助于通过回忆刚刚讨论过的内容来保持对话的一致性。使用RAG。 长期记忆:它作为过去互动中有价值的见解和学

阅读更多

掌握 LangGraph:人工智能系统、RAG、代理和工具终极指南

您是否希望深入了解 LangGraph,这一 AI 技术的最新热词?无论您是开发者、学生还是技术爱好者,理解 LangGraph 及其相关概念,如 AI 助手、检索增强生成(RAG)、代理和工具,对于构建更智能、更互动的 AI 系统至关重要。在本文中,我们将分解 LangGraph 的基本内容,探索关键特性,并逐步指导您构建实用项目。 目录*什么是 LangGraph?

阅读更多

掌握 25 种 RAG 架构:何时以及如何使用每一种

介绍 检索增强生成 (RAG) 架构彻底改变了我们处理信息检索的方式。这些架构弥合了生成响应与提取相关数据之间的差距,使模型能够提供准确、实时且具有上下文意识的答案。但在众多可用的 RAG 架构中,您如何知道在每种独特场景中使用哪一个? 在本指南中,我们将深入探讨 25 种 RAG 架构,解释它们的具体用途,并提供现实世界的示例,以演示每种架构何时最有效。 1. Corr

阅读更多
人类学的 MCP 将让你大开眼界

人类学的 MCP 将让你大开眼界

相信我,这不是点击诱饵,MCP将彻底改变AI交互的方式 AI技术正在快速发展。 你可能在等待最新的模型,如GPT-5、Gemini 2或Claude 4,但有一件重要的事情需要知道——今天AI的真正力量不仅仅在于拥有最新的模型。 而在于我们如何将这些AI模型与周围的世界连接起来。 在于给予它们正确的工具、数据和上下文,以帮助它们更好地理解。 这就是Anthropic的***模型上下

阅读更多
认识 Ministral 3B 和 8B:边缘 AI 游戏规则改变者

认识 Ministral 3B 和 8B:边缘 AI 游戏规则改变者

Mistral AI在边缘AI和设备计算的新前沿 在快速发展的AI领域,边缘计算变得越来越重要,适用于那些需要低延迟、以隐私为首的高效推理的应用,而不依赖于基于云的基础设施。 Mistral AI最新推出的Ministral模型家族,标志着AI领域的一次突破性进展。 为庆祝其开创性的*

阅读更多
满足 Qwen2.5-Coder-32B-Instruct -Coder - 开源比 gpt4o 更好

满足 Qwen2.5-Coder-32B-Instruct -Coder - 开源比 gpt4o 更好

认识 Qwen2.5-Coder-32B-Coder,您新的 AI 编码伙伴 您是否曾希望编码变得更简单、更快速,甚至更有趣?那么,准备好迎接您的新 AI 编码朋友 Qwen2.5-Coder。Qwen2.5-Code 专门开发了这个模型,作为一个尖端语言模型,以简化您的编码体验。想象一下,拥有一个知识渊博的助手,可以为您编写代码、调试、解释复杂概念,并处理多种语言。感兴

阅读更多
Meta Llama3.3:70B 型号,Llama3.1 的备用型号 405B

Meta Llama3.3:70B 型号,Llama3.1 的备用型号 405B

Llama3.3 是 Llama 系列中的第 3 个模型系列,继 Llama3.1 和 Llama3.2 之后 因此,Meta 在今年的最后一次发布中推出了 Llama3.3,这是一个 700 亿参数的生成式 AI 模型,已经展示了一些非常出色的结果,并在基准数据集上击败了一些最先进的大语言模型。正如 Meta 所承诺的,该模型是开源的,因此可以免费使用。如果你不知道的

阅读更多
Metas Llama 3.3:开源大型语言模型的演变

Metas Llama 3.3:开源大型语言模型的演变

Meta 最近发布的 Llama 3.3 代表了大语言模型(LLMs)发展的一个里程碑。它在规模、效率和安全性方面进行了改进,同时保持开源,进一步强化了 Meta 致力于构建开放 AI 生态系统的承诺。以下是对 Llama 3.3 的功能、创新和应用的深入探讨。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.c

阅读更多
Meta's Llama 4 即将推出 另外Parallels 为 Windows 带来 Apple 智能

Meta's Llama 4 即将推出 另外Parallels 为 Windows 带来 Apple 智能

Plus: Parallels 将苹果智能带入 Windows 欢迎来到 Get The Gist,在这里,我们每个工作日分享最新和最伟大的 AI 发展简明易懂的总结——新闻、创新和趋势——所有内容都在 5 分钟内送达!⏱ 在今天的版块中:马克·扎克伯格宣布 Meta 的 Llama 4 Parallels 将苹果智能带入 Windows Re

阅读更多
Microsoft GraphRAG v0.4.0

Microsoft GraphRAG v0.4.0

微软最近发布了 GraphRAG 项目的 v0.4.0 版本,带来了几项重要更新。最显著的新增功能是增量索引特性和 DRIFT 图推理查询模块,这大大增强了系统的效率和功能。 此次更新的核心亮点包括: 1. 增量索引:显著提高大规模数据处理的效率,实现更快的信息更新。 2. DRIFT 图推理查询模块:引入先进的图推理技术,增强复杂查询处理能力。 此外,版本 0.4.

阅读更多
微软开放源代码 MarkItDown:改变游戏规则的文件到文本转换库 🌐📊📚

微软开放源代码 MarkItDown:改变游戏规则的文件到文本转换库 🌐📊📚

一个强大的开源工具,简化文件处理并自动提取PDF、Word文档、图像、音频等中的内容。 📏🎓📦专业人士在从PDF、Word文档、图像或音频文件中提取有意义的内容时常常面临挑战。在多个格式中管理分散的内容可能耗时且具有干扰性。MarkItDown通过自动化文件到文本的转换来解决这一挑战,节省了数小时的工作时间,并提供干净、结构化的输出。 🗑️📅📊 这个

阅读更多
惊艳来袭!Mini MiniCPM-o 2.6:超越GPT-4o的8B参数多模态LLM!

惊艳来袭!Mini MiniCPM-o 2.6:超越GPT-4o的8B参数多模态LLM!

在一项突破性的进展中,Mini CPM-o 在多模态大型语言模型 (LLM) 的世界中引起了轰动。凭借其 8 亿参数架构,它不仅在多个基准测试中超越了 GPT-4o,还在视觉、音频和其他多模态功能上与其相媲美。让我们深入探讨这一激动人心的发布、它的能力、安装过程和使用案例。 MiniCPM-o 2.6: 是什么? MiniCPM-o 2.6: 是一种先进的多模态 L

阅读更多
Mistral AI 发布革命性边缘模型 Ministral 3B 和 8B:卓越性能和隐私

Mistral AI 发布革命性边缘模型 Ministral 3B 和 8B:卓越性能和隐私

最近,Mistral AI 推出了两个新的边缘模型——Ministral 3B 和 Ministral 8B,这引起了科技界的广泛关注。这些模型不仅在性能上表现出色,还在隐私保护方面提供了独特的优势。 卓越性能,隐私优先 Ministral 3B 和 8B 专为设备内计算而设计,能够处理长度达 128k 的文本信息。特别是,Ministral 8B 采用了创新的滑动窗口注意力机

阅读更多
Mistral AI 推出 Ministral 3B 和 8B 模型 另外:Nvidia 推出优于 GPT-4 的 AI 模型

Mistral AI 推出 Ministral 3B 和 8B 模型 另外:Nvidia 推出优于 GPT-4 的 AI 模型

Plus: Nvidia推出的AI模型超越GPT-4 欢迎来到Get The Gist,在这里我们每个工作日分享最新的AI发展动态——新闻、创新和趋势——所有内容都在5分钟内轻松阅读!⏱ 在今天的版本中:Mistral AI推出了用于边缘计算的Ministral 3B和8B模型 Nvidia悄然推出的AI模型超越GPT-4 YouTube向

阅读更多
MLOps → LLMOps → AgentOps:操作人工智能系统的未来

MLOps → LLMOps → AgentOps:操作人工智能系统的未来

引言 随着AI技术的快速发展,组织需要可扩展的框架来应对部署机器学习模型、大型语言模型(LLMs)和自主代理日益增长的复杂性。最初的MLOps(机器学习操作)旨在支持传统的ML模型,现已演变为处理语言模型的LLMOps和针对自主代理的AgentOps。这些操作阶段各自解决独特的技术需求、商业机会和实施挑战。本文提供了MLOps、LLMOps和AgentOps的全面指南,涵盖其技术组

阅读更多
Mojo,比 Python 快 90,000 倍,终于开源了!

Mojo,比 Python 快 90,000 倍,终于开源了!

2024年3月29日,Modular Inc.宣布开源Mojo的核心组件。 Mojo是一种专门为编写人工智能软件而设计的编程语言,去年八月正式发布。自那时以来,它已经吸引了超过175,000名开发者和50,000个组织。 人工智能模型通常使用多种编程语言编写。开发者通常使用Python实现神经网络的最简单部分,因为它易于学习,但相对较慢。其余代码通常用C++编写,虽然速度更快,但学习起来更复

阅读更多
具有大型语言模型(LLM)的多代理人工智能架构

具有大型语言模型(LLM)的多代理人工智能架构

端到端多智能体实现与LLMs 多智能体架构由多个自主智能体组成,它们协作以完成复杂任务。随着LLMs的最新进展,这种架构已获得显著的关注。 这些智能体能够独立做出决策并执行行动。智能体由大型语言模型(LLMs)驱动。 多智能体架构的工作方式是,你不必指定每一个步骤,我们可以给它们一个目标,它们可以自行确定行动顺序。 这些架构被广泛应用于机器人技术、虚拟助手、协作决策和多模态处

阅读更多
多代理人工智能高手:用 CrewAI 构建内容写作人工智能系统 | 作者:Kshitij Kutumbe | Medium

多代理人工智能高手:用 CrewAI 构建内容写作人工智能系统 | 作者:Kshitij Kutumbe | Medium

在 AI 和语言模型的领域中,多代理系统涉及多个独立的参与者,每个参与者都由语言模型驱动,以结构化的方式进行协作。在本博客中,我们将深入探讨 Crew.AI,这是一个用于构建多代理应用的前沿框架。Crew.AI 使 AI 代理能够承担角色、共享目标,并协同工作,模拟一个协调良好的团队的动态。 架构 Crew.AI 的架构是模块化的,由多个关键组件组成,这些组件协同工作,创建一个

阅读更多
利用 LangChain 和 LangGraph 进行多代理对冲基金模拟

利用 LangChain 和 LangGraph 进行多代理对冲基金模拟

多智能体对冲基金模拟与 LangChain 和 LangGraph 该项目演示了如何使用多智能体设置来模拟对冲基金的分析过程。它展示了一种实用的方法来构建一个系统,该系统利用 AI 智能体收集和分析金融数据,这种设置可以进一步扩展和定制。在这里,我将分解该项目,其中涉及一个投资组合经理和三个分析师智能体(基本面、技术面和情绪面),每个智能体在收集和处理股票数据方面被分配了特定角色。

阅读更多
多模态多语言视觉描述技术:基于Llama 3.2与NLLB-200的图像视频分析方法

多模态多语言视觉描述技术:基于Llama 3.2与NLLB-200的图像视频分析方法

使用Meta的Llama 3.2 11B Vision Instruct、Facebook的600M NLLB-200和LLaVA-Next-Video 7B模型生成多语言图像和视频标题、描述标签以及情感分析。 视频: 可口可乐公司,1971年,“Hilltop”广告, featuri

阅读更多
用于人类运动对话的多模态人工智能

用于人类运动对话的多模态人工智能

撰写者:Christian Safka 和 Keyu Chen 在本次探索中,我们将探讨多模态模型如何改变对话人工智能代理的游戏规则,以及如何利用感知、记忆、行为建模和

阅读更多
使用 Gemini Pro 和 LangChain 的多模式 RAG

使用 Gemini Pro 和 LangChain 的多模式 RAG

介绍 在本教程中,我们将探索将 Gemini Pro 和 Gemini Pro Vision 与 LangChain 框架集成,以实现多模态(在这种情况下为图像)检索增强生成(RAG)。

阅读更多
我对 2025 年人工智能的五大预测

我对 2025 年人工智能的五大预测

以及一些非预测 正确预测未来是具有挑战性的。 问一下——以一个广为人知的流行文化偶像为例——汉娜和巴贝拉,杰森一家(The Jetsons)的创作者,他们想象了一个有飞行汽车和机器人女佣的未来,但没有想到互联网或智能手机会出现在我们的未来。 特别是在AI领域,许多失败的过于乐观的预测也导致了失望,最终出现了所谓的“AI寒冬”,即AI资金枯竭的时期。整个领域从公众视野中退回到不为人知的研

阅读更多
有了这个简单的小窍门,我的 GPT 评估器的性能提高了 1000%。

有了这个简单的小窍门,我的 GPT 评估器的性能提高了 1000%。

我希望我早就知道这个技巧。 我的所有文章都是免费阅读的。[非会员可以通过点击此链接免费阅读。](https://readmedium.com/my-gpt-evaluator-performance-improved-by-1000-with-this-simple-trick-2384027734c6?sk=73f3395c748fcd636d7d907876c02c

阅读更多
我对 ChatGPT 的新 o1 和 o1 专业模式的真实看法(附测试)

我对 ChatGPT 的新 o1 和 o1 专业模式的真实看法(附测试)

注意:在本文中,我将尽量涵盖与事件相关的所有要点以及我的个人看法。几天前,OpenAI 开始了他们的“12 Days of OpenAI”活动,带来了令人兴奋的消息:发布了一个新的 ChatGPT 模型,称为 o1,以及一个包括强大 o1 Pro 模式的高级订阅计划 ChatGPT Pro。 这一公告展示了 AI 在思考、解决问题、处理图像以及帮助完成编码和数学等复杂

阅读更多
提升LLM输出质量的简单技巧!如何达到1000%的进步?

提升LLM输出质量的简单技巧!如何达到1000%的进步?

我希望我能更早知道这个技巧。 去年夏天我在Adobe Research(班加罗尔)实习时,我的工作是使开源LLM更符合上下文。这意味着无论提供的上下文说了什么,LLM都需要遵循它。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1*TlgNYgNqVrW_L766nw2r

阅读更多
探索人工智能代理格局:深入分析 Autogen、CrewAI、LlamaIndex 和 LangChain...

探索人工智能代理格局:深入分析 Autogen、CrewAI、LlamaIndex 和 LangChain...

本文将为您提供清晰的可视化,帮助您在开发“代理应用程序”时选择适合您业务用例的框架或工具。 介绍 在快速发展的人工智能领域,一种新的范式正在出现,这种范式承诺将彻底改变我们与AI系统的互动和利用方式:AI代理。这些复杂的软件实体代表了从传统的单一目的AI模型到动态协作系统的根本转变,这些系统能够通过协调努力和专业知识解决复杂挑战。 本综合指南探讨了四个塑造AI代理未来的领先框架:A

阅读更多
新版 Claude 3.5 可以控制计算机:在编码方面超越 o1,重新定义代理能力

新版 Claude 3.5 可以控制计算机:在编码方面超越 o1,重新定义代理能力

Anthropic的突破性AI,Claude 3.5,像人类一样使用计算机,并在自动化领域成为游戏规则改变者 作者杨子健 (ORCID: 0009–0006–8301–7634)

阅读更多
与我们不同:驾驭人工智能代理浪潮--焦虑与机遇

与我们不同:驾驭人工智能代理浪潮--焦虑与机遇

你到底有多少机会?我的意思是,选择实在太多了 2024年,ChatGPT如火如荼地登场,使“GenAI”成为家喻户晓的术语。到年底,“Agentic AI”无处不在——名字、地址、企业——一个流行词,象征着下一个大事件。但在这种炒作之下,一种更为隐秘的焦虑开始酝酿。 嘘:我看到死去的职业道路 认识一下莎拉,她是Notyourcompany Corp(随便

阅读更多
英伟达即将让人工智能模型的价格崩溃

英伟达即将让人工智能模型的价格崩溃

在CES上,Nvidia展示了一些有趣的新产品。其中最大的一件是Jensen Huang的新皮夹克。我是说,看看那件:这是技术发布会还是时装秀? 老实说,我有点惊讶更多人没有对此发表评论。这是Jensen迄今为止最好的皮夹克。 还有其他一些东西。新的RTX 50系列。令人惊讶的是,关于它们的报道绝大多数都是积极的。我特别喜欢Linus Tech Tips视频中的这条评论: ![](

阅读更多
o1:ChatGPT 的新模式再次改变了数据分析!(比特币分析)

o1:ChatGPT 的新模式再次改变了数据分析!(比特币分析)

测试 ChatGPT 的新 O1 模型,进行比特币数据分析 ChatGPT 最近宣布将在 12 天内分享 12 个新功能,今天是第一天。正如您从我之前的文章中所读到的,我们已经看到了他们第一天的功能,包括 O1 模型。 o1 模型 这个模型在一段时间前以 o1-preview(beta) 的名称发布。看起来测试阶段已经结束,现在我们有了 o1 模型。根据基准测试结果

阅读更多
o1-preview 与 claude-3.5-sonnet:比较顶级法学硕士

o1-preview 与 claude-3.5-sonnet:比较顶级法学硕士

今天(2024年9月12日),OpenAI 发布了其最新的语言模型 o1-preview。这个先进的模型经过设计,能够在生成响应之前投入更多时间进行处理,使其能够更好地应对复杂任务,并在科学、编码和数学等领域解决具有挑战性的问题。 在这篇博客文章中,我们将深入分析 o1-preview,并将其与之前被认为是最先进模型之一的 Claude 3.5 Sonnet 进行比较。 比较方

阅读更多
OpenAI 的 O3 模型:崛起与信任的重构

OpenAI 的 O3 模型:崛起与信任的重构

从我第一次听到那些低声的传闻开始,我内心深处便感受到了一种变化。这是一种渴望的紧张感,夹杂着怀疑。柔和的声音围绕着一个神秘的“o3”推理模型。 o3 Open AI ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1*fjKrpXECxJXGDgO5xxEvaw.p

阅读更多
OpenAI 01-预览 — 99% 的人不知道的秘密

OpenAI 01-预览 — 99% 的人不知道的秘密

如何充分利用01-preview 自从01-preview发布以来,我一直在玩它。 我非常喜欢它! 我甚至在我的新AI增长黑客课程中教授它。 我很高兴分享一些关于如何充分利用它的关键见解。 大多数人对01-preview的工作原理一无所知。

阅读更多
OpenAI 确认 GPT-5 即将到来,有望为人工智能带来巨大改进……

OpenAI 确认 GPT-5 即将到来,有望为人工智能带来巨大改进……

一位网友在 x 上发布了 GPT5 倒计时的帖子,称这是从各个平台的线索得出的结论。评论区已经达到高潮,各种意见纷纷涌现。 原因 1 : OpenAI 网站 GPT5 泄露 ![](https://images.weserv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1*EBDLAv3rOyCj

阅读更多
OpenAI 第 4 天:Canvas 向所有人开放,扩大协作式人工智能工具的使用范围 | 作者:Raju Singh | 2024 年 12 月 | Medium

OpenAI 第 4 天:Canvas 向所有人开放,扩大协作式人工智能工具的使用范围 | 作者:Raju Singh | 2024 年 12 月 | Medium

2024 年 12 月 10 日,OpenAI 继续其“12 天 OpenAI”活动,宣布全面发布 Canvas,这是一款专为写作和编程设计的协作工具,现在所有用户都可以使用。最初仅提供给 ChatGPT Plus 和 Team 订阅用户,Canvas 现在对免费用户开放,将先进的 AI 辅助功能带给更广泛的受众。 让我们看看第 4 天带来了什么。 第4天宣布了什么?

阅读更多
OpenAI GPT-5:预计 2025 年将实现博士级智能

OpenAI GPT-5:预计 2025 年将实现博士级智能

经过几个月的猜测,OpenAI终于揭示了备受期待的GPT-5的详细信息。最初预计在2024年发布,但其发布时间已推迟至2025年末或2026年初。OpenAI的首席技术官Mira Murati在与达特茅斯工程学院的采访中分享了有关这个新版本的能力和潜力的见解。以下是您需要知道的一切。 智力的量子飞跃 Murati 将之前的 GPT 版本与不同水平的人类智力进行比较。GPT-

阅读更多
OpenAI新语言模型O3与O3-mini的潜力与挑战

OpenAI新语言模型O3与O3-mini的潜力与挑战

我一直密切关注 OpenAI 的更新,兴奋地分享一些最新消息:OpenAI 刚刚宣布了他们最新的两个语言模型 O3 和 O3-mini。在观看了最近的演示并深入了解它们的能力后,我不禁觉得这些模型有潜力彻底改变我们使用 AI 创建内容、翻译语言和回答问题的方式。在这篇文章中,我将介绍我对 O3 和 O3-mini 的了解,它们的优点和局限性,以及它们可能如何重塑基于语言的技术的未来。

阅读更多
用户会爱上 OpenAI 的新 GPT-4o 模型。确实如此。

用户会爱上 OpenAI 的新 GPT-4o 模型。确实如此。

公司的新 GPT-4o 能理解并模仿人类的语言和情感 在标志性的2013年电影 她 中,主角与一个语音启用的人工智能系统发展出一种强烈的关系——并演变成一场爱情故事。 她 中的人工智能是今天的语音启用系统所不具备的:富有情感、幽默,并且能够洞察人类对话的细微差别。 在今天早上的一次重大[公告](https://www.youtube.com/live/DQacCB9

阅读更多
OpenAI 推出 Sora 人工智能视频生成器 | 作者:Thomas Smith | 生成器 | 2024年12月 | Medium

OpenAI 推出 Sora 人工智能视频生成器 | 作者:Thomas Smith | 生成器 | 2024年12月 | Medium

在12月9日星期一早上的直播中,OpenAI宣布将正式推出其AI视频生成器Sora。 “我们不希望世界只是文字,”OpenAI首席执行官Sam Altman说。他还表示,这一举措对我们的AGI路线图“至关重要”。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/r

阅读更多
OpenAI o1 和 ChatGPT Pro 已发布:智能人工智能工具的未来

OpenAI o1 和 ChatGPT Pro 已发布:智能人工智能工具的未来

OpenAI 发布了 OpenAI o1 模型,并推出了一个高级订阅层级 ChatGPT Pro,旨在为高性能专业使用提供支持。这些进展有望重新定义我们在个人、专业和组织层面与 AI 的互动方式。 什么是 OpenAI o1? [OpenAI o1](https:/

阅读更多
OpenAI o1 模型全面发布:用于科学、编码和写作的增强型多模态人工智能

OpenAI o1 模型全面发布:用于科学、编码和写作的增强型多模态人工智能

发现 OpenAI 的新 o1 模型:更快、更智能、支持多模态。凭借先进的推理、编码精度和图像分析,o1 设定了新的 AI 标准。 OpenAI的o1模型现已全面发布:有什么新功能和改进? OpenAI正式发布了o1模型的完整版本,超越了其预览版本的能力。以下是o1作为一款尖端AI模型所带来的增强和功能的详细分析。 Full o1 版本的关键增强功能

阅读更多
未来已来!OpenAI o3模型颠覆你对AI的所有想象!

未来已来!OpenAI o3模型颠覆你对AI的所有想象!

令人难以置信的奇迹,不仅仅是一个更先进的 AI 模型 OpenAI 以盛大的方式结束了他们为期 12 天的圣诞活动。在第一天,他们推出了他们的 [第一个推理 AI 模型 o1 的完整版本](https://www.thealgorithmicbridge.com/p/openai-announces-o1-model-

阅读更多
OpenAI 实时 API(语音模式),Colab 入门

OpenAI 实时 API(语音模式),Colab 入门

您需要了解的一切,以及在 Colab 上运行 OpenAI 语音模式 API 的动手介绍。 OpenAI 最新的开发为我们带来了 实时 API,旨在允许开发者在他们的应用中创建 快速、无缝的语音到语音体验。该 API 旨在简化多模态对话功能的开发,使构建自然的实时语音交互变得更加容易。 在这篇博客中, 我将涵盖有关此新 API 的 主要问题,包括

阅读更多
OpenAI 向更多用户推出 SearchGPT

OpenAI 向更多用户推出 SearchGPT

你注意到 OpenAI 最近对 ChatGPT 的重新设计了吗? 如果你最近登录过,你可能会发现两个主要变化。首先,新的 [Canvas](https://generativeai.pub/openai-rolls-out-canvas-in-chatgpt-a-brand-new-writing-and-coding-interface-7b57a3ec582

阅读更多
OpenAI SearchGPT:带有互联网和浏览工具的ChatGPT

OpenAI SearchGPT:带有互联网和浏览工具的ChatGPT

一个更好的替代方案:Perplexity 和 Google 搜索 备受期待的 OpenAI 产品 SearchGPT 昨晚发布,拥有一些重大功能,使其在竞争对手 Perplexity 之上更进一步。 如 OpenAI 所宣布的,SearchGPT 不仅仅是带有互联网的 ChatGPT。 它本身就是一个 AI 网络浏览器。 谈到一些关键功能:高级过滤:为特定

阅读更多
[ OpenAI 給的 2024 年聖誕禮物 ] — 3 Sora 影片生成工具 | by Simon Liu | Dec, 2024 | Medium

[ OpenAI 給的 2024 年聖誕禮物 ] — 3 Sora 影片生成工具 | by Simon Liu | Dec, 2024 | Medium

OpenAI Day 3 发布会在这边,全程 20 分钟,大家可以听听,或者先滑到下面,我将为各位整理本次重点。 帮大家整理十大 Sora 重点 I. Sora 视频生成工具的推出 OpenAI 发布全新视频生成产品 Sora,这是一款专为视频创作设计的人工智能工具,已上线。台湾在第一波名单中,欧洲可能都还无法使用。 ![](https://wsrv.nl/?url=h

阅读更多
OpenAI的结构化输出:如何用JSON实现安全与灵活性的完美平衡?

OpenAI的结构化输出:如何用JSON实现安全与灵活性的完美平衡?

过去,在使用OpenAI的JSON模式时,模型输出与指定和预定义的JSON架构不匹配并没有保证。在我看来,这确实使得这个功能在生产环境中不可靠,因为一致性非常重要…… 然而,这一切随着OpenAI所称的结构化输出而改变,他们将其描述为[JSON模式](https://cobusgreyling.medium.com/now-you-can-set-gpt-output-to

阅读更多
OpenAI Swarm vs LangChain LangGraph:多代理框架详解

OpenAI Swarm vs LangChain LangGraph:多代理框架详解

Ankush k Singal 介绍 人工智能的世界正在迅速发展,创建涉及多个代理的复杂工作流程的能力变得越来越重要。在这个领域中,OpenAI Swarm 和 LangChain LangGraph 是两个备受关注的框架。本文将深入探讨这两个框架,探索它们的功能、优势和理想用例,以帮助您决定哪个框架可能

阅读更多
OpenAI‘泄露’的 GPT2 模型让所有人震惊。

OpenAI‘泄露’的 GPT2 模型让所有人震惊。

故意泄漏? OpenAI 对人工智能行业的影响不容小觑。每一个动作或决定都会自动成为头条……即使他们并没有真正宣布什么。 几天前,一个我们许多人曾试用过但已被删除的模型让整个人工智能行业着迷。这个名为“gpt2-chatbot”的模型在 lmsys.org 的“直接聊天”功能中可以使用了几天。 但为什么这么多喧嚣?

阅读更多
OpenAI 的 O1 和 O1 Pro 模型:以推理为重点的人工智能新时代

OpenAI 的 O1 和 O1 Pro 模型:以推理为重点的人工智能新时代

近年来,人工智能取得了显著进展,大型语言模型从简单的文本生成器演变为能够处理高级推理任务的强大系统。像GPT-4o这样的模型展示了令人印象深刻的语言流利性和一般知识,但直到现在,它们在更具挑战性的问题解决场景中仍然面临困难——例如高级数学、复杂的编程难题和复杂的科学探究。 OpenAI新推出的O1模型系列旨在改变这一格局,强调深度推理。与之前主要关注速度和广泛覆盖的模型不同,O1在产生

阅读更多
OpenAI 的 O1 模型:对人工智能未来的详细探索

OpenAI 的 O1 模型:对人工智能未来的详细探索

引言 人工智能在过去的十年中迅速发展,导致了自然语言处理(NLP)、机器学习和多模态应用的突破。OpenAI 的 O1 模型体现了这种创新,提供了超越传统 AI 模型的能力。O1 不仅仅是一个工具;它是一个革命性的框架,带来了先进的语言理解、多模态集成和实时适应能力。本综合指南深入探讨了 OpenAI 的 O1 模型的细节、应用、优势、局限性以及如何优化相关内容以提高搜索引擎可见

阅读更多
OpenAI O3模型:人工智能的新进展与挑战

OpenAI O3模型:人工智能的新进展与挑战

在快速发展的人工智能领域,OpenAI最新的模型O3引起了广泛关注。O3声称具备增强的推理能力和在基准测试中的出色表现,被视为相较于其前身的一次重大进步。但这对开发者、企业和更广泛的人工智能领域意味着什么呢?让我们深入探讨细节、现实世界的影响以及社区反应,以理解O3的真正影响。 什么是 O3? O3 是 OpenAI 的第三代大型语言模型 (LLM),旨在超越其前身的能力。除了

阅读更多
巧用OpenAI o3和Swarm,打造多元化聊天机器人!你准备好迎接高效智能沟通了吗?

巧用OpenAI o3和Swarm,打造多元化聊天机器人!你准备好迎接高效智能沟通了吗?

在这个故事中,我将为您提供一个超级快速的教程,展示如何使用Swarm、RAG和OpenAI的o3创建一个多智能体聊天机器人,为您的商业或个人使用提供强大的代理聊天功能。 近年来,随着AI技术的发展,多个AI智能体协作完成任务的“多智能体系统”引起了广泛关注。 大型语言模型(LLMs)就像能够独立思考的人脑,而AI智能体是进一步与环境互动、制定计划并最终执行任务的系统。与LLMs相比,AI

阅读更多
OpenAI 的 Sora 来了:关于视频生成器你需要知道的一切 | 作者 hejrene | Rene | 2024年12月 | Medium

OpenAI 的 Sora 来了:关于视频生成器你需要知道的一切 | 作者 hejrene | Rene | 2024年12月 | Medium

新的 AI 工具 我对 OpenAI 的 Sora 如何为视频带来惊人的创造力感到惊讶,即使对于像我这样并不是“视频人”的人来说。 嘿,AI 朋友们和关注者们。 今天就是那一天!OpenAI 刚刚正式向公众发布了 Sora,他们的视频生成工具。几个月前就已宣布,我相信没有人预料到它会这么早推出? 它是什么? 如果你没有生活在石头下,你应该已经知道 Sora 是

阅读更多
OpenAI 的 Swarm 和 Ollama(第 3 部分):利用本地 LLM 逐步构建数学求解器

OpenAI 的 Swarm 和 Ollama(第 3 部分):利用本地 LLM 逐步构建数学求解器

一个简短的代码参考供构建使用。 作为一名热衷于AI教育的开发者,我一直对如何使复杂问题解决变得更加互动和吸引人充满兴趣。 最近,我开始了一项实验,旨在将OpenAI的Swarm框架与Ollama的本地LLM部署结合起来。 我的目标?创建一个智能的数学辅导员,既像耐心的老师一样平易近人,又像经验丰富的审阅者一样细致入微。 我为什么构建这个:不仅仅是另一个数学求解器

阅读更多
利用 LangGraph 和代理优化工作流程效率:关键功能、用例和集成...

利用 LangGraph 和代理优化工作流程效率:关键功能、用例和集成...

在生成式 AI 和大型语言模型(LLMs)的背景下,agents 和 LangGraph 是增强 LLM 功能的工具和框架,使它们能够以更灵活和结构化的方式执行任务、做出决策或与复杂工作流程进行交互。以下是每个概念的详细说明及其应用示例。 什么是 LLM 中的代理? 代理是与 LLM 一起工作的自主程序或组件,能够根据提示和用户输入执行任务、做出决策或与环境互动

阅读更多
战胜大数据:小企业如何在没有巨型数据集的情况下参与人工智能竞争

战胜大数据:小企业如何在没有巨型数据集的情况下参与人工智能竞争

面对现实——在AI领域,小企业常常感觉像是在进行一场不对称的斗争。大企业——谷歌、Meta、OpenAI——似乎垄断了AI的叙事,凭借在庞大的数据集上训练的炫酷模型,这些数据集大到需要小城镇大小的数据中心。他们拥有博士军团、无尽的预算,以及对数十亿(有时甚至是万亿)数据点的访问权。 而你呢,一个谦逊的企业或正在成长的初创公司,手头可能只有……几千行井然有序的电子表格数据。你没有PB级的

阅读更多
克服医疗领域的法学硕士挑战:生产发展实用策略

克服医疗领域的法学硕士挑战:生产发展实用策略

生成性人工智能 我遇到的最常见的LLM开发挑战、有效的缓解策略以及一个职业生涯中决定性的面试错误 引言 我一直是那种深入研究一个主题并专注到痴迷的人。当我从数据科学硕士毕业时,我的痴迷是计算机视觉;特别是将计算机视觉应用于神经科学或心理健康领域。我决心成为心理健康领域的“计算机视觉工程师”(不过“机器学习工程师”也可以),尽管我的导师们劝我拓宽视野,寻找更多机会。

阅读更多
使用 LLM 执行分析查询

使用 LLM 执行分析查询

实用方法:使用 LLM 进行数据探索与分析 考虑以下场景。您有一个包含 500 万行和 20 列的 CSV 文件。该 CSV 文件包含客户的交易记录,例如销售日期、单价、数量、客户姓名、地址等。基于这些数据,您希望 LLM 能帮助回答以下问题:客户 A 在某一天购买了什么? 某个月的总销售额是多少? 列出某一年每个月的销售额。LLM的局限性 如果你尝

阅读更多
为人工智能代理提供个性化用户体验

为人工智能代理提供个性化用户体验

基于用户角色的AI代理微调以满足企业用例 1. 引言 关于 ChatGPT(通常指生成式 AI)的讨论,现在已经演变为代理 AI。虽然 ChatGPT 主要是一个可以生成文本响应的聊天机器人,但 AI 代理可以自主执行复杂任务,例如:进行销售、规划旅行、预订航班、预定承包商进行家庭工作、点披萨。下图 1 说明了代理 AI 系统的演变。 比尔·盖茨最近[设想](htt

阅读更多
Phi-4:微软最新的小语言模型,专门用于复杂推理

Phi-4:微软最新的小语言模型,专门用于复杂推理

Phi-4: 一款重新定义现实世界应用的紧凑型强大AI推理模型 微软的Phi-4在小型语言模型领域代表了一项显著的进步,能够在复杂推理任务中表现出色,同时保持紧凑高效的架构。与其更大型的同行不同,Phi-4专注于为那些需要高级问题解决能力的用例提供精确、细致的输出,而不会对计算资源造成过大压力。 本博客将探讨Phi-4的架构、基准测试、实际应用,以及在本地或Azure

阅读更多
2025年科技巨头将如何重塑世界?惊人预测大揭密!

2025年科技巨头将如何重塑世界?惊人预测大揭密!

这一年不会是普通的一年。 2025年将会是奇怪、狂热且充满惊喜的一年,尤其是对于我们这些密切关注科技的人来说。我们并不习惯科技行业拥有如此强大的原始力量。金融行业?当然可以。几十年来,我们看到来自高盛的领导者在每个政府的内阁和经济团队中轮换,我

阅读更多
使用 LangChain + Streamlit + *o1、GTP-4o 和 Claude 3.5 编写 RAG LLM 聊天应用程序

使用 LangChain + Streamlit + *o1、GTP-4o 和 Claude 3.5 编写 RAG LLM 聊天应用程序

学习如何使用 Python、Streamlit 和 LangChain 构建 RAG 网络应用,以便您可以与文档、网站和其他自定义数据进行聊天。 GitHub 代码:https://github.com/enricd/rag_llm_app RAG LLM Streamlit 应用:[https://rag\-llm\-app.streamlit.app/](https://rag-

阅读更多
Pydantic AI + Web Scraper + Llama 3.3 Python = 强大的人工智能研究代理

Pydantic AI + Web Scraper + Llama 3.3 Python = 强大的人工智能研究代理

在这个视频中,我将快速演示如何使用 Pydantic AI、Web Scraper 和 Llama 3.3 创建一个多代理聊天机器人,以便为您的业务或个人使用构建一个强大的代理聊天机器人。 在检索增强生成(RAG)和基于大型语言模型(LLM)的工作流中,结构化输出提高了准确性和清晰度,使数据更易于理解。 我们许多人都知道验证或转换数据为正确格式是多么令人沮丧。当处理接口数据时,您会

阅读更多
揭秘PydanticAI:打造高效AI代理的终极利器!

揭秘PydanticAI:打造高效AI代理的终极利器!

PydanticAI 是一个 Python 代理框架,旨在减少使用生成式 AI 构建生产级应用程序的痛苦。 FastAPI 通过提供创新且人性化的设计,彻底改变了 web 开发,其基础是 Pydantic。 同样,几乎所有的代理框架和 Python 中的 LLM 库都使用 Pydantic,然而当我们开始在 [Pydantic

阅读更多
2025 年学习人工智能的最快方法

2025 年学习人工智能的最快方法

为什么短期有效时还要选择长期? 本博客旨在为您提供一条清晰的捷径,让您在AI领域入门的同时探索新的AI产品,以保持您的动力。我不会包含令人不知所措的建议,比如“嘿,您应该开始学习Python,因为它是最常见和流行的编程语言……”或任何图表,如下所示: 大多数搜索**“如何学习AI”**的人立刻会面临诸如ML和DL等术语,这可能会让人感到沮丧,并使AI看起来很困难。然而

阅读更多
Qwen 2.5 Coder 32B:这一最佳开放重量模型是否优于 GPT-4o 和 Claude 3.5 Sonnet?

Qwen 2.5 Coder 32B:这一最佳开放重量模型是否优于 GPT-4o 和 Claude 3.5 Sonnet?

在11月11日,阿里巴巴宣布推出其迄今为止最先进的编码模型:Qwen 2.5-Coder-32B-Instruct。但这并不是全部,它实际上是整个编码模型系列的一部分!除了32B模型,还有0.5B、1.5B、3B、7B和14B参数的版本。在撰写本文之前,我回顾了许多YouTuber、作家和技术专家的反馈,大家的共识 overwhelmingly positive。今天

阅读更多
Qwen 新发布:编码器之王是 Qwen2.5 编码器 32B!

Qwen 新发布:编码器之王是 Qwen2.5 编码器 32B!

大家好!介绍一下 Qwen2.5-Coder-32B-Instruct:最新的 AI 模型正在引领编码界的风潮! 这些模型大多在 Apache 2.0 许可下发布。基准分数高得惊人: ![](https://images.weserv.nl/?url=https://proxy.rifx.online/https://cdn-images-1.readmedium.com/v2

阅读更多
Qwen QVQ-72B:最佳开源图像推理 LLM

Qwen QVQ-72B:最佳开源图像推理 LLM

阿里巴巴的视觉推理 LLM 所以,在2024年底之前,Qwen(由阿里巴巴推出)强势回归,发布了另一个开源 LLM,Qwen QVQ-72B,这是一个视觉推理 LLM,即一个推理模型(类似于 OpenAI-o1),支持对图像输入进行推理。 Qwen QVQ 是 Qwen2-VL 的改进版本,专注于视觉推理 谈谈它的关键特性: 1. 多模态融合**视觉与语

阅读更多
Qwen2.5 1.5b:移动AI的未来?

Qwen2.5 1.5b:移动AI的未来?

本地测试和评估阿里云最新的LLM。使用llama-cpp-python和DIY提示目录。 在第一部分,我们共同探讨了阿里云团队发布的Qwen2.5模型系列的创新。 在生成式AI基准测试中,基准测试现在是主要的oracle:新的LLM的有效性需要通过多个评判。你打破的基准记录越多,你就越优秀。 这是赢得SOTA竞赛的方式。 好吧,我不同意。尽管我们需要里程碑和更好的性

阅读更多
Qwen2.5-Coder 32B Instruct:最佳编码模型--完整的分步指南和性能...

Qwen2.5-Coder 32B Instruct:最佳编码模型--完整的分步指南和性能...

学习如何在本地安装 Qwen2.5-Coder,探索其卓越的编码能力,并通过实践示例评估其性能 介绍 在不断发展的AI驱动编程工具领域,大型语言模型(LLMs)显著改变了开发者编写、调试和优化代码的方式。今天,我们很高兴探索Qwen2.5-Coder系列,这是一项开源的奇迹,承诺在代码生成和AI编码助手领域树立新的标准。该系列的最新版本**Qwen2.5-Coder

阅读更多
Qwen2.5-Coder、Cosmos Tokenizer、OpenCoder 和新的 SentenceTransformers:开放源代码的伟大时代

Qwen2.5-Coder、Cosmos Tokenizer、OpenCoder 和新的 SentenceTransformers:开放源代码的伟大时代

我想强调一些引人注目的开源进展:Qwen2.5-Coder 系列:一个开放源代码的代码 LLM,正在与 GPT-4 竞争。 Cosmos Tokenizer:一套先进的神经分词器,用于高效的图像和视频压缩。 OpenCoder:一个完全开源的代码 LLM,训练于惊人的 2.5 万亿个标记。 **SentenceTransformers 的大幅

阅读更多
Qwen2.5:重新定义大型语言模型的效率

Qwen2.5:重新定义大型语言模型的效率

更智能地扩展和更好地学习与强化学习 语言模型的新纪元:介绍 Qwen2.5 基于大型语言模型(LLMs)的突破,Qwen2.5 处于提高效率和先进学习的最前沿。忠于其指导原则——“更聪明地扩展,更好地学习,通过强化学习”——Qwen2.5 被设计用来解决模型性能、与人类偏好的对齐以及成本效益等紧迫问题。 无论您是在探索基本的问答功能,还是在推动复杂的

阅读更多
Qwen2-VL:本地运行的视觉语言模型

Qwen2-VL:本地运行的视觉语言模型

这是对「Qwen2-VL」的介绍,这是一种可以与 ailia SDK 一起使用的机器学习模型。您可以轻松使用此模型创建 AI 应用程序,利用 ailia SDK 以及许多其他现成的 ailia MODELS.

阅读更多
使用自定义工具构建和服务 RAG 代理:完整指南

使用自定义工具构建和服务 RAG 代理:完整指南

目标 本文的目标是演示如何使用 LangGraph 和 LangChain 创建一个大型语言模型(LLM)代理,该代理将在一组文档上执行检索增强生成(RAG)。此外,我们将探讨如何构建一个工具,以便进行 API 调用,从而使 LLM 能够从外部来源获取实时知识。最后,我们将使用 Flask API(FastAPI)在本地提供此代理,并使用本地 PostgreSQL 数据库服务器存

阅读更多
RAG/LLM 和 PDF:使用 PyMuPDF 转换为 Markdown 文本

RAG/LLM 和 PDF:使用 PyMuPDF 转换为 Markdown 文本

以Markdown文本格式输入数据可以提高生成文本的质量 介绍 在大型语言模型(LLMs)和检索增强生成(RAG)环境中,以markdown文本格式输入数据具有重要意义。以下是一些详细考虑因素。 LLMs 是强大的语言模型,可以生成连贯且具有上下文相关性的文本。然而,它们有时可能会产生缺乏事实准确性或上下文的响应。通过结合基于检

阅读更多
RAGate:用于对话式人工智能的自适应 RAG

RAGate:用于对话式人工智能的自适应 RAG

构建对话 AI 系统是困难的!!! 这虽然可行,但也复杂、耗时且资源密集。 挑战在于设计能够理解和生成类人响应的系统,并确保这些系统能够有效地与用户互动,适应对话的细微差别。 非常流行的**RAG(检索增强生成)**通过将外部知识与 LLM 的内部知识无缝集成,彻底改变了对话 AI。通过将 RAG 应用于您的商业数据,您的客户可以用自然语言询问他们的数据,从而促进无缝互动。

阅读更多
RAGFlow 一种开源检索增强生成(RAG)引擎

RAGFlow 一种开源检索增强生成(RAG)引擎

RAGFlow 是一个开源的检索增强生成 (RAG) 引擎,能够与大型语言模型 (LLMs) 集成,从复杂的数据格式中提供准确的、带有引用的答案。RAGFlow 开发者文档 提

阅读更多
RBYF:Qwen2.5–3B-instruct 非常棒。

RBYF:Qwen2.5–3B-instruct 非常棒。

修订基准:以您为反馈的全新3B模型来自阿里巴巴Qwen,是个令人惊叹的模型,我可以证明这一点! 涌现属性的错觉在很大程度上是评估这些模型所使用的指标的产物。这是一个事实。 几周前,我决定做一个小反叛,放弃所有官方基准,开始自己做基准测试! 这就是这个完全虚构的首字母缩略词RBYF的意义:以您为反馈的修订基准。其基本原则是,没有比您更好的评判者来验证一个大型语言模型的优劣。 老

阅读更多
使用 Magentic-One 多代理人工智能系统阅读文档和编码功能

使用 Magentic-One 多代理人工智能系统阅读文档和编码功能

Magentic-One 旨在通过利用多个具有专业能力的 AI 代理来简化复杂任务。我之前的一篇文章 也介绍了 Magentic-One。最近,我开始开发一个移动应用程序(名为“MotionLab”),

阅读更多
利用人工智能代理团队进行负责任的软件开发

利用人工智能代理团队进行负责任的软件开发

软件开发长期以来依赖于手动操作和孤立的工具链来构建产品。我们逐渐引入自动化来处理持续集成 (CI) 流程中的重复任务,并使用像 ReSharper 和 CodeRush 这样的代码生成工具来加速编码中的重复任务。然而,随着 AI 的发展,我们可以获得工具来帮助从提示中创建小型 POC,现在我们可以想象一个未来,在这个未来中,“自主 AI” 系统将在我们的软件开发生命周期 (SDLC) 中

阅读更多
检索增强生成:方法、最新进展和优化策略

检索增强生成:方法、最新进展和优化策略

⭐ RAG 在知识密集型场景或需要持续更新知识的特定领域应用中尤其有用。最近,RAG 因其在对话代理中的应用而受到广泛关注。 📌 参考研究主要集中在当前的 RAG 方法及其不同组件、最新进展(SOTA)、应用、检索、生成、增强技术的评估上。 随着 RAG 系统从简单到高级再到模块化的演变,每个阶段都是为了应对特定用例的增强而出现的。 ![](https://images.wese

阅读更多
基于智能工作流的金融文档处理自动化解决方案

基于智能工作流的金融文档处理自动化解决方案

金融文档如 SEC 10-K 报告通常复杂且繁琐,但通过合适的工作流,整个过程可以得到改造。我开发了一种集成 Phidata、n8n 和 Qdrant 的简化解决方案,以自动化金融文档分析。该工作流无缝处理报告,提取精确且结构化的见解,并将其存储在 Qdrant 中,这是一种强大的向量数据库,能够实现高级搜索和检索功能。结果是处理金融数据的方式更加快速、高效,使决策者能够获取和利

阅读更多
2025 年成为人工智能工程师的路线图

2025 年成为人工智能工程师的路线图

如何在2025年成为AI工程师 有没有想过构建能够思考、学习和解决复杂问题的系统需要什么?几年前,我也很好奇——AI是一个未来主义的概念,我不知道从哪里开始。现在,随着我们迈入2025年,成为AI工程师比以往任何时候都更加容易。如果你在这里,你可能对如何从零开始进入这个领域感兴趣。好消息是?不需要成为计算机天才或数学奇才。只需一个清晰的路线图、奉献精神和正确的资源,你就能做到。

阅读更多
人工智能在加密货币交易和分析中的作用

人工智能在加密货币交易和分析中的作用

人工智能在加密货币交易与分析中的作用 加密货币交易可能是当今最具动态性和波动性的金融市场之一。该市场的特点是波动性较大,但在各个方面都高度依赖数据。 加密货币交易中的人工智能 人工智能基本上是指计算机系统,它们在学习数据、决策和预测方面模仿人类智能。这可以用于分析与加密货币趋势相关的大量数据。 AI在加密交易中的关键应用 1.市场情绪分析 它们基于

阅读更多
多代理协调中的角色扮演与对话范例

多代理协调中的角色扮演与对话范例

在多智能体编排框架的设计中,出现了一个显著的二分法,即角色扮演与对话两种主要范式。这些范式代表了在多智能体交互和任务执行中实现协作效率的不同方法。在本文中,我们将探讨这些范式的性质及其影响、推动其发展的力量,以及其他丰富多智能体编排领域的新兴方法。 但这真的是一个简单的二元对立吗? 当然不是!角色扮演框架,以 [CrewAI](https://readmediu

阅读更多
RooCline:AI开发的新利器,如何提升你的效率?

RooCline:AI开发的新利器,如何提升你的效率?

喜欢Cline但希望获得更高的速度和自主性?RooCline是流行的VS Code AI助手的强大分支,将Cline的所有优点进行了增强,提供了更高的性能、更多的功能和更大的灵活性。“RooCline最近主要在自我编写,偶尔有些人类的指导。”RooCline 有何不同之处?⚡️ 1. 增强功能智能通知:仅在需要关注时接收系统警报 多语言支持:

阅读更多
使用 O1、GPT4o 和 Mini | ExtractThinker 扩展文档提取功能

使用 O1、GPT4o 和 Mini | ExtractThinker 扩展文档提取功能

在本文中,我们将探讨如何高效地使用 ExtractThinker 来处理大规模文档。我们将讨论何时使用不同的模型,如 O1、GPT4o 及其迷你版本,如何处理 OCR,提取图表,并使用异步批处理管理重负载。 ExtractThinker 介绍 是一个灵活的文档智能库,帮助您从各种文档中

阅读更多
SearchGPT 彻底改变了我的上网方式。

SearchGPT 彻底改变了我的上网方式。

我告别了谷歌,你也可以。学习如何使用 SearchGPT,改变你的工作方式。 这不是点击诱饵。我完全相信 SearchGPT,我将告诉你原因。这篇文章既是你应该开始使用 SearchGPT 的宣言,也是关于如何最佳使用它的全面指南。 无论你是 SearchGPT 的新手,还是稍微尝试过,或者已经是高级用户,我保证你会在这里找到有用的东西。这篇文章有点长,但它可能是你在 202

阅读更多
六顶思考帽 + CrewAI 流程:利用人工智能农业做出更明智的决策

六顶思考帽 + CrewAI 流程:利用人工智能农业做出更明智的决策

“当时看起来是个好主意。”- 摘自 *大西部七侠*利用AI代理进行明智决策 “当时看起来是个好主意。”这句台词借自《七侠荡寇志》,常常是我们在反思过去决策时的共同感受。有时,我们不禁想,如果有更多的信息,是否能帮助我们做出更好的选择。但是,我们到底是如何做出决策的呢?我们依赖于自己的知识——存储在脑海中的信息,也许是经过索引和归档的——以及专家的见解。但

阅读更多
Sky-T1-32B-预览:开源 LLM 性能优于 OpenAI-o1

Sky-T1-32B-预览:开源 LLM 性能优于 OpenAI-o1

UC Berkeley的Sky-T1–32B-预览详情 所以,首个大型生成性AI发布来了,UC Berkeley开源的LLM Sky-T1–32B在数学和编码基准测试中超越了OpenAI的o1。 什么是 Sky-T1–32B-Preview? 它是一个 32-亿-参数推理模型,旨在在数学推理和编码任务中表现出色。 关键特性 1\

阅读更多
更智能、更快速:OpenAI o1 和 o1 pro 模式

更智能、更快速:OpenAI o1 和 o1 pro 模式

就在12小时前,OpenAI推出了新的o1模型和带有专业模式的o1。如您所知,o1模型是首个在回答之前进行思考的模型系列,提供更详细和准确的响应,特别是在数学、编码和研究方面。 人们关注两件事:多模态性和解决难题,而这些新模型在这两个领域表现出色。[非会员链接。](https://readmedium.com/smarter-and-faster-openai-o1

阅读更多
Smolagents + Web Scraper + DeepSeek V3 Python = 强大的人工智能研究代理

Smolagents + Web Scraper + DeepSeek V3 Python = 强大的人工智能研究代理

在这段视频中,我将快速演示如何使用 Smolagents、Web Scraper 和 DeepSeek V3 创建一个多代理聊天机器人,为您的业务或个人使用提供强大的代理聊天机器人。 如果您关注 AI 社区,您可能已经注意到许多关于 Nvidia 的病毒视频,其中宣布的 AI 代理价值十亿美元,或者您可能听说过 Zark 说我们明年不会招聘中级工程师。 我问自己,这怎么会发生?当我开

阅读更多
SmolLM2:Qwen2.5 和 Llama 3.2 的最佳替代品

SmolLM2:Qwen2.5 和 Llama 3.2 的最佳替代品

而且它是完全开放的! Hugging Face 加大了对 SmolLM 计划的投入。 他们发布了 SmolLM2:1.7B、360M 和 135M 模型,训练于 11T 令牌(相比 SmolLM 的 1T)。他们发布了基础版和指导版:Hugging Face Collection: [SmolLM2](https://huggingface.co/collections/

阅读更多
语音转语音生成AI:理论与实践的惊人飞跃!

语音转语音生成AI:理论与实践的惊人飞跃!

探索语音到语音生成型人工智能的世界。了解构建应用程序的关键组成部分和实际考虑因素 介绍 生成性人工智能是当今最具变革性、快速发展的广泛应用技术之一。其影响力的一个关键原因在于它能够使人类使用自然语言与计算机进行沟通,从而使交互变得简单而直观。这种能力促进了它在日常生活和多个行业中的应用,涵盖了教育、医疗到娱乐等多个领域。 我们的交互方式最初是通过文本,依赖于大型语言模型(LLMs

阅读更多
SpiderTool 和 CrewAI:网络抓取和数据提取的终极组合

SpiderTool 和 CrewAI:网络抓取和数据提取的终极组合

Ankush k Singal 介绍 在网络爬虫和数据提取方面,SpiderTool和CrewAI是天作之合。SpiderTool以其强大的抓取和爬行能力而闻名,与旨在简化和扩展您的抓取项目的CrewAI平台完美结合。 ![](https://wsrv.nl/?url=https://cdn-image

阅读更多
用户体验现状,我们不需要更多的管理者,利用数据进行原型设计

用户体验现状,我们不需要更多的管理者,利用数据进行原型设计

每周为设计师精选的资源 —— 思考者和创造者。 我们在这里讨论的变化并不是一场革命,而只是一种进化。这仅仅是在所需角色数量及其职责上的变化。Jorge Arango 最近写道:“数字系统,而不是人,将完成大部分(屏幕级别)交互设计的工艺。” 每当这种变化发生时,行业都会重新调整以适应新的模式。 [2025 年 UX 的状态:一封关于变化的情书](https://tr

阅读更多
使用 ChatGPT 4o 的视觉分析逐步生成旅程中期提示

使用 ChatGPT 4o 的视觉分析逐步生成旅程中期提示

你是否有过这样的感觉:想要创建完美的 Midjourney 提示,但言辞却无法表达你脑海中的想法?我也经历过这样的时刻。在无数小时的实验后,我发现了一种改变游戏规则的方法:利用 ChatGPT 4o 的视觉能力分析参考图像并生成精准的提示。 让我分享我的旅程和我使用的确切过程。相信我,这将改变你创建 AI 艺术的方式。 灵光一现 💡 我曾经花费数小时描述我想要的内容给 Mi

阅读更多
使用语言模型生成合成数据:实用指南

使用语言模型生成合成数据:实用指南

在人工智能不断发展的领域中,数据仍然是推动创新的燃料。但是,当获取真实世界数据变得困难、昂贵,甚至不可能时,会发生什么呢? 合成数据生成应运而生——这是一种开创性的技术,利用语言模型创建高质量、逼真的数据集。考虑在不违反隐私法的情况下对医疗记录进行语言模型训练,或者在没有私人对话记录的情况下开发客户互动模型,或设计自动驾驶系统,其中收集稀有边缘案例的数据几乎是不可能的。合成数据弥补了数

阅读更多
驯服工具乱象:生成式人工智能代理和工具注册表

驯服工具乱象:生成式人工智能代理和工具注册表

管理生成式 AI 代理工具的实用指南 概述 生成式AI代理积极与其环境互动以实现目标,严重依赖工具。随着企业的扩展,它们使用的代理往往会积累数十、数百甚至数千种不同类型的工具——数据工具、代码工具、API等——这使得有效管理成为一项重大挑战。本文重点介绍工具注册表,这是管理生成式AI代理所使用工具的关键组成部分。它解释了为什么中央工具目录是必不可少的,以及它如何改善可重

阅读更多
教人工智能像 6ᵗʰ Grader 一样思考,像孩子一样学习

教人工智能像 6ᵗʰ Grader 一样思考,像孩子一样学习

为什么我们必须让人工智能重新拥有它的游乐场——想象力、混沌与一点魔法 如果你问一个六年级学生他们将如何解决像气候变化这样全球性的问题, chances are you won’t get a textbook answer. 他们可能会给出一些完全出乎意料的答案——也许是一个违背规则和法律的解决方案,或者只是违反逻辑。但你不得不承认,这种不可预测性中蕴含着智慧。这不是关于正确与否;而

阅读更多
测试 OpenAI 的 o1 模型:新闻任务的思维链提示概览

测试 OpenAI 的 o1 模型:新闻任务的思维链提示概览

新的大型语言模型被称为更聪明的问题解决者——但它们在数据可视化和标题选择等实际新闻任务中表现如何? 上个月,OpenAI 发布了两个新的大型语言模型:o1-preview 和 o1-mini。这些被公司称为 “推理模型”,与我们迄今为止看到的大型语言模型有着重要的区

阅读更多
6 种最佳本地运行模型的 LLM 工具

6 种最佳本地运行模型的 LLM 工具

运行大型语言模型(LLMs)如 ChatGPT 和 Claude 通常涉及将数据发送到由 OpenAI 和其他 AI 模型提供商管理的服务器。虽然这些服务是安全的,但一些企业更倾向于将其数据完全离线,以获得更高的隐私保护。 本文

阅读更多
能将 Docker 容器大小减少 80% 的人工智能工具

能将 Docker 容器大小减少 80% 的人工智能工具

如何通过 Docker Shrink 优化容器并节省时间和金钱 在容器化应用主导的现代范式中,有效处理 Docker 容器是开发人员和组织面临的主要问题之一。这导致了大型 Docker 镜像,从而造成更高的存储费用、较长的构建时间以及生产环境中的其他问题。 Docker Shrink 是解决这些问题的新方案,它是一个创新工具,利用人工智能来解决这些问题。作为一个亲身经历过大型 D

阅读更多
最适合老年人的对话式人工智能虚拟医疗助理

最适合老年人的对话式人工智能虚拟医疗助理

随着年龄的增长,照顾我们的健康变得更加困难,对于独居的老年人来说,这种情况更为严重。虽然对于许多老年美国人来说,管理药物、就医和整体健康成为了一项挑战。但是,如果你有一个伴侣——一个能帮助你按时吃药、在你感到孤独时给你打电话,甚至询问你近况的人,你会怎么想呢?这就是虚拟健康护理助手的魅力,它们正在为老年人的医疗保健带来革命性的变化。 像 [MiiHealth.ai](https:/

阅读更多
现代人工智能的核心:知识图谱和矢量数据库

现代人工智能的核心:知识图谱和矢量数据库

在快速发展的人工智能领域,检索增强生成(RAG)系统因其能够通过从外部数据库检索相关信息来增强传统人工智能模型而日益受到欢迎。这项技术的核心是两个关键工具——知识图谱和向量数据库——它们以根本不同的方式运作,但相辅相成,以解决各种问题。 为了理解它们的重要性,让我们来分析它们的概念、差异、优势,以及它们如何重塑各个行业。 1. 知识图谱:连接的基础

阅读更多
焦点正从人工智能代理转向人工智能代理工具的使用

焦点正从人工智能代理转向人工智能代理工具的使用

关于AI代理的关注点正在从单纯开发自主AI代理转向增强可供它们使用的工具,这直接影响到它们的能力和灵活性。 AI代理的功能和范围在很大程度上依赖于工具的访问,工具以自然语言描述,并通过代理的内部推理激活。 桌面和其他用户特定环境提供了代理有效执行任务所需的丰富上下文,使它们成为理想的操作空间。 ✨✨ 在 LinkedIn 上关注我 ✨✨ 介绍 随着模型成为实用工

阅读更多
ChatGPT 的未来解析:未来 5 年一切都将改变

ChatGPT 的未来解析:未来 5 年一切都将改变

这可能会让人工智能走得更远…… OpenAI已经制定了一个清晰的愿景,来指导ChatGPT的演变,最近公布了一个五步路线图,以实现他们所称的人工通用智能(AGI)。 AGI代表一种理论上的人工智能系统,能够学习、理解和执行任何智力任务,其能力达到人类水平,且完全自主和适应性强。 这是一个开创性的愿景,但实现这一雄心勃勃的目标需要经历

阅读更多
搜索的未来:人工智能搜索引擎的工作原理

搜索的未来:人工智能搜索引擎的工作原理

厌倦了 Google 的错误答案?了解 AI 如何让网络搜索更智能、更好! 想象一下:你在 Google 中输入一个问题,但得到的却不是正确的答案,而是点击了一堆无关的链接。令人沮丧,对吧?搜索引擎确实已经通过机器学习和自然语言处理等工具取得了长足的进步,帮助它们提供更好的结果。但即便有了这些改进,它们仍然主要是被动的,等待你提出问题。它们是反应式的,仅在你输入查询时才作出回应,并

阅读更多
技术岗位大迁移即将来临

技术岗位大迁移即将来临

技术职位观察 关于工作如何适应新技术环境的必要知识 11月科技职位观察 还不是会员?您可以在 这里 免费阅读。 如果您一

阅读更多
史上最雄心勃勃的人工智能加密项目来了

史上最雄心勃勃的人工智能加密项目来了

AI & 区块链:天作之合,还是骗局? 现代人工智能的奠基人之一希望利用区块链训练全球最大的开源大型语言模型(LLM),其规模几乎是 Llama 3.1 405B 的四倍,后者通常被认为是最佳的开放 LLM。 在你将这个标题视为欺诈性炒作之前,请注意,这一目标的提出者正是 Illia Polosukhin,他是“Attention is All you Need”

阅读更多
文档智能的多代理革命:Sema4.ai 的

文档智能的多代理革命:Sema4.ai 的

本文由 Sunil Govindan 共同撰写,他对 AI 驱动的文档处理提供了见解和专业知识。Sema4.ai 文档智能多代理系统 自去年年底将文档智能(DI)作为 Sema4.ai 企业代理平台的一部分推出以来,我们看到企业对转变其以文档为中心的工作流程产生了极大的兴趣。从数小时到数秒。从手动

阅读更多
追求生产质量 Graph RAG:开始容易,完成难

追求生产质量 Graph RAG:开始容易,完成难

克服图形 RAG 生产化的挑战 当我阅读最近在 VentureBeat 上关于 Glean [刚刚在最新融资轮中获得超过 2.6 亿美元的文章](https://venturebeat.com/data-infrastructure/how-to-take-advantage-of-a-generative-tool-fueling-gleans-260m-raise-grap

阅读更多
o3崛起:AGI辩论的新转折点?探索突破与挑战

o3崛起:AGI辩论的新转折点?探索突破与挑战

本周,人工智能社区围绕一个新前沿展开了热烈讨论:OpenAI的“o3”, 这一突破性模型将人工通用智能(AGI)的话题提升到了新的高度。研究人员和行业人士正在辩论,o3的卓越成就——例如在ARC-AGI基准测试中得分87.5%(超越人类平均水平85%)以及在Codeforces上获得2727的评分(使其跻身全球前200+程序员之列)——是否标志着AGI的到来,还是仅仅代表

阅读更多
OpenAI 放弃 Next.js 转而使用 Remix 的真正原因

OpenAI 放弃 Next.js 转而使用 Remix 的真正原因

OpenAI 采取行动背后的惊人原因及其对未来网页开发的影响 过渡介绍 OpenAI 最近在开发者社区引起了轰动,因为它从 Next.js 转向了 Remix。 这一意外的转变让许多人质疑如此重大变化的理由。 但 你能责怪他们吗? 以下是 大多数开发者对 NextJS 的看法,基于 [这篇](https://www.reddit.com/r/nextj

阅读更多
2024 年 RAG 的崛起与演变:年度回顾

2024 年 RAG 的崛起与演变:年度回顾

随着2024年的结束,检索增强生成(RAG)的发展可谓波澜起伏。让我们从多个角度全面回顾这一年的进展。 RAG演变中的关键事件 辩论:“RAG已死,RAG万岁!” 在2024年初,这一年被一些人称为“RAG之年”,尽管这一称谓并未得到普遍认可。然而,全年取得的进展确实证明了这一称号的合理性。在涉及大型语言模型(LLMs)的场景中,RAG始终被证明是不可或缺的角色。然而

阅读更多
人工智能驱动的用户体验的崛起:2025 年平衡自动化与以人为本的设计

人工智能驱动的用户体验的崛起:2025 年平衡自动化与以人为本的设计

如果有一样东西正在改变我们在2024年创造用户体验(UX)设计和进行研究的方式,那绝对是人工智能(AI)。UX专家已经以某种方式将AI融入了他们的日常生活中。这是无可否认的。 在本文中,我们将主要关注AI驱动的UX如何影响并将继续影响现代商业世界。从新的UX相关技术和自动化到个性化。我们将从概述开始,探讨AI如何承担分析用户数据和自动原型制作等任务,以帮助专业人士与用户在情感层面上建立联系

阅读更多
人工智能代理产品经理和人工智能代理工程师的崛起

人工智能代理产品经理和人工智能代理工程师的崛起

想象一个未来,生成式AI不仅仅是响应查询,而是主动解决商业各个方面的复杂问题。这不是科幻小说,而是生成式AI代理迅速逼近的现实。这些代理有望彻底改变公司的运营,并激发一波新的创新,从简化供应链到优化产品开发,再到转变客户互动。 在过去一年多的时间里,我一直在构建生成式AI应用和代理,亲眼见证了这些技术如何深刻重塑商业流程。AI的潜力巨大,从以空前高效处理客户查询的支持代理,到推动商业运

阅读更多
小模型在法律硕士时代的作用

小模型在法律硕士时代的作用

近期的一项研究广泛探讨了小型语言模型(SLMs)在现代人工智能中的作用。该研究对SLMs进行了全面分析,重点探讨了它们的能力、应用及潜在优势,尤其是在与大型模型的对比中。 本研究强调了在需要效率和可解释性的领域中SLMs的重要性,同时也讨论了在大型模型不切实际的具体任务中它们的相关性。 最近的一项研究通过两个角度:合作与竞争,探讨了大型语言模型(LLMs)与小型模型(

阅读更多

更智能的人工智能秘诀:探索模型上下文协议 (MCP)

生成式 AI 模型变得越来越复杂,但在交互中管理上下文的挑战仍然至关重要。模型上下文协议 (MCP) 是一种在与生成式 AI 系统(如 ChatGPT)交互时有效维护和利用上下文的结构化方法。它影响着 AI 系统的技术性能和整体用户体验。 什么是模型上下文协议? 模型上下文协议(MCP)是一套指导方针或机制,允许人工智能系统在会话或对话中记住和管理上下文。它在聊天机器人、个

阅读更多
解锁高效工作流!12款智能代理工具助你突破瓶颈!

解锁高效工作流!12款智能代理工具助你突破瓶颈!

发现如何选择合适的工具来自动化工作流程 披露:我使用 GPT 搜索来收集事实。整篇文章由我撰写。 感谢您与我一起参与这段旅程,我希望在未来的岁月里继续为您提供价值!通过支持我来提供建议。 介绍 在当今快速发展的数字环境中,代理工作流程已成为软件开发人员和寻求效率与可扩展性的企业不可或缺的工具。从自动化日常任务到支持复杂决策,智能工作流工具使团队能够专注于创新而非基础设施。

阅读更多
防止 ChatGPT 破坏内容质量的两大秘诀

防止 ChatGPT 破坏内容质量的两大秘诀

生成式人工智能可以成为优秀的写作助手——但人工智能永远无法替代熟练的人类文案撰写者。 在写作时,我们的目标仅仅是以最快的速度创造尽可能多的内容吗?生产力是唯一重要的吗?还是我们实际上想要实现一些有意义的东西? 自从OpenAI在2022年底推出其臭名昭著的聊天机器人以来,互联网就再也不一样了。许多人将此视为积极的转变,尤其是在商业领域。生成式人工智能的支持者们不断高喊其

阅读更多
人工智能代理框架终极指南:CrewAI vs LangGraph vs PhiData vs Relevance AI

人工智能代理框架终极指南:CrewAI vs LangGraph vs PhiData vs Relevance AI

AI代理开发的领域正在快速演变,多个框架相继出现,帮助开发者和企业构建复杂的AI解决方案。在本综合指南中,我们将深入探讨四个领先的框架:CrewAI、LangGraph、PhiData和Relevance AI。无论你是开发者、企业领导还是AI爱好者,了解这些框架的优势和差异对于做出明智的决策至关重要。 AI代理框架的兴起 随着AI不断改变我们的工作方式,构建和部署AI代理的

阅读更多
云端实验室!如何用云虚拟机试验开源LLM,节省上万刀?

云端实验室!如何用云虚拟机试验开源LLM,节省上万刀?

考虑购买 Mac Mini 或 Mac Pro 来使用开源 LLM 吗?云虚拟机让您可以测试、决策并节省开支。 您是否考虑投资 Mac Mini 或 Mac Pro 来实验开源大型语言模型 (LLM)?在做出重大投资之前,有一种更聪明的方式来测试您的需求:云虚拟机。 从 API 到本地 LLM 的旅程 像许多开发者一样,我的 AI 旅程始于 ChatGPT 和 OpenAI

阅读更多
2025 年十大数据与人工智能趋势

2025 年十大数据与人工智能趋势

Agentic AI、小数据,以及在非结构化数据堆栈时代寻找价值 根据行业专家的说法,2024年注定是生成性AI的丰收年。运营用例正在浮现,技术正在降低准入门槛,而通用人工智能显然就在眼前。 那么……这些事情发生了吗? 嗯,有点。在2024年年底,一些预测已经热乎乎地浮现出来。其余的则需要在烤箱里多待一会儿(我在看你,通用人工智能)。 以下是领先的未来学家和投资者Tomasz

阅读更多
2025 年十大企业技术趋势:平台工程和人工智能代理引领潮流...

2025 年十大企业技术趋势:平台工程和人工智能代理引领潮流...

在预测2025年十大最重要的企业软件技术时,有三个关键要求:它需要真实: 只有在生产环境中展示出其价值的技术才被视为“真实”,并将被纳入此列表。 它需要可访问: 一项技术要成为趋势,必须能够被广泛的企业所接触。仅被少数大型组织利用的技术不符合条件。 它需要有强大的商业影响: 顶尖技术趋势需要在商业层面上产生影响。这通常意味着提升人类生产力、应

阅读更多
2024年最具颠覆性的十大人工智能初创公司

2024年最具颠覆性的十大人工智能初创公司

想象一下,一个电动飞机在你头顶飞过的世界,人工智能能够实时转录医生与患者的对话,使医疗服务更加高效。听起来像是未来科技,对吧?其实,这些人工智能初创公司正在让这一切成为现实。 今年,我们见证了一些真正改变游戏规则的公司,通过开创性的技术推动各个行业向前发展,以我们从未想象过的方式塑造未来。而这些并不是像OpenAI或Mistral这样的知名企业(尽管它们也在颠覆市场!)。不,这份名单关注的是那

阅读更多
2025 年最著名的 21 个 RAG 框架

2025 年最著名的 21 个 RAG 框架

通过高级检索增强生成技术革新人工智能 披露:我使用GPT搜索。整篇文章仍由我草拟。我的写作风格倾向于自信和分析性,相比之前的文章,不依赖于ChatGPT辅助写作。感谢您与我一起参与这段旅程,我希望在未来几年继续为您提供价值!通过支持我来提供建议。 截至2025年1月4日, 免责声明:[类似](https://sebastian-petrus.medium.

阅读更多
您必须了解的 25 个顶级生成式人工智能术语

您必须了解的 25 个顶级生成式人工智能术语

掌握关键概念,以清晰的解释、实际应用和深入的资源在生成性人工智能领域脱颖而出 生成性人工智能确实是各行业中的关键技术;因此,理解生成性人工智能的核心概念对任何技术专业人士及其他领域的人士来说都是至关重要的。以下综合指南涵盖了25个必须了解的生成性人工智能术语,提供清晰的定义、实际的例子和其他资源,以加深您的知识。无论是为面试做准备、参与人工智能项目,还是跟上这个快速变化领域的动态,

阅读更多
面向 iOS 开发人员的 5 大人工智能工具

面向 iOS 开发人员的 5 大人工智能工具

提高工作流程速度与效率 虽然关于人工智能的讨论很多,但我想让你回归现实。无论你是否已经在使用 AI 辅助的编码工具,或者觉得这一切都是无稽之谈……这篇标题吸引眼球的文章可能适合你。 虽然你可能已经能找到很多关于如何使用各种工具来提高你的技能、效率和准确性的文献,但对于我们 iOS 开发者来说,这要复杂一些。因为我们依赖 Xcode 及其工具链来构建我们的应用,所以我们很难不使用

阅读更多
利用提示自动执行日常任务和工作流程的 5 大 MCP 服务器

利用提示自动执行日常任务和工作流程的 5 大 MCP 服务器

自从 Anthropic 将 Model Context Protocol (MCP) 引入 Claude 以来,它彻底改变了我们自动化重复任务的方式。从文件管理到社交媒体工作流程,MCP 服务器 让您能够将 Claude 连接到强大的工具,如 GitHub、Slack 和 Google Maps。这些集成帮助您节省时间、简化工作流程,专注于最

阅读更多
2025 年 7 大人工智能网站构建工具

2025 年 7 大人工智能网站构建工具

创建网站从未如此简单,对吧? 我知道,2025年的一切似乎都可以通过几次点击完成! 但让我告诉你,尽管变得简单,作为设计师仍然面临挑战。设计网站总有一种深刻的个人感受,就像把自己的一部分融入作品中。这不仅仅是颜色、字体或布局!而是创造一种体验。 但接下来,有了AI。 想象一下,坐在桌子前,紧迫的截止日期逼近,而不是在每个细节上花费数小时甚至数天,你身边有一个**AI网站构

阅读更多
2025 年引领商业变革的八大人工智能应用案例

2025 年引领商业变革的八大人工智能应用案例

探索推动商业成功的关键AI应用。 人工智能(AI)正日益塑造商业的未来,其影响力在各个行业不断扩大。到2025年,AI不仅将成为创新的工具,更是商业转型的重要驱动力。从客户支持到预测分析,AI在提高效率、降低成本和促进新增长机会方面取得了显著进展。随着AI的不断发展,企业越来越依赖于它来简化运营、增强决策能力和创造个性化的客户体验。 [AI技术](https://

阅读更多
2025 年最值得关注的人工智能和技术趋势

2025 年最值得关注的人工智能和技术趋势

欢迎来到2025年,这一年承诺重新定义我们对科技的思考。人工智能(AI)已经从一个时尚话题转变为推动一切的无形力量,从个性化医疗到更智能的城市基础设施。如今,它是创新的支柱,以我们刚刚开始理解的方式无缝地融入我们的生活。 但我们接下来要去哪里呢?请跟随我一起探讨那些有可能以惊人方式塑造我们世界的AI和科技趋势。 1. AI代理正在接管(以积极的方式) 准备好迎接那些不仅能回

阅读更多
利用 Pydantic AI 实现智能自主研究代理

利用 Pydantic AI 实现智能自主研究代理

在技术进步的步伐要求不断学习和适应的时代,拥有一个智能助手来承担研究的重担不仅仅是一种奢侈——它正逐渐成为一种必需品。独立企业家、研究人员甚至普通学习者常常会被大量的信息所淹没。这就是由人工智能驱动的研究代理发挥作用的地方,它们不仅承诺提高效率,还能深入理解复杂主题。 代理系统的重要性 AI agents 并不新颖;它们的应用遍及客户服务聊天机器人、推荐引擎和个人助手,如 Si

阅读更多
用于情感分类的传统人工智能与生成式人工智能

用于情感分类的传统人工智能与生成式人工智能

5种文本分类的方法(即使没有训练数据) 介绍 本文重点讨论来自Flipkart客户评论数据集的产品评论情感分析。 情感分析是自然语言处理(NLP)中的一项关键任务,

阅读更多
将任何文档转化为人工智能就绪的 Markdown:微软 MarkItDown + Azure OpenAI 指南

将任何文档转化为人工智能就绪的 Markdown:微软 MarkItDown + Azure OpenAI 指南

开发者的实用指南:使用微软最新的开源工具与 Azure OpenAI 集成,将 PDF、Office 文件和图像转换为干净的 Markdown 微软的 MarkItDown 是一款由 AutoGen 团队开发的新开源工具,可以将各种文档格式转换为 Markdown。虽然该工具可以独立工作,但将其与 Azure OpenAI 集成可以增强其功能,特别是在图像处理任务方面。

阅读更多
将数据转化为解决方案:使用 Python 和人工智能构建智能应用程序

将数据转化为解决方案:使用 Python 和人工智能构建智能应用程序

一些金融分析师担心人工智能可能无法证明在该领域进行的大规模投资的合理性。虽然我理解他们的担忧,但我的看法有所不同。我既不是AI的乐观派,也不是悲观派——我相信AI有潜力推动创新、提升生产力,并带来可衡量的商业成果。 在我上一篇文章中,我探讨了大型语言模型(LLMs)如何用于结构化非结构化数据。这一次,我想更进一步:展示使用LLMs进行数据结构化的结果如何作为构建智能应用的基础。从而

阅读更多
跨 ChatGPT、Claude、Perplexity 的统一内存

跨 ChatGPT、Claude、Perplexity 的统一内存

你一定会喜欢这个,特别是如果你已经与 Claude、ChatGPT 和 Perplexity 紧密联系在一起。 与不同的 AI 助手互动有时会感觉有些脱节。 在切换 ChatGPT、Claude、Perplexity 和其他助手时,你必须一遍又一遍地重复相同的上下文。 如果它们都能共享一个通用记忆以增强上下文,那该多好啊? 我发现了这个很棒的 Chrome 扩展,它对我来说真是个救星。

阅读更多
释放人工智能的潜能:思维链提示的力量

释放人工智能的潜能:思维链提示的力量

像人类一样思考的AI 你是否曾对ChatGPT能够迅速回应感到惊讶,但又对其回答有时显得肤浅或不完整感到失望?你可能会得到一个完美的事实或快速的解决方案,但你会想知道——它是如何得出这个结论的? 这就是**思维链提示(CoT)**的用武之地。 想象一下你正在解决一个数学问题。你不会只是喊出一个答案——你会一步一步地进行推理。CoT对AI的工作方式也是如此。它教会像Cha

阅读更多
解开复杂的人工智能任务:使用 Gemini 2.0、LangGraph 和 Grounded Responses 的多步骤代理

解开复杂的人工智能任务:使用 Gemini 2.0、LangGraph 和 Grounded Responses 的多步骤代理

如何构建不仅理解复杂请求而且能够执行必要步骤以满足这些请求的 AI? 本文探讨了一种强大的解决方案:由 Gemini 2.0 和 LangGraph 框架驱动的多步骤 AI 代理。这些代理协调复杂的工作流程,并通过基于实际数据的响应增强其推理能力,从 Google 搜索、BigQuery 和第三方 API 获取真实世界的数据。 今日的挑战 第一个重大突破是 LLM。想象一下一

阅读更多
解锁混合专家 (MoE) LLM:你的 MoE 模型可以免费嵌入模型

解锁混合专家 (MoE) LLM:你的 MoE 模型可以免费嵌入模型

Mixture-of-experts (MoE) LLM 可以作为免费的嵌入模型使用。 我最近发现了一篇有趣的论文,标题为“你的 Mixture-of-Experts LLM 秘密地是一个免费的嵌入模型。”[1] 最近的 LLM 架构趋势是解码器模型,这对于嵌入模型并不适用,因为它们的注意力方法。然而,作者揭示了 Mixture-of-Experts (MoE) LLM 可以作

阅读更多
使用 Markdown 和 Gemini 为 RAG 解锁 PDF

使用 Markdown 和 Gemini 为 RAG 解锁 PDF

可以说,检索增强生成(RAG)为许多企业和组织带来了变革。通过将像 Gemini 这样的 LLM 的内置功能与您自己的信息相结合,您可以创造出真正具有变革性的强大体验。 尽管如此,创建一个能够很好处理复杂非结构化文档(如 PDF)的 RAG 应用程序仍然是一个挑战。 **本文提出了一种从

阅读更多
使用 Gemini 2.0 通过多模态实时 API 构建实时聊天应用程序

使用 Gemini 2.0 通过多模态实时 API 构建实时聊天应用程序

Gemini 开发教程 谷歌推出了 Gemini 2.0 及其预览模型 Gemini 2.0 Flash Experimental,您一定通过视频和文章了解过它。该模型在所有基准测试中大幅超越了其前身 Gemini 1.5 Pro,并且对所有人免费使用,但在 Google AI Studio 中有一些限制。如果您对 Gemini 2.0 有经验或看过关于 Google

阅读更多
使用代理为 NPC 注入活力 | 作者:MichaelT Shomsky | 2024年12月 | Medium

使用代理为 NPC 注入活力 | 作者:MichaelT Shomsky | 2024年12月 | Medium

大纲模拟2D社会 创建一个2D俯视视角的平台游戏 设置具有个人历史的非玩家角色 开始一个框架,以允许NPC在2D可玩空间中自我行为 Github仓库 结果/结论模拟二维社会 模拟世界对我来说非常重要,以至于在我本科时,我为一个物理小组模拟了聚合物,并为我的导师小组编写了自由空间中的光传播代码。这种“想要模拟”的愿望无疑受到我荣誉工程课程的指导;因

阅读更多
《如何用CrewAI让NPC活灵活现?惊爆游戏体验的秘密!》

《如何用CrewAI让NPC活灵活现?惊爆游戏体验的秘密!》

大纲使用 CrewAI 过滤对话并允许 NPC 选择任务 CrewAI 代理 游戏代码和数据文件 Github 仓库 结果/结论背景 之前我在我的文章 使用智能体为NPC注入生命 中讨论了我对模拟二维社

阅读更多
使用 CrewAI 为 NPC 注入生命--初步对话分析

使用 CrewAI 为 NPC 注入生命--初步对话分析

对话分析使用输出来自:使用代理通过 CrewAI 为 NPC 赋予生命 分析模拟1:软件工程师、计算机科学家、计算机工程师的群体 结论 支持分析方法提取的特征 拆

阅读更多
使用 Llama 3 构建 AI 代理

使用 Llama 3 构建 AI 代理

构建具有 Llama 3 函数调用能力的 AI 代理的综合指南 引言 想象一下你想买一些东西。你访问一个电子商务网站,使用搜索选项找到你想要的东西。也许你有多个物品要购买,因此这个过程并不是很高效。现在考虑这个场景:打开一个应用程序,用简单的英语描述你想要的东西,然后按下回车。你不必担心搜索和价格比较,因为应用程序会自动为你处理这些事情。很酷,对吧?这正是我们将在本教

阅读更多
垂直AI代理:将引爆3000亿美元科技浪潮的颠覆性力量!

垂直AI代理:将引爆3000亿美元科技浪潮的颠覆性力量!

想象一个由AI代理管理整个业务功能的世界——无需人工干预。这听起来像科幻小说吗?其实离我们并不远。在过去的二十年里,我们见证了SaaS(软件即服务)的迅速崛起,出现了超过300个SaaS独角兽。但我们现在正进入一个新的范式,垂直AI代理的规模、价值和颠覆潜力可能会超越SaaS。 在未来五年内,我们可能会看到由AI驱动的企业,员工不足10人却能创造数十亿美元的收入。影

阅读更多
可视化你的 RAG 数据——使用 Ragas 评估你的检索增强生成系统

可视化你的 RAG 数据——使用 Ragas 评估你的检索增强生成系统

如何使用 UMAP 降维将嵌入可视化以展示多个评估问题及其与源文档的关系,结合 Ragas、OpenAI、Langchain 和 ChromaDB 检索增强生成(RAG)在 LLM 的工作流程中增加了一个检索步骤,使其能够在回答问题和查询时,从私人文档等额外来源查询相关数据 [1]。该工作流程不需要对额外文档进行昂贵的训练或微调。文档被拆分成片段,然后进行索引,通常使用紧凑的 M

阅读更多
什么是人工智能代理?从虚拟助理到智能决策者

什么是人工智能代理?从虚拟助理到智能决策者

从零开始理解AI代理的指南 最近,从基于LLM的聊天机器人转向该领域现在定义为代理系统或代理AI的变化可以用一句老话来总结:“少说多做。” 跟上技术进步可能令人畏惧,尤其是当你已经有一个现有的业务时。更不用说技术进步的速度和复杂性可能会让你感觉像是开学的第一天。 本文提供了基于其组件和特征的AI代理概述。引言部分涵盖了构成“AI代理”一词的组件,以创建一个直观的定义。在建立

阅读更多
什么是人工智能代理?构建自己的人工智能代理的分步指南。

什么是人工智能代理?构建自己的人工智能代理的分步指南。

下一个大趋势? Gartner认为AI代理是未来。OpenAI、Nvidia和Microsoft对此寄予厚望——包括Salesforce等公司,它们在AI领域迄今为止表现得相对低调。 毫无疑问,这一事物现在正在迅速发展。 ![](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1

阅读更多
内容创作者必须了解的 2025 年利用人工智能进行搜索引擎优化的知识

内容创作者必须了解的 2025 年利用人工智能进行搜索引擎优化的知识

从 SEO 专家那里了解洞见和未来趋势。 随着 2024 年接近尾声,让我们花点时间回顾一下今年在 AI 和 SEO 领域发生的巨大变化。 还记得 10 月 28 日的 重大新闻 吗?AI 概览在超过 180 个国家推出。 我永远

阅读更多
2025 年应关注哪些 GenAI 主题?

2025 年应关注哪些 GenAI 主题?

今年的生成式人工智能趋势 2025年已经过了几天,生成式人工智能的浪潮看起来势不可挡。2024年我们经历了许多激动人心的时刻,LLMs、框架、机制等以子弹般的速度发布。 那么2025年会有什么期待? 1. 小型 LLMs 忘掉那些消耗你所有 GPU 能力的大型模型吧。我们正朝着更小、更高效的语言模型迈进,这些模型依然强大。这些精简的模型更易于部署,运行成本更

阅读更多
Claude Sonnet 3.5 和 Claude 3.5 Haiku 有哪些新功能?

Claude Sonnet 3.5 和 Claude 3.5 Haiku 有哪些新功能?

首先,Claude是什么? Claude是由Anthropic创建的语言模型,旨在帮助完成诸如回答问题、总结信息和生成文本等任务——类似于ChatGPT。Claude的一个优点是它被设计得更安全,更符合人类意图,因此生成有害或误导性内容的可能性较小。 等等…

阅读更多
我应该使用哪种人工智能代理框架?(CrewAI、Langgraph、Majestic-one 和 pure code)。

我应该使用哪种人工智能代理框架?(CrewAI、Langgraph、Majestic-one 和 pure code)。

随着大型语言模型的进步,人工智能模型现在能够对问题进行推理。起初,我们认为这些模型无法完成我们的工作,因为它们似乎只是搜索引擎的聊天机器人版本,我们能够用简单的推理来欺骗这些模型,但这变得越来越困难。这些大型语言模型现在能够逐步思考,并完成比简单回答问题更复杂的任务。 大型语言模型是通过预测前一个标记的下一个标记进行训练的。标记可以是单词、字符或称为子词的字符组。从这个结构,OpenA

阅读更多
使用哪种人工智能代理框架?LangChain?AutoGen?9 种常用框架说明!

使用哪种人工智能代理框架?LangChain?AutoGen?9 种常用框架说明!

开发 AI 代理涉及选择合适的框架,以满足项目的需求,无论是基本任务、二次开发还是企业级集成。本指南探讨了多个框架——Coze、Dify、FastGPT、MetaGPT、AutoGen、Spring AI、Swarm、LangChain 和 LangGraph——以提供对它们的工作原理和使用案例的详细见解。 1. Coze Coze 是一个轻量级且用户友好的框架,旨在以尽可能少的

阅读更多
为什么人工智能代理是好软件

为什么人工智能代理是好软件

为什么(设计良好的)自主系统能如此有效 大约一个月前,我写了以下关于自主 AI 如何能够促进 AI 系统更好软件设计原则的文章。 这篇文章将更深入地探讨和扩展我在那篇文章中讨论的想法。我想这将是结束我们关

阅读更多
在构建非英语 RAG 系统时,嵌入为什么很重要 - 多语言嵌入

在构建非英语 RAG 系统时,嵌入为什么很重要 - 多语言嵌入

为什么嵌入是关键 嵌入是现代生成 AI 的基石,默默推动着我们每天互动的许多系统的功能。简单来说,嵌入是 文本的数值表示 —— 有效地将单词、句子甚至整个文档转换为数字。这些数字远非随机;它们经过精心设计,以捕捉文本中的含义和关系。例如,“dog”和“puppy”的嵌入在数值空间中会更靠近,而“car”的嵌入则会相对较远,反映出它们的 语义相似性。将意义编码为可测量的

阅读更多
新人工智能 Bolt 是否会取代 v0.dev

新人工智能 Bolt 是否会取代 v0.dev

AI工具不是会员?免费阅读 这里。网页开发的世界正在快速发展,市场上涌现出多种AI工具。这些新AI工具通过自然

阅读更多
Claude MCP引领智能代理时代的变革与应用

Claude MCP引领智能代理时代的变革与应用

最近我们听到了很多关于 AI 代理的消息,我也在测试其中的许多工具。兴奋感实际上始于几年前,像 AutoGPT 和 CrewAI 这样的工具。虽然它们的方法各不相同,但通常涉及 LLM 之间的相互通信以及使用外部工具。这些 **“工具” 本质上是

阅读更多
克劳德 MCP 是真正的代理时代的开端吗?第二部分

克劳德 MCP 是真正的代理时代的开端吗?第二部分

在之前的博客文章中,我谈到了 MCP 以及它如何使 Claude 不仅仅是一个聊天机器人,而是一个真正强大的助手,可以与您的本地应用程序进行交互,例如文件系统、Google Drive、您的电子邮件程序等。 让我们将理论付诸实践,测试快速摘要工具,它可以从任何给定的 URL 生成摘要。 在本演示中,摘要工具在 localhost:3009 本地运行。我们将使用 Puppeteer MCP

阅读更多
Wren AI 文本到 SQL:API - 好东西 | by D | Medium

Wren AI 文本到 SQL:API - 好东西 | by D | Medium

Wren AI 是一个 AI 管道应用程序,可以将自然语言用户查询转换为 SQL,也称为 文本到 SQL(也称为自然语言到 SQL 或 NL2SQL),使您能够与数据库进行对话。它同时提供 UI 和 API,允许您根据用户提示生成 SQL 查询,并使用这些查询检索数据。这大大简化了在您的 RAG/Agent 应用程序中处理结构化表格数据的过程。 查看他们的演示 [https:/

阅读更多
2025 年成为人工智能工程师的终极路线图

2025 年成为人工智能工程师的终极路线图

介绍:乘风破浪的人工智能 世界正经历一场人工智能的淘金热,像谷歌、特斯拉和亚马逊这样的公司正在向人工智能投资数十亿美元。对于那些有抱负的人来说,人工智能工程师的角色已成为最有前途的职业之一,融合了尖端技术、解决问题的能力和创造力。如果你准备好迎接这个挑战,这份指南将带您通过逐步的、按周的路线图,帮助您在2025年开启人工智能职业生涯。 这份路线图提供了一个详细、现实的8个月学习

阅读更多
Anthropic: Claude 3.5 Haiku (2024-10-22)

Anthropic: Claude 3.5 Haiku (2024-10-22)

Claude 3.5 Haiku 在所有技能领域中都进行了增强,包括编码、工具使用和推理。作为 Anthropic 系列中速度最快的模型,它提供快速的响应时间,适用于需要高交互性和低延迟的应用,如面向用户的聊天机器人和即时代码补全。它在数据提取和实时内容审核等专业任务中表现出色,使其成为广泛行业的多功能工具。 它不支持图像输入。 查看发布公告和基准测试结果 [he

阅读更多
Google: Gemini Experimental 1121 (free)

Google: Gemini Experimental 1121 (free)

实验性版本(2024年11月21日) 的 Gemini。

阅读更多
Google: Gemma 2 9B (free)

Google: Gemma 2 9B (free)

Gemma 2 9B by Google 是一个先进的开源语言模型,在其尺寸类别中设定了效率和性能的新标准。 该模型旨在支持多种任务,使开发者和研究人员能够构建创新应用,同时保持可访问性、安全性和成本效益。 有关更多详细信息,请参阅 发布公告。

阅读更多
Inflatebot: Mag Mell R1 12B

Inflatebot: Mag Mell R1 12B

Mag Mell 是一个基于 Mistral Nemo 的预训练语言模型的合并,使用 mergekit 创建。它是一个出色的角色扮演和讲故事模型,结合了许多其他模型的最佳部分,成为许多用例的通用解决方案。 旨在成为任何虚构、创意用例的通用“最佳 Nemo”模型。 Mag Mell 由 3 个中间部分组成:Hero (RP, trop

阅读更多
Meta: Llama 3.1 70B Instruct (free)

Meta: Llama 3.1 70B Instruct (free)

Meta最新发布的模型系列(Llama 3.1)推出了多种规模和版本。这个70B的指令调优版本针对高质量对话用例进行了优化。 与领先的闭源模型相比,它在人工评估中表现出色。 使用该模型须遵循Meta的可接受使用政策。 _这些是[Llama 3.1 70B Instruct](

阅读更多
Meta: Llama 3.2 3B Instruct (free)

Meta: Llama 3.2 3B Instruct (free)

Llama 3.2 3B 是一个拥有 30 亿参数的多语言大型语言模型,针对对话生成、推理和摘要等高级自然语言处理任务进行了优化。该模型采用最新的 Transformer 架构,支持包括英语、西班牙语和印地语在内的八种语言,并可适应其他语言。 Llama 3.2B 模型在 9 万亿个标记上进行训练,擅长遵循指令、复杂推理和工具使用。其平衡的性能使其非常适合需要在多语

阅读更多
Meta: Llama 3.2 90B Vision Instruct (free)

Meta: Llama 3.2 90B Vision Instruct (free)

The Llama 90B Vision模型是一款顶级的90亿参数多模态模型,旨在应对最具挑战性的视觉推理和语言任务。它在图像描述、视觉问答和高级图像-文本理解方面提供无与伦比的准确性。该模型在庞大的多模态数据集上进行预训练,并通过人类反馈进行微调,旨在处理最苛刻的基于图像的AI任务。 该模型非常适合需要尖端多模态AI能力的行业,特别是那些处理复杂实时视觉和文本分析

阅读更多
MiniMax: MiniMax-01

MiniMax: MiniMax-01

MiniMax-01 是一个结合了 MiniMax-Text-01 进行文本生成和 MiniMax-VL-01 进行图像理解的模型。它拥有 4560 亿个参数,每次推理激活 459 亿个参数,并且可以处理多达 400 万个 token 的上下文。 文本模型采用混合架构,结合了 Lightning Attention、Softmax Attention 和专家混合(MoE)。图像模型采用“ViT

阅读更多
Mistral: Mistral 7B Instruct (free)

Mistral: Mistral 7B Instruct (free)

一个高性能、行业标准的 7.3B 参数模型,针对速度和上下文长度进行了优化。 Mistral 7B Instruct 有多个版本变体,这里是最新版本。 _这些是 Mistral 7B Instruct 的免费限速端点。输出可能会被缓存。有关速率限制的信息,请阅读 [这里](/docs/limi

阅读更多
Mistral Large 2411

Mistral Large 2411

Mistral Large 2 2411 是 Mistral Large 2 的更新版本,与 Pixtral Large 2411 一起发布。 它流利地支持英语、法语、西班牙语、德语和意大利语,具有高语法准确性,并且其长上下文窗口允许从大型文档中精

阅读更多
OpenChat 3.5 7B (free)

OpenChat 3.5 7B (free)

OpenChat 7B 是一个开源语言模型库,经过“C-RLFT(条件强化学习微调)”的精细调优——这是一种受离线强化学习启发的策略。它是在没有偏好标签的混合质量数据上进行训练的。对于在 Mistral 7B 上微调的 OpenChat,请查看 OpenChat 7B。 对于在 Llama 8B 上微调的

阅读更多
Phi-3 Medium 128K Instruct (free)

Phi-3 Medium 128K Instruct (free)

Phi-3 128K Medium 是一个强大的 140 亿参数模型,旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化,它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。 在发布时,Phi-3 Medium 在轻量级模型中展示了最先进的性能。在 MMLU-Pro 评估中,该模型甚至接近 Llama3 70B 的性能水平。 对于 4k 上下

阅读更多
Phi-3 Mini 128K Instruct (free)

Phi-3 Mini 128K Instruct (free)

Phi-3 Mini 是一个强大的 3.8B 参数模型,旨在实现高级语言理解、推理和指令跟随。通过监督微调和偏好调整进行优化,它在涉及常识、数学、逻辑推理和代码处理的任务中表现出色。 在发布时,Phi-3 Medium 在轻量级模型中展示了最先进的性能。该模型是静态的,训练于一个截至 2023 年 10 月的离线数据集。 _这些是免费的、速率限制的端点,适用于 [

阅读更多
Qwen 2 7B Instruct (free)

Qwen 2 7B Instruct (free)

Qwen2 7B 是一个基于变换器的模型,在语言理解、多语言能力、编码、数学和推理方面表现出色。 它具有 SwiGLU 激活、注意力 QKV 偏置和组查询注意力。它在大量数据上进行了预训练,并进行了监督微调和直接偏好优化。 有关更多详细信息,请参见这篇 博客文章 和 [GitHub 仓

阅读更多
Llama 3 Euryale 70B v2.1

Llama 3 Euryale 70B v2.1

Euryale 70B v2.1 是一个专注于创意角色扮演的模型,来自 Sao10k。更好的提示遵循性。 更好的解剖学/空间意识。 更好地适应独特和自定义的格式/回复格式。 非常有创意,很多独特的风格。 在角色扮演过程中没有限制。

阅读更多
Sao10K: Llama 3 8B Lunaris

Sao10K: Llama 3 8B Lunaris

Lunaris 8B 是一个基于 Llama 3 的多功能通用和角色扮演模型。它是多个模型的战略合并,旨在平衡创造力与改进的逻辑和一般知识。 由 Sao10k 创建,该模型旨在提供比 Stheno v3.2 更好的体验,具有增强的创造力和逻辑推理能力。 为了获得最佳效果,请使用 Llama 3 Instruct 上下文模板,温

阅读更多
Llama 3.1 Euryale 70B v2.2

Llama 3.1 Euryale 70B v2.2

Euryale L3.1 70B v2.2 是一个专注于创意角色扮演的模型,来自 Sao10k。它是 Euryale L3 70B v2.1 的继任者。

阅读更多
Sao10K: Llama 3.3 Euryale 70B

Sao10K: Llama 3.3 Euryale 70B

Euryale L3.3 70B 是一个专注于创意角色扮演的模型,来自 Sao10k。它是 Euryale L3 70B v2.2 的继任者。

阅读更多
Toppy M 7B (free)

Toppy M 7B (free)

A wild 7B 参数模型,使用 mergekit 的新 task_arithmetic 合并方法合并了多个模型。合并模型列表: NousResearch/Nous-Capybara-7B-V1.9 HuggingFaceH4/zephyr-7b-beta lemonil

阅读更多