Type something to search...
使用 Magentic-One 多代理人工智能系统阅读文档和编码功能

使用 Magentic-One 多代理人工智能系统阅读文档和编码功能

Magentic-One 旨在通过利用多个具有专业能力的 AI 代理来简化复杂任务。我之前的一篇文章 也介绍了 Magentic-One。最近,我开始开发一个移动应用程序(名为“MotionLab”),能够连接 BLE 传感器,例如运动传感器,或利用设备内置的运动传感器,如加速度计。

然而,在开发过程中,我遇到了一个挑战:解码从订阅特定 UUID 特征的 BLE 传感器接收到的数据,如下图所示。这就是 Magentic-One 这款多智能体 AI 系统帮助我的地方。

为 Magentic-One 设置环境。模型为 ‘gpt-4o-2024–08–06’。

export CHAT_COMPLETION_PROVIDER='openai'

export OPENAI_API_KEY="your_api_key_here"

然后只需使用 example.py 来执行。这次,我增加了保存屏幕截图的功能,使我们能够观察一些幕后过程。 python3 examples/example.py —logs_dir ./my_logs —save_screenshot

python3 examples/example.py --logs_dir ./my_logs --save_screenshot

这是我使用的一个提示,也尝试了一些其他提示。

作为一名与 BLE 运动可穿戴传感器连接的移动应用程序的软件开发人员, 
您可以访问 BLE 传感器,订阅具有 
UUID 0x0000FFE4-0000-1000-8000-00805F9A34FB 的特征,并在传感器运动时接收一组 
二十个整数值, 
以下是一个示例 [85, 97, 119, 2, 168, 254, 146, 254, 6, 2, 48, 254, 205, 255, 248, 240, 83, 252, 171, 196]。 
这些值可能表示某些点的加速度 (x, y, z) 
通过解码数据包头、标志。为了正确理解和解释这些值, 
您需要根据可穿戴传感器的蓝牙 5.0 通信协议对其进行解码。 
协议文档可以在 https://wit-motion.gitbook.io/witmotion-sdk/ble-5.0-protocol/bluetooth-5.0-communication-protocol 找到。 
您能否帮助解码这些值并将其转换为应用程序的有意义数据?

然后 userProxy 获取用户提示输入。

Orchestrator 获取信息并制定计划。

Orchestrator 做出计划决策。

Orchestrator 处理最终计划。

WebSurfer 代理负责访问提供的网站以获取文档信息。它捕获屏幕截图并利用 OCR 方法,借助大型多模态模型提取必要的细节。

Orchestrator 根据响应进行反思,然后决定下一个计划,专注于是否检索与 BLE 数据相关的特定数据解释部分。

Orchestrator 制定计划,要求 Coder 编写 Python 脚本以根据从网站检索的 BLE 通信协议解码 BLE 数据。

Coder 编写了一个 Python 函数。

然后我们检查 my_logs 中保存的屏幕截图。

Magentic-One 旨在通过利用多个具有专业能力的 AI 代理来简化复杂任务。通过提供包含 BLE 传感器文档的网站,Magentic-One 自动导航该网站,捕获屏幕截图,并利用 OCR 技术提取蓝牙 5.0 通信协议的详细信息。凭借这些信息,系统的编码代理草拟了一个 Python 函数,旨在解码传感器数据,利用我在提示中包含的示例数据。这次经历突显了 AI 技术在现代应用开发中的变革性影响,为更加创新和智能的应用程序铺平了道路。

提示,提示,提示

在我尝试各种提示以复制这些任务的过程中,我**观察到提示和系统消息是影响代理工作流程和最终结果的最关键因素。**虽然我尚未深入比较不同的大型多模态模型 (LMM),但我主要集中在优化工作流程和完善提示工程。通过磨练这些方面,我们可以显著提高基于代理的工作流程的效率和有效性。

祝编码愉快,阅读愉快。感恩节快乐。

Related Posts

使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
10 个强大的 Perplexity AI 提示,让您的营销任务自动化

10 个强大的 Perplexity AI 提示,让您的营销任务自动化

在当今快速变化的数字世界中,营销人员总是在寻找更智能的方法来简化他们的工作。想象一下,有一个个人助理可以为您创建受众档案,建议营销策略,甚至为您撰写广告文案。这听起来像是一个梦想? 多亏了像 Perplexity 这样的 AI 工具,这个梦想现在成为现实。通过正确的提示,您可以将 AI 转变为您的 个人营销助理。在本文中,我将分享 10 个强大的提示,帮助您自动

阅读更多
10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

人工智能技术,如机器学习、自然语言处理和数据分析,正在重新定义传统设计方法。从自动化重复任务到实现个性化用户体验,人工智能使设计师能够更加专注于战略思维和创造力。随着这一趋势的不断增长,UI/UX 设计师越来越多地采用 AI 驱动的工具来促进他们的工作。利用人工智能不仅能提供基于数据的洞察,还为满足多样化用户需求的创新设计解决方案开辟了机会。 1. 用户角色开发 目的

阅读更多
在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能(AI)的快速发展改变了企业的运作方式,使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计,AI工具帮助专业人士节省时间,提高生产力,专注于创造力。以下是按功能分类的100个AI工具的全面列表,以及它们在现实世界中的使用实例。 1. 研究工具 研究可能耗时,但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

阅读更多
你从未知道的 17 个令人惊叹的 GitHub 仓库

你从未知道的 17 个令人惊叹的 GitHub 仓库

Github 隐藏的宝石!! 立即收藏的代码库 学习编程相对简单,但掌握编写更好代码的艺术要困难得多。GitHub 是开发者的宝藏,那里“金子”是其他人分享的精心编写的代码。通过探索 GitHub,您可以发现如何编写更清晰的代码,理解高质量代码的样子,并学习成为更熟练开发者的基本步骤。 1. notwaldorf/emoji-translate *谁需

阅读更多