Type something to search...
使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

使用 PydanticAI 框架构建多代理 LLM 系统:创建人工智能系统的分步指南...

Pydantic是Python生态系统中的一大力量,拥有超过2.85亿次的月下载量,一直是Python项目中稳健数据验证的基石。现在,它的创造者们正在前往AI的前沿领域,推出Pydantic AI,这是一个旨在构建由生成式AI驱动的生产级应用程序的框架。在本文中,我们将深入探讨Pydantic AI的独特之处、其关键特性以及与其他智能体框架的比较。

Pydantic 与 GenAI 中的 Pydantic 与 PydanticAI

Pydantic:

from datetime import date
from pydantic import BaseModel
class User(BaseModel):
    id: int
    name: str
    dob: date
user = User(id='123', name='Samuel Colvin', dob='1987-01-28')
#> User(id=123, name='Samuel Colvin', dob=date(1987, 1, 28))
user = User.model_validate_json('{"id: 123, "name": "Samuel Colvin", "dob": "1987-01-28"}')
#> User(id=123, name='Samuel Colvin', dob=date(1987, 1, 28))
print(User.model_json_schema())
s = {
    'properties': {
        'id': {'title': 'Id', 'type': 'integer'},
        'name': {'title': 'Name', 'type': 'string'},
        'dob': {'format': 'date', 'title': 'Dob', 'type': 'string'},
    },
    'required': ['id', 'name', 'dob'],
    'title': 'User',
    'type': 'object',
}

GenAI 中的 Pydantic:

from datetime import date
from pydantic import BaseModel
from openai import OpenAI
class User(BaseModel):
    """用户定义"""
    id: int
    name: str
    dob: date
response = OpenAI().chat.completions.create(
    model='gpt-4o',
    messages=[
        {'role': 'system', 'content': '提取用户信息'},
        {'role': 'user', 'content': '用户ID为123,名叫Samuel,出生于87年1月28日'}
    ],
    tools=[
        {
            'function': {
                'name': User.__name__,
                'description': User.__doc__,
                'parameters': User.model_json_schema(),
            },
            'type': 'function'
        }
    ]
)
user = User.model_validate_json(response.choices[0].message.tool_calls[0].function.arguments)
print(user)

PydanticAI:

使用 PydanticAI 的相同示例 — 适用于生产的代理框架。

from datetime import date
from pydantic_ai import Agent
from pydantic import BaseModel
class User(BaseModel):
    """用户定义"""
    id: int
    name: str
    dob: date
agent = Agent(
    'openai:gpt-4o',
    result_type=User,
    system_prompt='提取用户信息',
)
result = agent.run_sync('用户ID为123,名叫Samuel,出生于87年1月28日')
print(result.data)

什么是 PydanticAI?

PydanticAI 是一个 Python 代理框架,旨在使构建具有生成性 AI 的生产级应用程序变得更加简单。

为什么选择 PydanticAI?

假设您正在制作一个应用程序,用户提交他们的姓名、年龄和电子邮件。您希望确保:

姓名是字符串。

年龄是数字。

电子邮件格式有效。

以下是 Pydantic 如何简化这一过程:

from pydantic import BaseModel, EmailStr
## 定义模型
class User(BaseModel):
    name: str
    age: int
    email: EmailStr
## 示例输入
user_data = {
    "name": "Alice",
    "age": 25,
    "email": "alice@example.com"
}
## 验证输入
user = User(**user_data)
print(user.name)  # Alice
print(user.age)   # 25
print(user.email) # alice@example.com

如果数据错误怎么办?

如果用户提交无效数据(例如,"age": "twenty-five"),Pydantic 会自动抛出错误:

user_data = {
    "name": "Alice",
    "age": "twenty-five",  # 无效
    "email": "alice@example.com"
}
user = User(**user_data)
## 错误:值不是有效的整数

Pydantic 在部署中发挥着关键作用,因为它通常是强制遵循的。

由 Pydantic 团队构建 由 Pydantic 背后的团队构建(OpenAI SDK、Anthropic SDK、LangChain、LlamaIndex、AutoGPT、Transformers、CrewAI、Instructor 等的验证层)。

模型无关 支持 OpenAI、Anthropic、Gemini、Ollama、Groq 和 Mistral,并且有一个简单的接口来实现对其他模型的支持。

Pydantic Logfire 集成 无缝集成 Pydantic Logfire 以进行实时调试、性能监控和 LLM 驱动应用程序的行为跟踪。

类型安全 旨在使类型检查对您尽可能有用,因此它与静态类型检查器(如 mypypyright)良好集成。

以 Python 为中心的设计 利用 Python 熟悉的控制流和代理组合来构建您的 AI 驱动项目,使您可以轻松应用在任何其他(非 AI)项目中使用的标准 Python 最佳实践。

结构化响应 利用 Pydantic 的强大功能来验证和结构化模型输出,确保响应在运行之间保持一致。

依赖注入系统 提供可选的依赖注入系统,以向代理的系统提示、工具和结果验证器提供数据和服务。这对测试和基于评估的迭代开发很有用。

流式响应 提供连续流式输出 LLM 的能力,并进行即时验证,确保快速准确的结果。

目的是解决代理框架领域中的一个主要问题:缺乏专门为生产用例设计的工具。

安装 PydanticAI

需要 Python 3.9+

pip install pydantic-ai

这将安装 pydantic_ai 包、核心依赖项和使用 PydanticAI 中包含的所有模型所需的库。如果您想使用特定模型,可以安装 PydanticAI 的“精简”版本。

PydanticAI 的 8 个重要组成部分

  • 代理
  • 模型
  • 依赖项
  • 功能工具
  • 结果
  • 消息和聊天记录
  • 测试和评估
  • 调试和监控

代理

代理是 PydanticAI 与 LLM 交互的主要接口。

在某些用例中,单个代理将控制整个应用程序或组件,但多个代理也可以交互以体现更复杂的工作流程。

代理类具有完整的 API 文档,但从概念上讲,您可以将代理视为一个容器,用于:

运行代理

有三种方式来运行代理:

  1. agent.run() — 一个协程,返回一个包含完成响应的 RunResult
  2. agent.run_sync() — 一个普通的同步函数,返回一个包含完成响应的 RunResult(在内部,这只是调用 loop.run_until_complete(self.run())
  3. agent.run_stream() — 一个协程,返回一个 StreamedRunResult,该结果包含以异步可迭代的方式流式传输响应的方法

以下是一个演示所有三种方式的简单示例:

from pydantic_ai import Agent
agent = Agent('openai:gpt-4o')
result_sync = agent.run_sync('What is the capital of Italy?')
print(result_sync.data)
#> Rome

async def main():
    result = await agent.run('What is the capital of France?')
    print(result.data)
    #> Paris
    async with agent.run_stream('What is the capital of the UK?') as response:
        print(await response.get_data())
        #> London

模型

PydanticAI 是模型无关的,并内置支持以下模型提供商:

  • OpenAI
  • Anthropic
  • Gemini 通过两种不同的 API:生成语言 API 和 VertexAI API
  • Ollama
  • Groq
  • Mistral

您还可以添加对其他模型的支持。

PydanticAI 还带有 TestModelFunctionModel 用于测试和开发。

要使用每个模型提供商,您需要配置本地环境,并确保已安装正确的包。

要使用 GeminiModel 模型,您只需安装 pydantic-aipydantic-ai-slim,无需额外的依赖项。

配置

GeminiModel 让您通过 Google 的生成语言 API generativelanguage.googleapis.com 使用 Gemini 模型。

GeminiModelName 包含可通过此接口使用的可用 Gemini 模型列表。

要使用 GeminiModel,请访问 aistudio.google.com,并按照提示找到生成 API 密钥的地方。

环境变量

一旦您拥有 API 密钥,就可以将其设置为环境变量:

from pydantic_ai import Agent
from pydantic_ai.models.gemini import GeminiModel
model = GeminiModel('gemini-1.5-flash', api_key=os.environ['GEMINI_API_KEY'])
agent = Agent(model)

依赖关系

PydanticAI 使用依赖注入系统为您代理的系统提示、工具和结果验证器提供数据和服务。

与 PydanticAI 的设计理念相匹配,我们的依赖系统尝试使用 Python 开发中的现有最佳实践,而不是发明深奥的“魔法”,这应该使依赖关系类型安全、易于理解、更易于测试,并最终更易于在生产环境中部署。

定义依赖项

依赖项可以是任何 Python 类型。在简单的情况下,您可能能够将单个对象作为依赖项传递(例如,HTTP 连接),但当您的依赖项包含多个对象时,数据类通常是一个方便的容器。

下面是定义一个需要依赖项的代理的示例。

from dataclasses import dataclass
import httpx
from pydantic_ai import Agent, RunContext

@dataclass
class MyDeps:
    api_key: str
    http_client: httpx.AsyncClient

agent = Agent(
    'openai:gpt-4o',
    deps_type=MyDeps,
)

@agent.system_prompt  
async def get_system_prompt(ctx: RunContext[MyDeps]) -> str:  
    response = await ctx.deps.http_client.get(  
        'https://example.com',
        headers={'Authorization': f'Bearer {ctx.deps.api_key}'},  
    )
    response.raise_for_status()
    return f'Prompt: {response.text}'

async def main():
    async with httpx.AsyncClient() as client:
        deps = MyDeps('foobar', client)
        result = await agent.run('Tell me a joke.', deps=deps)
        print(result.data)
        #> Did you hear about the toothpaste scandal? They called it Colgate.

MyDeps 是被注入到 agent.run 方法中的依赖项。

功能工具

功能工具为模型提供了一种机制,以检索额外信息来帮助生成响应。

当将代理可能需要的所有上下文放入系统提示中不切实际或不可能时,或者当您希望通过将生成响应所需的一些逻辑推迟到另一个(不一定是 AI 驱动的)工具,从而使代理的行为更具确定性或可靠性时,它们是非常有用的。

有多种方法可以将工具注册到代理中:

  • 通过 @agent.tool 装饰器 — 用于需要访问代理上下文的工具
  • 通过 @agent.tool_plain 装饰器 — 用于不需要访问代理上下文的工具
  • 通过 Agenttools 关键字参数,可以接受普通函数或 Tool 的实例

@agent.tool 被视为默认装饰器,因为在大多数情况下,工具将需要访问代理上下文。

以下是同时使用这两者的示例:

import random
from pydantic_ai import Agent, RunContext
agent = Agent(
    'gemini-1.5-flash',  
    deps_type=str,  
    system_prompt=(
        "You're a dice game, you should roll the die and see if the number "
        "you get back matches the user's guess. If so, tell them they're a winner. "
        "Use the player's name in the response."
    ),
)

@agent.tool_plain  
def roll_die() -> str:
    """Roll a six-sided die and return the result."""
    return str(random.randint(1, 6))

@agent.tool  
def get_player_name(ctx: RunContext[str]) -> str:
    """Get the player's name."""
    return ctx.deps

dice_result = agent.run_sync('My guess is 4', deps='Anne')  
print(dice_result.data)
#> Congratulations Anne, you guessed correctly! You're a winner!

结果

结果是运行代理后返回的最终值。结果值被包装在 RunResultStreamedRunResult 中,因此您可以访问其他数据,例如运行的使用情况和消息历史。

RunResultStreamedRunResult 在它们包装的数据中是通用的,因此关于代理返回的数据的类型信息得以保留。

from pydantic import BaseModel
from pydantic_ai import Agent

class CityLocation(BaseModel):
    city: str
    country: str

agent = Agent('gemini-1.5-flash', result_type=CityLocation)
result = agent.run_sync('Where were the olympics held in 2012?')
print(result.data)
#> city='London' country='United Kingdom'
print(result.usage())
"""
Usage(requests=1, request_tokens=57, response_tokens=8, total_tokens=65, details=None)
"""

消息和聊天记录

PydanticAI 提供了在代理运行期间交换的消息访问。这些消息可以用于继续连贯的对话,也可以用于理解代理的表现。

访问结果中的消息

在运行代理后,您可以从 result 对象访问该运行期间交换的消息。

RunResult(由 Agent.runAgent.run_sync 返回)和 StreamedRunResult(由 Agent.run_stream 返回)都有以下方法:

  • all_messages(): 返回所有消息,包括之前运行的消息。还有一个返回 JSON 字节的变体 all_messages_json()
  • new_messages(): 仅返回当前运行的消息。还有一个返回 JSON 字节的变体 new_messages_json()

使用消息作为后续代理运行的输入

在 PydanticAI 中,消息历史的主要用途是保持多个代理运行之间的上下文。

要在运行中使用现有消息,请将它们传递给 Agent.runAgent.run_syncAgent.run_streammessage_history 参数。

如果 message_history 被设置且不为空,则不会生成新的系统提示 — 我们假设现有的消息历史包含一个系统提示。

from pydantic_ai import Agent
agent = Agent('openai:gpt-4o', system_prompt='Be a helpful assistant.')
result1 = agent.run_sync('Tell me a joke.')
print(result1.data)
#> Did you hear about the toothpaste scandal? They called it Colgate.
result2 = agent.run_sync('Explain?', message_history=result1.new_messages())
print(result2.data)
#> This is an excellent joke invent by Samuel Colvin, it needs no explanation.
print(result2.all_messages())
"""
[
    ModelRequest(
        parts=[
            SystemPromptPart(
                content='Be a helpful assistant.', part_kind='system-prompt'
            ),
            UserPromptPart(
                content='Tell me a joke.',
                timestamp=datetime.datetime(...),
                part_kind='user-prompt',
            ),
        ],
        kind='request',
    ),
    ModelResponse(
        parts=[
            TextPart(
                content='Did you hear about the toothpaste scandal? They called it Colgate.',
                part_kind='text',
            )
        ],
        timestamp=datetime.datetime(...),
        kind='response',
    ),
    ModelRequest(
        parts=[
            UserPromptPart(
                content='Explain?',
                timestamp=datetime.datetime(...),
                part_kind='user-prompt',
            )
        ],
        kind='request',
    ),
    ModelResponse(
        parts=[
            TextPart(
                content='This is an excellent joke invent by Samuel Colvin, it needs no explanation.',
                part_kind='text',
            )
        ],
        timestamp=datetime.datetime(...),
        kind='response',
    ),
]
"""

测试与评估

使用 PydanticAI 和 LLM 集成,主要有两种不同类型的测试:

  1. 单元测试 — 对您的应用程序代码进行测试,以确认其是否正常运行
  2. 评估 — 对 LLM 进行测试,以判断其响应的好坏

在大多数情况下,这两种测试的目标和考虑因素是相对独立的。

单元测试

PydanticAI 代码的单元测试与其他 Python 代码的单元测试类似。

因为在大多数情况下,它们并没有什么新意,我们已经建立了相当成熟的工具和模式来编写和运行这些类型的测试。

除非你非常确定自己知道得更好,否则你可能会想大致遵循以下策略:

  • 使用 pytest 作为你的测试工具
  • 如果你发现自己在输入冗长的断言,可以使用 inline-snapshot
  • 同样,dirty-equals 对于比较大型数据结构也很有用
  • 使用 TestModelFunctionModel 代替你的实际模型,以避免真实 LLM 调用的使用、延迟和可变性
  • 使用 Agent.override 在你的应用逻辑中替换模型
  • 全局设置 ALLOW_MODEL_REQUESTS=False 以阻止意外对非测试模型的请求

让我们为以下应用代码编写单元测试:

import asyncio
from datetime import date
from pydantic_ai import Agent, RunContext
from fake_database import DatabaseConn  
from weather_service import WeatherService  
weather_agent = Agent(
    'openai:gpt-4o',
    deps_type=WeatherService,
    system_prompt='Providing a weather forecast at the locations the user provides.',
)

@weather_agent.tool
def weather_forecast(
    ctx: RunContext[WeatherService], location: str, forecast_date: date
) -> str:
    if forecast_date < date.today():  
        return ctx.deps.get_historic_weather(location, forecast_date)
    else:
        return ctx.deps.get_forecast(location, forecast_date)

async def run_weather_forecast(  
    user_prompts: list[tuple[str, int]], conn: DatabaseConn
):
    """Run weather forecast for a list of user prompts and save."""
    async with WeatherService() as weather_service:
        async def run_forecast(prompt: str, user_id: int):
            result = await weather_agent.run(prompt, deps=weather_service)
            await conn.store_forecast(user_id, result.data)
        # run all prompts in parallel
        await asyncio.gather(
            *(run_forecast(prompt, user_id) for (prompt, user_id) in user_prompts)
        )

这里我们有一个函数,它接受一个 (user_prompt, user_id) 元组的列表,为每个提示获取天气预报,并将结果存储在数据库中。

我们希望测试这段代码,而不必模拟某些对象或修改我们的代码以便传入测试对象。

以下是我们使用 TestModel 编写测试的方法:

from datetime import timezone
import pytest
from dirty_equals import IsNow
from pydantic_ai import models, capture_run_messages
from pydantic_ai.models.test import TestModel
from pydantic_ai.messages import (
    ArgsDict,
    ModelResponse,
    SystemPromptPart,
    TextPart,
    ToolCallPart,
    ToolReturnPart,
    UserPromptPart,
    ModelRequest,
)
from fake_database import DatabaseConn
from weather_app import run_weather_forecast, weather_agent
pytestmark = pytest.mark.anyio  
models.ALLOW_MODEL_REQUESTS = False  

async def test_forecast():
    conn = DatabaseConn()
    user_id = 1
    with capture_run_messages() as messages:
        with weather_agent.override(model=TestModel()):  
            prompt = 'What will the weather be like in London on 2024-11-28?'
            await run_weather_forecast([(prompt, user_id)], conn)  
    forecast = await conn.get_forecast(user_id)
    assert forecast == '{"weather_forecast":"Sunny with a chance of rain"}'  
    assert messages == [  
        ModelRequest(
            parts=[
                SystemPromptPart(
                    content='Providing a weather forecast at the locations the user provides.',
                ),
                UserPromptPart(
                    content='What will the weather be like in London on 2024-11-28?',
                    timestamp=IsNow(tz=timezone.utc),  
                ),
            ]
        ),
        ModelResponse(
            parts=[
                ToolCallPart(
                    tool_name='weather_forecast',
                    args=ArgsDict(
                        args_dict={
                            'location': 'a',
                            'forecast_date': '2024-01-01',  
                        }
                    ),
                    tool_call_id=None,
                )
            ],
            timestamp=IsNow(tz=timezone.utc),
        ),
        ModelRequest(
            parts=[
                ToolReturnPart(
                    tool_name='weather_forecast',
                    content='Sunny with a chance of rain',
                    tool_call_id=None,
                    timestamp=IsNow(tz=timezone.utc),
                ),
            ],
        ),
        ModelResponse(
            parts=[
                TextPart(
                    content='{"weather_forecast":"Sunny with a chance of rain"}',
                )
            ],
            timestamp=IsNow(tz=timezone.utc),
        ),
    ]

使用 FunctionModel 进行单元测试

上述测试是一个很好的开始,但细心的读者会注意到 WeatherService.get_forecast 从未被调用,因为 TestModel 使用过去的日期调用了 weather_forecast

为了充分测试 weather_forecast,我们需要使用 FunctionModel 自定义工具的调用方式。

以下是使用 FunctionModel 测试 weather_forecast 工具的自定义输入示例:

import re
import pytest
from pydantic_ai import models
from pydantic_ai.messages import (
    ModelMessage,
    ModelResponse,
    ToolCallPart,
)
from pydantic_ai.models.function import AgentInfo, FunctionModel
from fake_database import DatabaseConn
from weather_app import run_weather_forecast, weather_agent
pytestmark = pytest.mark.anyio
models.ALLOW_MODEL_REQUESTS = False

def call_weather_forecast(  
    messages: list[ModelMessage], info: AgentInfo
) -> ModelResponse:
    if len(messages) == 1:
        # first call, call the weather forecast tool
        user_prompt = messages[0].parts[-1]
        m = re.search(r'\d{4}-\d{2}-\d{2}', user_prompt.content)
        assert m is not None
        args = {'location': 'London', 'forecast_date': m.group()}  
        return ModelResponse(
            parts=[ToolCallPart.from_raw_args('weather_forecast', args)]
        )
    else:
        # second call, return the forecast
        msg = messages[-1].parts[0]
        assert msg.part_kind == 'tool-return'
        return ModelResponse.from_text(f'The forecast is: {msg.content}')

async def test_forecast_future():
    conn = DatabaseConn()
    user_id = 1
    with weather_agent.override(model=FunctionModel(call_weather_forecast)):  
        prompt = 'What will the weather be like in London on 2032-01-01?'
        await run_weather_forecast([(prompt, user_id)], conn)
    forecast = await conn.get_forecast(user_id)
    assert forecast == 'The forecast is: Rainy with a chance of sun'

Evals

“Evals” 指的是评估模型在特定应用中的表现。

Evals 通常更像基准测试而不是单元测试,它们从不“通过”,虽然它们确实会“失败”;你主要关心的是它们随时间的变化。

由于 evals 需要在真实模型上运行,因此运行起来可能会很慢且成本高,因此通常不希望在每次提交时都在 CI 中运行它们。

性能测量

评估中最难的部分是衡量模型的表现如何。

在某些情况下(例如生成 SQL 的代理),可以使用简单、易于执行的测试来测量性能(例如,SQL 是否有效?返回的结果是否正确?返回的结果是否恰到好处?)。

在其他情况下(例如提供戒烟建议的代理),量化性能的测量可能非常困难或不可能——在戒烟的情况下,您确实需要进行为期数月的双盲试验,然后等待 40 年观察健康结果,以了解对提示的更改是否有所改善。

您可以使用几种不同的策略来测量性能:

  • 端到端、自包含的测试——就像 SQL 示例一样,我们可以几乎立即测试代理的最终结果
  • 合成自包含测试——编写单元测试风格的检查,确保输出符合预期,例如检查 'chewing gum' in response,虽然这些检查看起来简单,但它们可以很有帮助,一个好的特点是当它们失败时很容易找出问题所在
  • LLMs 评估 LLMs——使用另一个模型,甚至是同一模型的不同提示来评估代理的性能(就像班级互相批改作业,因为老师宿醉),虽然这种方法的缺点和复杂性显而易见,但有人认为在适当的情况下它可以成为一个有用的工具
  • 生产环境中的评估——在生产环境中测量代理的最终结果,然后创建性能的定量指标,以便您可以轻松地随着提示或使用的模型的变化来衡量随时间的变化,logfire 在这种情况下可以非常有用,因为您可以编写自定义查询来测量代理的性能

系统提示自定义

系统提示是开发者控制代理行为的主要工具,因此能够自定义系统提示并观察性能变化通常是很有用的。当系统提示包含一系列示例时,尤其相关,因为您想了解更改该列表如何影响模型的性能。

调试与监控

使用 LLM 的应用程序面临一些众所周知且易于理解的挑战:LLM 不可靠昂贵

这些应用程序还面临一些大多数开发人员较少遇到的挑战:LLM 反复无常非确定性。提示中的微小变化可以完全改变模型的性能,而没有任何 EXPLAIN 查询可以帮助理解原因。

要成功构建使用 LLM 的应用程序,我们需要新的工具来理解模型性能和依赖于它们的应用程序的行为。

仅仅让您了解模型性能的 LLM 可观察性工具是无用的:对 LLM 发起 API 调用很简单,真正将其构建到应用程序中才是困难的。

Pydantic Logfire

Pydantic Logfire 是一个可观察性平台,由创建和维护 Pydantic 和 PydanticAI 的团队开发。Logfire 的目标是让您了解整个应用程序:生成 AI、经典预测 AI、HTTP 流量、数据库查询以及现代应用程序所需的一切。

PydanticAI 内置(但可选)支持通过 logfire-api 无操作包与 Logfire 进行集成。

这意味着如果安装并配置了 logfire 包,则会将有关代理运行的详细信息发送到 Logfire。但如果未安装 logfire 包,则几乎不会有额外开销,也不会发送任何信息。

以下是一个示例,显示在 Logfire 中运行天气代理的详细信息:

示例 1:一个简单的 AI 代理

这里是如何设置一个基本的 AI 代理来使用 Pydantic 模型验证结构化数据。 [1]

图 1:展示用户、代理和模型之间关系的序列图。

让我们继续创建一些 Python 代码来开始。

from pydantic_ai import Agent
from pydantic import BaseModel
## Define the structure of the response
class CityInfo(BaseModel):
 city: str
 country: str
## Create an agent
agent = Agent(
 model='openai:gpt-4o', # Specify your model
 result_type=CityInfo # Enforce the structure of the response
)
## Run the agent
if __name__ == '__main__':
 result = agent.run_sync("Tell me about Paris.")
 print(result.data) # Outputs: {'city': 'Paris', 'country': 'France'}

看看这么简单?这里发生的事情是 CityInfo 模型定义了我们期望的响应结构。然后,代理被配置为根据这个结构验证 LLM 的输出,确保结果可预测。快速而简单!

示例 2:为您的代理添加工具

PydanticAI 中的工具是您的代理在推理过程中可以调用的辅助函数。

图 2:展示用户、代理和工具使用情况的序列图。

让我们继续创建一些 Python 代码,以展示如何使用工具。

from pydantic_ai import Agent, RunContext
import random
## Define the agent
agent = Agent('openai:gpt-4o')
## Add a tool to roll a die
@agent.tool
async def roll_die(ctx: RunContext, sides: int = 6) -> int:
    """Rolls a die with the specified number of sides."""
    return random.randint(1, sides)
## Run the agent
if __name__ == '__main__':
    result = agent.run_sync("Roll a 20-sided die.")
    print(result.data)  # Outputs a random number between 1 and 20

工具为代理提供了可用的资源,使其更高效。最终,它们通过扩展代理的功能来提供帮助。它们可以与 API、数据库交互,甚至执行计算。

我对理论感到无聊 ufffff 🙁*..是时候编码了* 😝😝😝😝*!!!!!!!!!!!!!!!!!!!!!!!!!!*

让我们继续在 Python 中编码,以展示如何将一个独立的 API 连接到应用程序中。

用例:研究员和作家

我们需要 Gemini API 密钥和 Tavily API,

如果您想知道如何创建 Gemini API 密钥,请访问 aistudio.google.com 并按照您的笔记,直到找到生成 API 密钥的位置。

TAVILY_API_KEY 如果您想为自己创建一个,请从这个链接获取 https://app.tavily.com/

一旦您获得了两个密钥,请在 .env 文件中设置,如下所示

GEMINI_API_KEY = "Your api key"
TVLY_API_KEY ="Your api key"
pip install 'pydantic-ai[examples]' \
pip install tavily-python
import asyncio
from dataclasses import dataclass
import json
import os
from typing import List
from pydantic import BaseModel
from pydantic_ai import Agent, RunContext 
from dotenv import load_dotenv
from pydantic_ai.models.gemini import GeminiModel
from httpx import AsyncClient
from tavily import TavilyClient
load_dotenv()
@dataclass
class Deps:
    content_strategist_agent:Agent[None,str]
    client: AsyncClient
    tvly_api_key: str | None
    content:str
    
@dataclass
class Content:
    points: str
class BlogPostBaseModel(BaseModel):
    content:str
model = GeminiModel('gemini-1.5-flash', api_key=os.environ['GEMINI_API_KEY'])
## Agent setup
search_agent = Agent(
    model= model ,
    result_type=Content,
    system_prompt=(
        """you are Senior Research Analyst and your work as a leading tech think tank.
  Your expertise lies in identifying emerging trends.
  You have a knack for dissecting complex data and presenting actionable insights.given topic pydantic AI.
  Full analysis report in bullet points"""
    ),
    retries=2
)
content_writer_agents = Agent(
    model= model ,
    deps_type=Content,
    result_type=BlogPostBaseModel,
    system_prompt=(
        """You are a renowned Content Strategist, known for your insightful and engaging articles.use search_web for getting the list of points
  You transform complex concepts into compelling narratives.Full blog post of at least 4 paragraphs include paragrahs,headings, bullet points include html tags, please remove '\\n\\n'}"""
    ),
    retries=2
)
## Web Search for your query
@search_agent.tool
async def search_web(
    ctx: RunContext[Deps], web_query: str
) -> str:
    """Web Search for your query."""
    tavily_client = TavilyClient(api_key=ctx.deps.tvly_api_key)
    response =  tavily_client.search(web_query)
    return json.dumps(response)
@search_agent.tool
async def content_writer_agent(
    ctx: RunContext[Deps], question: str
) -> str:
    """Use this tool to communicate with content strategist"""
    print(question)
    response = await ctx.deps.content_strategist_agent.run(user_prompt=question)
    ctx.deps.content = response.data
    print("contentstragist") 
    return response.data
async def main():
    async with AsyncClient() as client:
        message_history =[]
        tvly_api_key = os.environ['TVLY_API_KEY']
        deps = Deps(client=client, tvly_api_key=tvly_api_key,content_strategist_agent=content_writer_agents,content="")
        result = await search_agent.run("blog article for Pydantic AI",message_history=message_history, deps=deps)
        message_history = result.all_messages()
        print("Blog:")
        print(deps.content)
if __name__ == '__main__':
    asyncio.run(main()

输出是关于 Pydantic AI 的精彩博客……

Pydantic AI: A Robust Foundation for Your AI Applications
In the dynamic world of Artificial Intelligence (AI), where data integrity and model reliability are paramount, choosing the right tools is crucial. Pydantic, a Python library for data parsing and validation, emerges as a powerful ally in building robust and efficient AI systems. Its ability to define data models and enforce data validation rules significantly improves the development process and reduces the risk of errors caused by inconsistent or malformed data.
Data Validation: The Cornerstone of Reliable AI
Data validation is a critical step in any AI project. Inaccurate or incomplete data can lead to flawed models, erroneous predictions, and ultimately, unreliable AI systems. Pydantic excels in this area by allowing you to define strict data schemas. This ensures that all data processed by your AI application conforms to predefined rules. No more unexpected type errors or missing values crashing your model – Pydantic acts as a gatekeeper, ensuring only valid data proceeds.
Type checking: Pydantic automatically validates data types, ensuring that integers remain integers, strings stay strings, and so on.
Value constraints: Define constraints such as minimum/maximum values, allowed strings, regular expressions, etc., to enforce precise data integrity.
Custom validation: Implement custom validation logic to handle complex scenarios and business rules specific to your AI application.
Data Modeling: Structure and Organization for Your AI Projects
AI projects often involve numerous data structures and configurations. Pydantic provides a powerful and elegant way to model your data. By creating data models, you not only improve the organization of your code but also enable early detection of inconsistencies. This structured approach simplifies data processing and manipulation, making your AI application cleaner and easier to maintain.
Structured Data: Easily define classes representing the structure of your input and output data.
Complex Data Types: Handle nested structures, lists, and dictionaries seamlessly, enforcing validation at every level.
Improved Readability: Clearly defined data models make your code easier to understand and maintain for both you and your collaborators.
Configuration Management: Centralized and Validated Settings
Managing configurations, especially in complex AI systems, can quickly become challenging. Pydantic offers a solution for efficient configuration management. You can create Pydantic models for your application's settings, ensuring that all configurations conform to predefined types and constraints. This centralized approach simplifies the management and modification of settings, thereby improving the overall workflow of your AI project.
Environment Variables: Easily load configuration settings from environment variables with validation.
Configuration Files: Use configuration files (YAML, JSON, etc.) to store and load settings while enforcing type and constraint validation.
Version Control Integration: Easily track configuration changes in your version control system, ensuring reproducibility and traceability.
Conclusion
Incorporating Pydantic into your AI development pipeline offers numerous advantages, from robust data validation to streamlined configuration management. By leveraging Pydantic's data modeling capabilities and validation features, you can create more reliable, maintainable, and ultimately, successful AI applications. It's a simple yet powerful addition that significantly enhances the overall robustness and efficiency of your AI development efforts.

我们设置了两个代理 search_agent ,content_writer_agents 和两个工具 search_agent 和 content_writer_agent

search_agent :研究给定主题并使用 search_web 工具获取信息,并将信息(上下文)传递给 content_writer_agent 工具,由于我们使用了 tool 属性,代理将保持上下文,content_writer_agent 工具将运行 content_writer_agents 代理,content_writer_agent 工具将设置由 content_writer_agents 代理生成的博客上下文

content_writer_agents*:它所拥有的内容是来自 search_web 工具的输出,它将很好地阐述一篇博客。*

通过这个,你了解了如何使用 Pydantic AI 框架创建生产就绪的 AI 应用程序

快乐学习!!!!!!!!!

请随时给出建议或评论以改善教学。

如果你喜欢这篇博客,请给我掌声 👏👏👏

要深入了解该框架,请查看官方 Pydantic AI 文档

Related Posts

使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
10 个强大的 Perplexity AI 提示,让您的营销任务自动化

10 个强大的 Perplexity AI 提示,让您的营销任务自动化

在当今快速变化的数字世界中,营销人员总是在寻找更智能的方法来简化他们的工作。想象一下,有一个个人助理可以为您创建受众档案,建议营销策略,甚至为您撰写广告文案。这听起来像是一个梦想? 多亏了像 Perplexity 这样的 AI 工具,这个梦想现在成为现实。通过正确的提示,您可以将 AI 转变为您的 个人营销助理。在本文中,我将分享 10 个强大的提示,帮助您自动

阅读更多
10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

人工智能技术,如机器学习、自然语言处理和数据分析,正在重新定义传统设计方法。从自动化重复任务到实现个性化用户体验,人工智能使设计师能够更加专注于战略思维和创造力。随着这一趋势的不断增长,UI/UX 设计师越来越多地采用 AI 驱动的工具来促进他们的工作。利用人工智能不仅能提供基于数据的洞察,还为满足多样化用户需求的创新设计解决方案开辟了机会。 1. 用户角色开发 目的

阅读更多
在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能(AI)的快速发展改变了企业的运作方式,使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计,AI工具帮助专业人士节省时间,提高生产力,专注于创造力。以下是按功能分类的100个AI工具的全面列表,以及它们在现实世界中的使用实例。 1. 研究工具 研究可能耗时,但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

阅读更多
你从未知道的 17 个令人惊叹的 GitHub 仓库

你从未知道的 17 个令人惊叹的 GitHub 仓库

Github 隐藏的宝石!! 立即收藏的代码库 学习编程相对简单,但掌握编写更好代码的艺术要困难得多。GitHub 是开发者的宝藏,那里“金子”是其他人分享的精心编写的代码。通过探索 GitHub,您可以发现如何编写更清晰的代码,理解高质量代码的样子,并学习成为更熟练开发者的基本步骤。 1. notwaldorf/emoji-translate *谁需

阅读更多