解锁人工智能的未来：Ollama 的结构化输出和 phi-4 提升 LLM 性能的 5 种方式

Rifx.Online
Large Language Models , AI Applications , Best Practices
08 Mar, 2025

在不断发展的 AI 应用领域中，使用来自大型语言模型 (LLM) 的结构化输出已成为一项关键能力。虽然 LLM 擅长生成类似人类的文本，但为了将它们的能力应用于实际应用，通常需要将它们的输出解析成系统可以可靠处理的结构化格式。Ollama 的结构化输出功能应运而生——这是一项改变游戏规则的补充，它为 LLM 输出带来了前所未有的控制和可靠性。

结构化输出的力量：超越简单的文本生成

传统的 LLM 输出通常需要复杂的后处理才能提取有意义的数据结构。这个过程可能容易出错且不一致，尤其是在处理 JSON 输出时。Ollama 的结构化输出功能直接解决了这一挑战，它允许开发人员为模型输出定义精确的模式，从而确保在生产环境中保持一致性和可靠性。

结构化输出的常见用例包括：

从非结构化文本中提取结构化数据
构建一致的 API 响应
从文档中创建结构化知识库
实施可靠的数据提取管道
跨不同的 LLM 模型标准化输出

Phi-4：微软在开源 LLM 领域的最新创新

在深入研究实现细节之前，让我们先来探索一下我们选择的模型——微软的 Phi-4。 Phi-4 作为一款最先进的 140 亿参数模型发布，代表了开源语言模型的一项重大进步。它对结构化输出特别有吸引力的地方在于：

强大的推理能力
在计算受限的环境中高效的性能
16k token 上下文窗口
针对生产场景优化的延迟
强大的指令遵循能力

这些特性使得 Phi-4 成为需要结构化输出的应用程序的绝佳选择，因为其强大的推理能力有助于准确地解析和构建信息。

使用 Ollama 和 Phi-4 实现结构化输出

让我们深入了解如何利用 Ollama 的结构化输出功能与 Phi-4。首先，确保您已安装最新版本的 Ollama 并拉取了 Phi-4：

ollama pull phi4
pip install ollama

下面是如何定义和使用结构化输出的方法：

import ollama
from pydantic import BaseModel
from typing import List, Optional

class MovieReview(BaseModel):
    title: str
    year: int
    rating: float
    genres: List[str]
    summary: str
    strengths: List[str]
    weaknesses: Optional[List[str]]

response = ollama.chat(
    model='phi4',
    messages=[{
        'role': 'user',
        'content': '''Please analyze the movie "Inception" and provide a structured review.
        Return the response as JSON matching this schema:
        {
            "title": "string",
            "year": "number",
            "rating": "number",
            "genres": ["string"],
            "summary": "string",
            "strengths": ["string"],
            "weaknesses": ["string"]
        }'''
    }],
    format='json'
)

## Parse the response
review = MovieReview.model_validate_json(response.message.content)
print(review)