
解放 Claude 3.7 Sonnet:首个超越 Grok3 和 OpenAI 创新的混合推理模型
Claude 3.7 Sonnet:混合推理模型
期待已久!Anthropic 的 Claude 3.7 Sonnet 来了——这是他们在 2025 年的首次重大发布。此前,他们于 2024 年 7 月发布了 Sonnet 3.5 模型(一个强大的编码工具)。Anthropic 声称 Claude 3.7 Sonnet 是市场上首个混合推理模型,能够提供近乎即时的响应或详细的、逐步的、对用户可见的推理。API 用户可以精确控制模型的思考时长,从而根据他们的需求进行定制。Claude 3.7 Sonnet 在编码和前端 Web 开发方面表现出色。
Claude 3.7 Sonnet 是迄今为止最智能的模型,也是市场上首个混合推理模型。Claude 3.7 Sonnet 可以产生近乎即时的响应,或产生扩展的、逐步的思考,这些思考对用户是可见的。API 用户还可以对模型可以思考多久进行精细控制。
Claude 3.7 Sonnet 在编码和前端 Web 开发方面表现出特别强劲的改进。除了该模型之外,我们还引入了一个用于代理编码的命令行工具 Claude Code。Claude Code 作为有限的研究预览版提供,使开发人员能够直接从终端将大量的工程任务委托给 Claude。
Claude 3.7 Sonnet 现已在所有 Claude 计划中提供——包括 Free、Pro、Team 和 Enterprise——以及 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI。扩展思考模式在除免费 Claude 层之外的所有界面上都可用。
Claude 3.7 Sonnet 的主要亮点
以下是 Claude 3.7 Sonnet 在 Amazon Bedrock 中的几个值得注意的功能和能力。
-
首个具有混合推理的 Claude 模型——Claude 3.7 Sonnet 采用了不同的方法来思考模型。Claude 3.7 Sonnet 没有使用单独的模型——一个用于快速回答,另一个用于解决复杂问题——而是将推理作为单个模型内的核心功能集成。这种组合更类似于人脑的工作方式。毕竟,无论我们是在回答一个简单的问题还是解决一个难题,我们都使用同一个大脑。
-
该模型有两种模式——标准和扩展思考模式——可以在 Amazon Bedrock 中切换。在标准模式下,Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的改进版本。在扩展思考模式下,Claude 3.7 Sonnet 需要额外的时间来详细分析问题、计划解决方案,并在提供响应之前考虑多种观点,从而使其在性能方面取得进一步的进展。您可以通过选择何时使用推理能力来控制速度和成本。扩展思考令牌计入上下文窗口,并按输出令牌计费。
-
Anthropic 最强大的编码模型——Claude 3.7 Sonnet 在编码方面处于行业领先地位,擅长理解上下文和创造性地解决问题,根据 Anthropic 的说法,在 SWE-bench Verified 的标准模式下实现了行业领先的 70.3%。Claude 3.7 Sonnet 在大多数基准测试中的表现也优于 Claude 3.5 Sonnet。这些增强的功能使 Claude 3.7 Sonnet 成为为 AI 代理和复杂工作流程提供动力的理想选择。
来源:https://www.anthropic.com/news/claude-3-7-sonnet
它在 SWE-bench Verified 上提供了顶级的性能,这是一个测试 AI 模型解决现实世界软件挑战能力的基准。有关脚手架的详细信息,请参阅附录。
-
输出容量是其前身的 15 倍以上——与 Claude 3.5 Sonnet 相比,该模型提供了显着扩展的输出长度。当您明确要求更多细节、要求多个示例或请求其他上下文或背景信息时,这种增强的容量特别有用。要实现长输出,请尝试要求详细的提纲(对于写作用例,您可以将提纲细节指定到段落级别,并包括字数目标)。然后,要求响应将其段落索引到提纲中并重申字数。Claude 3.7 Sonnet 支持长达 128K 令牌的输出(通常可用时最多 64K,beta 版时最多 128K)。
-
可调节的推理预算——当您在 Amazon Bedrock 中使用 Claude 3.7 Sonnet 时,您可以控制思考的预算。这种灵活性有助于您权衡速度、成本和性能之间的权衡。通过为复杂问题分配更多令牌进行推理,或限制令牌以获得更快的响应,您可以针对您的特定用例优化性能。
如何访问 Claude Sonnet 3.7?
您可以通过聊天机器人和 API 访问此模型。让我们看看这两种方法:
通过聊天机器人使用 Sonnet 3.7
-
转到 Claude.ai 并使用您的 Gmail 帐户或 GitHub 注册。
-
选择正确的模型并开始您的对话!
通过 API 访问 Sonnet 3.7
注册并获取 API 密钥:
- 访问 Anthropic 网站 (anthropic.com) 并注册一个帐户。
- 导航到您帐户仪表板中的 API 部分并生成一个 API 密钥。此密钥将对您的请求进行身份验证。
安装 Anthropic Python 库:
您需要 anthropic Python 包才能与 API 交互。使用 pip 安装它:
pip install anthropic
设置您的环境:
安全地存储您的 API 密钥,最好将其存储为环境变量,以避免在脚本中对其进行硬编码。例如:
export ANTHROPIC_API_KEY='your-api-key-here'
Claude 3.7 Sonnet API 的 Python 代码示例
这是一个简单的示例,可帮助您开始使用 Claude 3.7 Sonnet 模型:
让我们试一试!
提示:“分析这个棋盘局面。建议当前玩家(白方)将黑方将死的最佳走法,并解释其推理过程”
Grok, DeepSeek, o3-mini 和 o1 的输出:
观察:
我使用 Grok 3, DeepSeek R1, OpenAI 的 o1 和 o3-mini 测试了这项图像分析任务,但它们都未能提供正确的答案。我感到震惊的是,Claude 3.7 Sonnet 不仅反应迅速,而且正确地给出了答案!
结论
Claude 3.7 Sonnet 的出现将混合推理推向了前沿,它将快速响应与深度、可见的问题解决相结合。它在编码、现实世界任务,甚至像 Pokémon 游戏玩法这样的细分测试中的卓越表现,使其成为一个强大的竞争者。