Type something to search...
更智能、更快速:OpenAI o1 和 o1 pro 模式

更智能、更快速:OpenAI o1 和 o1 pro 模式

就在12小时前,OpenAI推出了新的o1模型和带有专业模式的o1。如您所知,o1模型是首个在回答之前进行思考的模型系列,提供更详细和准确的响应,特别是在数学、编码和研究方面。

人们关注两件事:多模态性解决难题,而这些新模型在这两个领域表现出色。

非会员链接。

在解决困难问题上的超越表现

让我们来看看它们在具有挑战性的问题上的表现。

我们可以看到,o1相比于o1-preview模型有了显著的改进,更不用说gpt4o模型了。具体来说,新推出的o1模型在AIME数学竞赛和CodeForce编程竞赛问题上,比o1-preview模型高出约1.4到1.5倍

GPQA钻石问题包含约200道多项选择题,每道题有四个答案选项。大约一年前,GPT-4模型的准确率仅为36%,勉强高于随机猜测的结果。现在,o1模型的得分为78%,可与人类专家相媲美。

此外,OpenAI还推出了一个更高级的模型,称为o1-Pro。用户只有在订阅Pro计划后才能访问o1-Pro,该计划目前的费用为每月200美元o1-Pro模型在这些具有挑战性的任务上表现略优于o1模型

注意,OpenAI在这里使o1模型相比于前一图中的“o1”模型表现更弱,以使Pro模式的o1模型显得更有能力。例如,在前一图中,o1模型的准确率为83.3,而在这里它在竞赛数学中的得分仅为78.3。

这看似微不足道,但考虑一下最坏情况:OpenAI通过询问同样的问题四次来测试模型,仅在模型四次都回答正确时才算作正确。与之前的图相比,o1-Pro的表现下降是微乎其微的

更快更聪明的思考

新的 o1 模型也更加智能。

如果你问一个简单的问题,它不会花太长时间思考,但如果你问一个更难的问题,它仍然可以花时间进行推理。根据 OpenAI 的说法,它的整体思维速度约为 比 o1-preview 模型快 50%,在下一个例子中你将看到这一点。

OpenAI 团队向 o1 和 o1-preview 模型提出了相同的问题:“列出第二世纪的罗马皇帝,包括他们的日期和成就。”由于罗马皇帝数量众多,模型需要时间来推理这些信息。 o1 模型花费了 14 秒,而 o1-preview 模型花费了 33 秒

多模态 + o1 模型

现在让我们来谈谈多模态。

之前,o1-preview 模型并不是多模态的,但 新的 o1 模型现在可以同时处理文本和图像。为了演示这一点,OpenAI 向模型展示了一幅手绘的 1GW 数据中心蓝图,设置在太空中。它特别包括了一个散热器冷却系统,因为在这种环境下没有空气或水来冷却 GPU。

注意:o1 目前仍不支持多模态文档。

接下来,OpenAI 团队要求 o1 模型找出散热器面积的下限——就像你可能在一般物理教科书中遇到的问题一样。

从输出结果来看,我们看到模型准确识别了手写的“1GW”参数。由于文本或图像中没有指定冷却面板的温度,模型假设温度约为 300 K,并在此假设下进行计算。这意味着模型能够处理模糊性,从而进行推理并很好地执行计算。

o1-pro模型

对于o1-Pro,OpenAI通过提出一个具有挑战性的化学问题来展示模型的能力。

哪个蛋白质严格遵循以下标准?

1. 前体多肽的长度为210到230个氨基酸残基。

2. 编码该蛋白质的基因跨越32千碱基。

3. 该基因位于X染色体上,具体位于Xp22带。

4. 信号肽由23个氨基酸残基组成。

5. 该蛋白质促进细胞间的粘附。

6. 该蛋白质在维持特定部分神经系统的健康中发挥关键作用。

对于任何不熟悉这个主题的人,让我解释一下。

蛋白质的初始形式仅仅是一条由210到230个氨基酸组成的链。为了正常功能,这条链必须折叠成正确的3D结构。折叠该蛋白质的指令由一个跨越约32千碱基(32,000个碱基对)的基因编码,该基因位于X染色体的Xp22区域。

一旦正确折叠,蛋白质可以帮助细胞相互粘附,并在维持神经系统健康中发挥至关重要的作用。

这是一个具有挑战性的问题,因为每个标准包括成千上万的候选者。因此,模型进入“思考”状态,花费数分钟来确定答案。

一旦完成,您可以点击查看模型为得出答案而经历的推理步骤。模型的答案是“RS1”,相当准确。您可以在以下网站验证该基因信息:

Retinoschisin 1 GeneCards

RS1,含有Discoidin结构域的视网膜细胞粘附蛋白,关联于X-连锁视网膜裂孔,存在为一种新型二硫键连接的八聚体

Related Posts

使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
10 个强大的 Perplexity AI 提示,让您的营销任务自动化

10 个强大的 Perplexity AI 提示,让您的营销任务自动化

在当今快速变化的数字世界中,营销人员总是在寻找更智能的方法来简化他们的工作。想象一下,有一个个人助理可以为您创建受众档案,建议营销策略,甚至为您撰写广告文案。这听起来像是一个梦想? 多亏了像 Perplexity 这样的 AI 工具,这个梦想现在成为现实。通过正确的提示,您可以将 AI 转变为您的 个人营销助理。在本文中,我将分享 10 个强大的提示,帮助您自动

阅读更多
10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

人工智能技术,如机器学习、自然语言处理和数据分析,正在重新定义传统设计方法。从自动化重复任务到实现个性化用户体验,人工智能使设计师能够更加专注于战略思维和创造力。随着这一趋势的不断增长,UI/UX 设计师越来越多地采用 AI 驱动的工具来促进他们的工作。利用人工智能不仅能提供基于数据的洞察,还为满足多样化用户需求的创新设计解决方案开辟了机会。 1. 用户角色开发 目的

阅读更多
在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能(AI)的快速发展改变了企业的运作方式,使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计,AI工具帮助专业人士节省时间,提高生产力,专注于创造力。以下是按功能分类的100个AI工具的全面列表,以及它们在现实世界中的使用实例。 1. 研究工具 研究可能耗时,但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

阅读更多
你从未知道的 17 个令人惊叹的 GitHub 仓库

你从未知道的 17 个令人惊叹的 GitHub 仓库

Github 隐藏的宝石!! 立即收藏的代码库 学习编程相对简单,但掌握编写更好代码的艺术要困难得多。GitHub 是开发者的宝藏,那里“金子”是其他人分享的精心编写的代码。通过探索 GitHub,您可以发现如何编写更清晰的代码,理解高质量代码的样子,并学习成为更熟练开发者的基本步骤。 1. notwaldorf/emoji-translate *谁需

阅读更多