
开启创新:Openai 的深度研究框架如何彻底改变自主研究任务
- Rifx.Online
- Generative AI , Large Language Models , AI Applications
- 23 Feb, 2025
ChatGPT网站,包括深度研究按钮
我习惯于开放AI过度承诺而未能兑现。
当他们宣布Sora时,他们假装这会在一夜之间颠覆好莱坞,并且人们可以向Netflix描述他们想看的任何内容,完整的电视剧将在11分半钟内生成。
显然,我们没有得到那样的结果。
但一定有人在Sam Altman的心中植入了真正的恐惧。也许是DeepSeek及其革命性的R1模型,迄今为止这是最好的开源大型推理模型。也许是开放AI的投资者,他们对同样的事情感到厌倦,对操作员这个基于浏览器的AI框架并不感兴趣。也许他只是做了一个噩梦。
但Sam的灵魂中发生了一些变化。而AI爱好者对此非常幸运。
因为开放AI刚刚悄然发布了 深度研究。
什么是深度研究?
深度研究是我见过的第一个成功的“AI代理”的真实世界应用。你给它一个复杂且耗时的任务,它将完全自主地进行研究,并提供引用支持。
这对个人和企业来说是极其有用的。
我第一次可以让AI完成一个复杂的任务,离开我的电脑,然后回来时带着一份包含我所需内容的详细报告。
这里有一个例子。
## Example code block
def example_function():
return "This is an example."
一个现实世界的研究任务
当开放AI的操作员,一个基于浏览器的代理框架,发布时,我给了它以下任务。
要求操作员寻找金融影响者
从YouTube收集50个受欢迎的金融影响者的列表。获取他们的领英信息(如果可能的话)、他们的电子邮件以及他们频道内容的简短总结。将答案格式化为表格。
它做得非常糟糕。
操作员创建的电子表格
- 它产生了虚假信息,给出了根本不存在的领英资料和电子邮件
- 它的速度极其缓慢
- 它没有一个好的策略
因此,我对深度研究并没有抱太高的期望。与操作员不同,它是完全自主和异步的。它不会打开浏览器并访问网站;它只是通过爬虫搜索网络。这使得它快得多。
而且显然准确得多。我给深度研究一个更具挑战性的任务。
要求深度研究为我寻找影响者
我告诉它不要仅仅查看YouTube,而是查看领英、YouTube和Instagram。
然后它问了我几个后续问题,包括是否应该优先考虑某些平台,或者我想要特定数量的关注者。我感到有些吃惊,也有点印象深刻。
然后我给了它我的回答,然后……什么都没有。
我对AI的回应
它告诉我,当它准备好时会“通知我”。作为一个在GPT-3之前就开始使用AI的人,我对此并不习惯。
我给自己泡了一杯咖啡,回来时看到一个疯狂的电子表格。
深度研究在10分钟后的回应
AI收集了100个影响者的列表,并提供了他们资料的直接链接。仅通过点击几个链接,我就能判断它没有产生虚假信息;这100%是真实的。
我感到震惊。
这个巧妙的工具可能刚刚改变了我进行潜在客户生成的方式。作为一个试图与其他人合作的小企业,手动筛选资料、阅读并制定定制的信息听起来令人疲惫。
我不想这样做。
而现在我不必这样做了……
这太疯狂了。
结论思考
仅仅通过我与这个工具玩了15分钟,我可以确切地知道开放AI提高了他们的水平。他们希望将代理工具变得普遍的愿景不再像一个童话。虽然我仍然对代理会像他们所相信的那样无处不在持有强烈的怀疑,但在潜在客户生成方面,这个功能确实是个福音。
总体而言,我感到非常兴奋。并不是每天都有AI爱好者看到由最大的AI巨头之一发布的新型AI工具。我很期待人们将它用于什么,以及像Meta和DeepSeek这样的开源巨头如何将其转变为他们自己的产品。
如果你认为AI的炒作正在减退,开放AI刚刚证明你错了。