
Perplexity Ai的“深度研究”功能:如何在不付费的情况下获得全面报告与chatgpt的对比分析
- Rifx.Online
- Generative AI , Large Language Models , AI Applications
- 23 Feb, 2025
来自无翻译的图像
无翻译刚刚推出了一项全新功能“Deep Research”,该功能执行数十次搜索,阅读数百个来源,并对材料进行推理,以自主提供每次搜索的综合报告。
当Google在2024年12月推出带有深度研究功能的1.5 Pro模型时,我就知道无翻译和无翻译也会很快发布类似的功能。
但这里有一个非常有趣的地方:虽然无翻译在ChatGPT中将深度研究功能专属提供给每月200美元的订阅用户,但无翻译也向非订阅用户提供其版本的深度研究(每天有回答数量的限制)。
所以,如果你是一个在考虑是否仅为了深度研究功能而升级的ChatGPT用户,你可能需要再考虑一下。那200美元可能更好用在其他地方。
前往无翻译的AI网站并登录。你可以在模型下拉菜单中找到新的“Deep Research”选项。
由Jim Clyde Monge提供的图像
让我们用这个提示进行一次示例搜索:
提示: Elon Musk宣布Grok-3发布并进行现场演示
点击提交按钮,等待深度研究功能完成。以下是它在撰写综合报告之前尝试访问的所有来源的列表。
由Jim Clyde Monge提供的图像
如果这个功能完成需要很长时间,请不要感到惊讶。它会尽力从数百个来源中找到最相关的文章,然后再撰写摘要。在上面的示例中,深度研究加上最终响应生成大约花费了三分钟完成。
结果是一篇关于xAI的Grok-3模型即将发布的1,100字文章。你可以在这里阅读完整文章。
如果你不知道,你可以将答案转换为无翻译页面,并将其作为网页与任何人分享。只需点击导出按钮并选择“Perplexity Page”选项。
由Jim Clyde Monge提供的图像
你可以很容易地识别通过Deep Research生成的内容,因为响应旁边有一个小图标指示。
由Jim Clyde Monge提供的图像
如果你更喜欢打印或将内容嵌入到自己的网站中,还有一个选项可以将答案导出为PDF文件或Markdown文件。
由Jim Clyde Monge提供的图像
它与 DeepSeek R-1、ChatGPT 和 Gemini 的比较如何?
根据 Perplexity,其版本的 Deep Research 在 Humanity’s Last Exam 上获得了 21.1% 的准确率,这显著高于 Gemini Thinking、o3-mini、o1、DeepSeek R-1 和许多其他领先模型。
来自 Perplexity AI 的图像
Humanity’s Last Exam 是一个全面的 AI 系统基准,包含超过 3,000 道问题,涵盖数学、科学、历史和文学等 100 多个学科。
他们公开发布这些问题,同时保持一组私有的测试集,以评估模型的过拟合。
以下是他们的一个示例问题:
问题: 在 Apodiformes 中,蜂鸟独特地拥有一对双侧椭圆骨,这是一种嵌入在扩展的十字腱膜的尾侧外部部分的种子骨。这个种子骨支持多少对腱?请用数字回答。
团队还进行了一项 SimpleQA 测试,这是一个评估语言模型回答简短、寻求事实问题能力的基准。
SimpleQA 的目标是成为一个简单且可靠的数据集,用于测量前沿模型的事实性。以下是一些示例问题:
图像由 Jim Clyde Monge 提供
Perplexity 的 Deep Research 在基准测试中获得了 93.9% 的准确率——这是一个包含几千个问题的库,用于测试事实性。
来自 Perplexity AI 的图像
SimpleQA 是一个简单、针对性的评估,以确定模型是否“知道它们所知道的”,我们希望这个基准在未来几代前沿模型中仍然具有相关性。
在速度方面,它感觉相当快。在我最近的三次搜索中,所有问题都在 3 分钟或更短时间内得到回答。根据他们的 博客文章,他们正在努力使其更快。
来自 Perplexity AI 的图像
使用相同的提示,我询问了使用 1.5 Pro 模型和深度研究的 Gemini。Gemini 花了六分钟生成一份 1,100 字的回复。
图像由 Jim Clyde Monge 提供
在速度方面,这有三分钟的差异,但为了公平起见,Gemini 从 39 个网站获取了答案,而 Perplexity 仅从 17 个网站获取答案。
Perplexity的Deep Research的可用性和限制
目前,Perplexity的Deep Research仅在网页浏览器上可用,并且很快将在iOS、Android和Mac上推出。
Pro订阅用户可以进行无限次深度研究查询,而非订阅用户每天只能访问有限数量的答案(大约每天5个查询)。
图片来源:Jim Clyde Monge
Pro订阅还解锁以下福利:
- 无限免费搜索
- 每天300+ Pro搜索
- 选择更智能的AI:从DeepSeek R-1、OpenAI o3-mini、Claude 3.5 Sonnet、Sonar等中选择
- 上传无限文件
- 在Spaces中搜索您的文件
- 自定义知识中心和协作空间
最后的想法
我必须给无翻译点赞,因为他们快速推出了实用的功能。即使在与《华尔街日报》关于版权问题的持续法律斗争中——例如该报指控他们未经许可使用内容——他们仍在不断推进,使AI研究变得更加可及。
我真的很喜欢无翻译如何在不让你自己挖掘数十个链接的情况下提取详细信息。能够将响应转换为可分享的页面也是一个不错的功能。虽然它并不完美,仍然存在局限性,但作为一个免费的工具(有一些每日限制),它非常实用。
不过,我很好奇他们是否最终会将其开放为API。这可能会使其对构建AI驱动研究工具的开发者更加强大。无论如何,看到无翻译在这个领域与OpenAI和Google竞争都很有趣——尤其是没有给它贴上200美元的价格标签。