Type something to search...
我对 2025 年人工智能的五大预测

我对 2025 年人工智能的五大预测

以及一些非预测

正确预测未来是具有挑战性的。

问一下——以一个广为人知的流行文化偶像为例——汉娜和巴贝拉,杰森一家(The Jetsons)的创作者,他们想象了一个有飞行汽车和机器人女佣的未来,但没有想到互联网或智能手机会出现在我们的未来。

特别是在AI领域,许多失败的过于乐观的预测也导致了失望,最终出现了所谓的“AI寒冬”,即AI资金枯竭的时期。整个领域从公众视野中退回到不为人知的研究实验室,少数人顽强地日复一日继续我们的研究(是的,我是在其中一个寒冬期间开始从事AI工作的)。

例如,80年代由道格·莱纳特领导的“万象百科全书”(Cyc项目)惨遭失败。日本的“第五代计算”基于逻辑也同样失败。还有专家系统,在初期成功后,最终被彻底遗忘。还有我进行博士研究的整个子领域“程序合成”,这仍然让我感到痛心。

当时所有这些项目看起来都很有前途。

这使得一些不再年轻的人在每次看到有前景的技术时都在问自己,这项技术是否能够在长期内坚持下来,或者在初期炒作消失后像泡沫一样破裂。

然而,我们也可能在光谱的另一端出错;我们未能认识到某项技术是合法的,并且确实会对世界产生重大影响。例如,大多数人在1983年第一天互联网的出现时感到意外,甚至更多的是它改变生活的影响。

因此,我们需要在过于乐观和过于悲观之间找到平衡,并在可能的情况下,有证据支持我们的立场。

为了对以下预测有客观证据,我将避免预测任何完全新的事物(例如,我希望我的“无声声音”发明能成为热门,但这不太可能发生)。

这意味着,从某种意义上说,我预测的一切在某种胚胎形式中已经存在,并将只会成为主流。大多数技术从基础研究到主流商业化大约需要15年,或多或少。

在开始列举之前的最后一点是,我只会考虑趋势和技术,而不是产品,也不是原则或发现。技术是一组工具和方法,通过应用知识和创新来解决一个大问题,因此它比趋势更具体。

现在,废话不多说,让我们来看看将使2025年成为AI值得纪念的一年趋势和技术。我将按影响力递增的顺序呈现它们。

5. 自驾机器人出租车成为主流

在经历了2023-2024年非常艰难的时期后,当时大多数自驾公司因致命事故撞倒行人而关闭,现在显然,Alphabet的Waymo已经达到了一个可靠性水平,使其机器人出租车成为一个受欢迎的选择。最初在旧金山作为公共测试版推出,现在它在凤凰城、洛杉矶广泛提供,并很快将在奥斯丁和迈阿密推出,使其成为一个国家级的选择,市场份额快速增长。

我对这个显然成功的自驾服务有两个问题。

首先,我们不知道他们自驾算法的内部机制;这些都是专有和秘密的。如果没有其他人看到它是如何工作的,我们怎么能“信任”这一服务呢?我们只能依赖Waymo机器人出租车的过往记录,目前看起来非常好。但如果(上天保佑)下周发生一起严重的致命事故呢?在那种情况下——希望不会发生——信任将会在一夜之间崩溃。

第二个问题是Waymo的汽车太贵了,每辆大约需要$150,000(它们是加装了昂贵设备的捷豹I-PACE,不包括研发费用)。因此,除非Waymo找到一种方法来大规模生产更便宜的车型,否则这将无法盈利。

无论如何,自驾车现在接近成为主流,甚至变得无聊。在2025年,机器人出租车将成为每个居住在大城市的人的选择……

4. 行业特定的人工智能将胜过通用聊天机器人

我记得一年前,当许多人工智能爱好者每天都在寻找 ChatGPT 的用例,比如成为语言老师、创作搞笑诗歌、角色扮演以准备面试、生成商业创意、策划活动等。

尽管其中一些以提示为导向的应用可能很有趣,比如搞笑诗歌,但在大多数其他情况下,通用聊天机器人会因为几个原因而显得不足:

  • 它缺乏特定用例的训练数据,
  • 它无法访问可以操作的应用程序。

对于大多数现实世界中的非休闲应用,我们需要能够出色解决特定客户问题的专业软件。

以文本写作纠正为例。如果我们将 ChatGPT 与像 Grammarly 这样的嵌入式专业应用进行比较(我与它没有任何关联),我们可以看到与 ChatGPT 之间的巨大差异:

  • Grammarly 可以在 Microsoft Word 或 Google Docs 中运行(就像我现在所做的那样),而不是复制粘贴到 ChatGPT 再返回。
  • Grammarly 会在您文本中所做的每个更改下划线,以便您可以准确看到它在做什么。
  • 在纠正我的写作方面,Grammarly 对我来说似乎比 ChatGPT 更好。

这只是一个例子,但我认为 2025 年将是专业人工智能应用如雨后春笋般涌现的一年。它们已经开始出现,正如我们在以下例子中所看到的:

  • OpenSpace 是一个用于捕捉和分析建筑工地图像以监控进度和合规性的工具。
  • 我发现了一些在客户服务领域的新人工智能产品,它们在方法上有所不同。虽然 Ada 是一个面向客户的问答机器人,但 Forethought 帮助代理快速找到答案并更快地解决工单。
  • Luminar Neo 用于图像编辑,如天空替换、自动重光、背景去除和皮肤修饰,适合需要快速但专业编辑的摄影师和创意人士(当然,Adobe Photoshop 在这里是一个竞争对手)。
  • Runway 是视频生成、背景去除、物体跟踪和帧插值的领导者。

这个列表每天都在增长,应用领域从医疗诊断到文学。我们只能期待这一趋势在 2025 年得到巩固。

3. 更高的可靠性带来信任

2024年在大型语言模型(LLMs)的技术方面取得了显著进展,这些进展显然与可靠性无关,例如上下文窗口的大小(所有作为输入提供给聊天机器人的信息,包括提示以及其他额外信息)。但是,当上下文窗口用于提供包含可靠事实的“基础”信息时,可靠性可以(实际上是)大大提高。像RAG(检索增强生成)的方法系统化了这种方法,将“基础”信息视为“知识图谱”(经过整理的事实信息库,例如谷歌构建的庞大知识图谱)或仅仅是进行网络搜索,以在回答提示之前收集互联网上可以找到的主要事实。

其他近期的人工智能进展可能并不震撼,但在一定程度上有助于提高人工智能系统的可靠性。这些包括模型蒸馏(将复杂模型简化为更小的模型)、数据质量改进技术(垃圾进垃圾出,因此提高训练数据的质量转化为更好的可靠性)、数据增强(用于生成合成数据)和对抗训练(让模型接触到精心设计的输入,以误导它们)。

Sundar Pichai 宣布在2025年,“重点将放在提高人工智能模型的推理能力和可靠性上。”

可靠性的提高将导致信任:一旦你看到一个人工智能系统连续100次给出正确答案,你就倾向于将第101次的回答视为可信。问题是,尽管人工智能的可靠性将显著提高,但在可预见的未来,它不会是完全的保证。这可能导致缺乏人工检查,最终造成代价高昂的错误。

我们都听说过一个律师的故事,在ChatGPT的早期阶段,他急于准备涉及Avianca航空公司的审判文件。问题是,ChatGPT提到的所有之前的审判案例都是完全虚构的,这一点被法官发现,使得律师瞬间成名(以一种糟糕的方式)。

2. 纯粹的扩展已经完成

谷歌首席执行官:人工智能的发展终于放缓——“低垂的果实已经摘完”,谷歌首席执行官在《纽约时报》DealBook峰会上说道。

是的,互联网上可用的数据大部分已经被利用,没有“其他互联网”可以使用。因此,主要通过增大参数和输入数据来提升生成式AI系统的方式,已不再是推动进一步AI进步的关键。

此外,皮查伊表示,“山更陡峭”,并且“进步需要更深层次的突破”来应对更复杂的挑战。

我们必须接受,单纯的扩展已不再是提升生成式AI系统的有效方法。

但一些“专家”(如加里·马库斯)将这一观点推向极端,认为人工智能已经“碰壁”,在此之后不可能有进一步的进展。我认为马库斯是错的,因为他低估了(或忽视了?)全球研究实验室始终提出的小算法改进的价值。

我完全同意皮查伊的观点:山更陡峭,但人工智能将继续实现渐进式进步,而不再依赖于扩展。

1. AI代理将无处不在

“AI代理”和“代理AI”这两个术语现在被过度使用。当我发现到处都是炒作时,我的警觉性会被激发,让我对整个事情产生怀疑。

但在智能代理的情况下,我是在熟悉的领域:我在大学教授“多代理系统”课程已经超过十年。对我来说,代理不仅仅是市场营销人员展示的下一个亮眼事物。

代理系统有两种类型:个人助手和多代理系统。后者涉及多个代理相互沟通并合作或竞争,但我认为这与2025无关,因此我将重点放在个人代理上。

个人代理并不新鲜。在1995年,尼古拉斯·尼葛洛庞帝出版了《数字化生存》一书,提出了替代人们一直以来与计算机工作的方式。他称“点按”是旧的范式,在这种范式中,用户选择屏幕上的某个内容并采取行动(等等!难道我们现在还不是这样使用计算机吗?)。

尼葛洛庞帝提出使用一种新的范式,称为“委托”,即人类用户将高级任务交给助手来负责。例如,用户可以指示助手“接听每一个电话,并说我在中午之前无法接听,除非是我母亲——那时你可以把电话转给我。”

不错吧?

在1995年,技术距离实现这个愿景还相去甚远,因此尼葛洛庞帝的委托提议等待着更好的时机。在此之前的几年,1987年,苹果公司在当时备受厌恶的约翰·斯库利领导下制作了一段视频,展示了个人助手的未来概念。

视频《知识导航员》描绘了一位教授与一位穿着蝴蝶结的不可思议助手的口头互动。这个管家能够接听电话和留言,结合多个信息来源,并制作摘要和图表,所有这些都是教授委托的任务。

知识导航员的一些方面已经实现,例如口头互动、信息组合以及制作摘要和图表,但有些方面尚未实现,例如长时间处理电话、根据不同人提供消息等。

那么问题是:到2025年,个人代理将有多少成为现实?我认为以下几点将会出现:

  • 能够灵活进行口头互动的AI:在这一领域取得了令人难以置信的进展,一些OpenAI的高级语音模式听起来甚至比我认识的几个人还要人性化。这可以被视为已实现。
  • 能够采取行动的AI:“行动”可以是非常简单的事情,比如设置闹钟,这在像Apple Intelligence这样的平台上部分实现,因为苹果拥有整个平台,因此他们可以更好地利用所有应用程序,尤其是他们自己开发的应用程序,如时钟。但我还没有在Apple Intelligence中看到像“当我妻子打电话给我时,等15分钟,然后打电话给她母亲,邀请她周日参加聚会。如果她不接电话,就继续拨打,直到她接听”这样的功能。
  • 处理与人类用户账户相关的信息的网络表单和应用程序的咨询、注册、修改和删除。例如,AI应该能够完全购买音乐会门票,正确填写所有表单字段,甚至在操作完成之前使用用户的凭证。也许可以要求人类确认最终的“购买”按钮。我已经看到这种系统的原型正在被打磨,例如谷歌的“Project Mariner”、OpenAI的“AutoGPT”、Hugging Face的“HuggingGPT”、微软的Copilot和Anthropic的“计算机使用”。正是这些原型的丰富性让我相信这即将成为主流。

相信我,代理将在2025年无处不在!

但不要指望在2025年就会有完善的代理应用;2025年将是“代理爆炸”的一年,但大多数产品将处于测试阶段,甚至更糟,就像寒武纪大爆发一样,其中大多数将会消亡。

荣誉提名

这些趋势或技术接近进入主列表,但并不特定于2025年。我会包括:

  • Edge AI 和设备内智能
  • 节能型 AI 模型,AI 可持续性
  • AI 监管以减轻威胁

非预测

现在,我将关注我认为不会发生的其他人的预测。在某些情况下,它们只是幻想;在其他情况下,它们是过于乐观的想法;在其他情况下,这主要是出于恐惧。

我们在2025年不会有类似AGI(通用人工智能)的东西

耸人听闻的YouTube视频甚至一些AI专家声称“AGI就在眼前!”萨姆·阿尔特曼给出了“1000天”的时间表,而埃隆·马斯克则认为AGI更近(尽管考虑到他在承诺方面的记录,这并没有太多信息价值)。

但事实是,我上面提到的问题(可靠性、推理、产品开发、现实世界中的自动驾驶)远比AGI更为紧迫。

我们也可以看到关于AGI的目标不断被调整:我最近读到AGI是“可以在多个领域使用的AI。”抱歉,这并不是与AGI相同的“多功能AI”。

一旦到来,AGI从经济角度来看将是一个大事件,因为它不需要为每个新领域进行训练。AGI的泛化能力将使其能够适应以前未见过的情况,使其几乎可以立即应用,这比为每个领域训练AI便宜得多。

在我看来,AGI甚至不会出现在2026年的预测中……

AI 不会在 2025 年变得有意识

一些 AI 爱好者假装,由于 AI 发展如此迅速,下一步是让它“有意识”。他们被误导的原因如下:

首先,AI 不是关于意识,而是关于推理相关的认知能力。它甚至不旨在创造有知觉的生物。

然而,主要论点是,在 AI 历史上开发的各种方法和技术中,没有一种与意识相关。从智能搜索和 alpha-beta 剪枝到专家系统,再到分类或回归,完全没有与意识相关的内容。

坦率地说,我认为大多数期待有意识 AI 的人误解了生成式 AI 有时富有表现力——甚至情感化的——散文,把它视为“接近意识”,但实际上并非如此。那里根本“没有灵魂”。

AI不会在2025年消灭我们

最终,AI不会在类似《终结者》的末日中接管一切!

在2023年初,关于AI失控的恐惧充斥着各个角落,但在几次签署的呼吁要求在为时已晚之前停止AI开发后,2023年过去了,2024年几乎也是如此,而现在那些呼声听起来像是伊索寓言中的“喊狼来了的小男孩”。

也许我的预测是,在2025年,几乎没有人会呼吁在AI变得有意识并失控之前停止它。关于AI的更紧迫问题,比如它对劳动市场的影响、偏见的缓解、用于AI训练的人类工作的报酬以及限制误用(如政治虚假信息)等问题,最终将被认真对待。

Related Posts

使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
10 个强大的 Perplexity AI 提示,让您的营销任务自动化

10 个强大的 Perplexity AI 提示,让您的营销任务自动化

在当今快速变化的数字世界中,营销人员总是在寻找更智能的方法来简化他们的工作。想象一下,有一个个人助理可以为您创建受众档案,建议营销策略,甚至为您撰写广告文案。这听起来像是一个梦想? 多亏了像 Perplexity 这样的 AI 工具,这个梦想现在成为现实。通过正确的提示,您可以将 AI 转变为您的 个人营销助理。在本文中,我将分享 10 个强大的提示,帮助您自动

阅读更多
10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

人工智能技术,如机器学习、自然语言处理和数据分析,正在重新定义传统设计方法。从自动化重复任务到实现个性化用户体验,人工智能使设计师能够更加专注于战略思维和创造力。随着这一趋势的不断增长,UI/UX 设计师越来越多地采用 AI 驱动的工具来促进他们的工作。利用人工智能不仅能提供基于数据的洞察,还为满足多样化用户需求的创新设计解决方案开辟了机会。 1. 用户角色开发 目的

阅读更多
在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能(AI)的快速发展改变了企业的运作方式,使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计,AI工具帮助专业人士节省时间,提高生产力,专注于创造力。以下是按功能分类的100个AI工具的全面列表,以及它们在现实世界中的使用实例。 1. 研究工具 研究可能耗时,但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

阅读更多
你从未知道的 17 个令人惊叹的 GitHub 仓库

你从未知道的 17 个令人惊叹的 GitHub 仓库

Github 隐藏的宝石!! 立即收藏的代码库 学习编程相对简单,但掌握编写更好代码的艺术要困难得多。GitHub 是开发者的宝藏,那里“金子”是其他人分享的精心编写的代码。通过探索 GitHub,您可以发现如何编写更清晰的代码,理解高质量代码的样子,并学习成为更熟练开发者的基本步骤。 1. notwaldorf/emoji-translate *谁需

阅读更多