Type something to search...
提升LLM输出质量的简单技巧!如何达到1000%的进步?

提升LLM输出质量的简单技巧!如何达到1000%的进步?

我希望我能更早知道这个技巧。

去年夏天我在Adobe Research(班加罗尔)实习时,我的工作是使开源LLM更符合上下文。这意味着无论提供的上下文说了什么,LLM都需要遵循它。

我尝试了一种方法,查看输入token的激活,并利用其中的一些现有模式来识别在上下文中出现的token,并对它们进行比其他token更大的提升。这被称为“logit变换”。有时,logit变换可能会出错,导致低概率token超过所有其他token。

在上面的例子中,假设上下文说奥林匹亚是首府。

显然,在没有任何变换的情况下,输出是西雅图。

经过变换,输出是“eek”。

这两个答案都不正确。

我们现在不讨论变换的细节。你可以通过这个链接阅读更多细节:

但你可能已经猜到发生了什么:

我的输出完全混乱不堪。

示例输出:“华盛顿的首府是seekek0q3n ee”

我困惑了一段时间,不知道该怎么办。

我尝试的第一件事是减少通过我尝试的方法提升token的幅度。虽然减少幅度有助于降低输出的混乱程度,但我试图实现的上下文对齐也随之减少。几乎就像我必须在上下文对齐和输出的混乱程度之间找到平衡。

但在我接下来尝试的事情之后,混乱程度完全解决了,而没有影响上下文对齐。

诀窍

我只是过滤掉了概率非常低的词汇。

这完全消除了乱码输出,同时仍然让我改善输出的上下文对齐。

最后,我的方法稍微改善了上下文对齐,同时保持了输出的流畅性和语法正确性。

过滤函数

这是整体函数的外观,考虑到过滤和logit变换。

假设qN(x)是我们试图修改的logit分布。在这种情况下的修改是qN与qM的对数。将其视为某种函数,该函数改变输出分布,使LLM更加“真实”。

现在,过滤方面是通过将logits设置为-infinity来处理的,如果概率值低于阈值。因此,像“Washington”后面的“eek”这样的高度不可能的token在这里被移除。请记住,当我们对logits进行softmax以获得概率分布时,我们使用的是指数函数。因此,将任何logit设置为-infinity相当于将该token的概率设置为零。

您可以在这里看到过滤阈值是如何定义的。

本质上,阈值是最可能的下一个token概率的某个分数。这可以是任何东西,具体取决于同样可能被预测为下一个的token数量。这就是为什么我们不能采用固定的阈值,而是取某个分数。

这种特定形式的过滤函数在实践中非常重要,因为以下两种方法都没有那么有效:

  • 固定数量的最高概率token(例如,前10个概率token)
  • 固定阈值(例如,0.1)

结论与局限性

这是一个相当有趣的应用,采用了一种相对简单的技术,这在LLM的输出质量上具有深远的影响。具体来说,在应用某些变换时,这些变换通常仅适用于高概率的tokens,而低概率的tokens需要在变换分布之前先被消除。

我发现这些解码方法是改变LLM行为的令人兴奋的新方法,但尽管有这样的过滤方法,重要的是要意识到涉及logits变换的方法是有限制的。虽然这种过滤方法在整体上可能很好地解决了混乱的输出,但所需的过滤阈值使得输出更加流畅可能在不同的提示中有所不同。这使得标准化的过滤器很难开发。

即使过滤方法在大多数情况下有效,也很难证明它在所有情况下都有效——如果要在更商业的应用中采用它,我们可能需要对它有更多的信心。

Related Posts

使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
10 个强大的 Perplexity AI 提示,让您的营销任务自动化

10 个强大的 Perplexity AI 提示,让您的营销任务自动化

在当今快速变化的数字世界中,营销人员总是在寻找更智能的方法来简化他们的工作。想象一下,有一个个人助理可以为您创建受众档案,建议营销策略,甚至为您撰写广告文案。这听起来像是一个梦想? 多亏了像 Perplexity 这样的 AI 工具,这个梦想现在成为现实。通过正确的提示,您可以将 AI 转变为您的 个人营销助理。在本文中,我将分享 10 个强大的提示,帮助您自动

阅读更多
10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

10+ 面向 UI/UX 设计师的顶级 ChatGPT 提示

人工智能技术,如机器学习、自然语言处理和数据分析,正在重新定义传统设计方法。从自动化重复任务到实现个性化用户体验,人工智能使设计师能够更加专注于战略思维和创造力。随着这一趋势的不断增长,UI/UX 设计师越来越多地采用 AI 驱动的工具来促进他们的工作。利用人工智能不仅能提供基于数据的洞察,还为满足多样化用户需求的创新设计解决方案开辟了机会。 1. 用户角色开发 目的

阅读更多
在几分钟内完成数月工作的 100 种人工智能工具

在几分钟内完成数月工作的 100 种人工智能工具

人工智能(AI)的快速发展改变了企业的运作方式,使人们能够在短短几分钟内完成曾经需要几周或几个月的任务。从内容创作到网站设计,AI工具帮助专业人士节省时间,提高生产力,专注于创造力。以下是按功能分类的100个AI工具的全面列表,以及它们在现实世界中的使用实例。 1. 研究工具 研究可能耗时,但人工智能工具使查找、分析和组织数据变得更加容易。**ChatGPT, Cop

阅读更多
你从未知道的 17 个令人惊叹的 GitHub 仓库

你从未知道的 17 个令人惊叹的 GitHub 仓库

Github 隐藏的宝石!! 立即收藏的代码库 学习编程相对简单,但掌握编写更好代码的艺术要困难得多。GitHub 是开发者的宝藏,那里“金子”是其他人分享的精心编写的代码。通过探索 GitHub,您可以发现如何编写更清晰的代码,理解高质量代码的样子,并学习成为更熟练开发者的基本步骤。 1. notwaldorf/emoji-translate *谁需

阅读更多