提升LLM输出质量的简单技巧！如何达到1000%的进步？

Rifx.Online
Natural Language Processing , Machine Learning , Generative AI
28 Dec, 2024

我希望我能更早知道这个技巧。

去年夏天我在Adobe Research（班加罗尔）实习时，我的工作是使开源LLM更符合上下文。这意味着无论提供的上下文说了什么，LLM都需要遵循它。

我尝试了一种方法，查看输入token的激活，并利用其中的一些现有模式来识别在上下文中出现的token，并对它们进行比其他token更大的提升。这被称为“logit变换”。有时，logit变换可能会出错，导致低概率token超过所有其他token。

在上面的例子中，假设上下文说奥林匹亚是首府。

显然，在没有任何变换的情况下，输出是西雅图。

经过变换，输出是“eek”。

这两个答案都不正确。

我们现在不讨论变换的细节。你可以通过这个链接阅读更多细节：

但你可能已经猜到发生了什么：

我的输出完全混乱不堪。

示例输出：“华盛顿的首府是seekek0q3n ee”

我困惑了一段时间，不知道该怎么办。

我尝试的第一件事是减少通过我尝试的方法提升token的幅度。虽然减少幅度有助于降低输出的混乱程度，但我试图实现的上下文对齐也随之减少。几乎就像我必须在上下文对齐和输出的混乱程度之间找到平衡。

但在我接下来尝试的事情之后，混乱程度完全解决了，而没有影响上下文对齐。

诀窍

我只是过滤掉了概率非常低的词汇。

这完全消除了乱码输出，同时仍然让我改善输出的上下文对齐。

最后，我的方法稍微改善了上下文对齐，同时保持了输出的流畅性和语法正确性。

过滤函数

这是整体函数的外观，考虑到过滤和logit变换。

假设qN(x)是我们试图修改的logit分布。在这种情况下的修改是qN与qM的对数。将其视为某种函数，该函数改变输出分布，使LLM更加“真实”。

现在，过滤方面是通过将logits设置为-infinity来处理的，如果概率值低于阈值。因此，像“Washington”后面的“eek”这样的高度不可能的token在这里被移除。请记住，当我们对logits进行softmax以获得概率分布时，我们使用的是指数函数。因此，将任何logit设置为-infinity相当于将该token的概率设置为零。

您可以在这里看到过滤阈值是如何定义的。