Dpo

Llm 微调指南：您是否需要以及如何进行微调

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
27 Dec, 2024

在使用LLM时，我们最常收到的问题之一就是关于微调。每第二位客户都会问他们是否应该对他们的模型进行额外的训练。在大多数情况下，答案是否定的，他们不需要。现代LLM在许多商业应用中已经足够好，无需微调，比如帮助客户从花店订购鲜花的机器人。此外，他们没有数据来进行微调，而他们拥有的20个对话样本并不算数（200个也是如此）。训练和微调模型是一项昂贵的工作，如果可以的话，你真的应该避免它，