Fine tuning

利用模态微调 LLaMA-3 实现文本到 SQL 的生成：综合指南

Rifx.Online
Programming , Machine Learning , Data Science
11 Jan, 2025

微调大型语言模型（LLMs）传统上是一项复杂的工作，需要大量的基础设施设置和管理。然而，借助Modal的云平台和Axolotl的微调框架，您现在可以直接从本地机器对强大的模型如LLaMA-3进行微调，而无需处理基础设施的复杂性。在本指南中，我们将通过使用Modal的远程GPU功能和Axolotl的先进训练优化，逐步演示如何对LLaMA-3 8B进行SQL查询生成的微调。 ![](htt

精细调优大语言模型：揭开HuggingFace的神秘面纱！如何克服GPU内存束缚？

Rifx.Online
Programming , Machine Learning , Natural Language Processing
11 Jan, 2025

每次大型语言模型 (LLMs) 的新公告往往将性能推向新的高度，常常超越之前的基准（例如，巨量多任务语言理解或 MMLU）。这一进展激发了许多应用程序的出现，利用最大的和最优秀的模型。在我们之前的帖子中，我们讨论了 LLMs 的规模法则，并解释

Llm 微调指南：您是否需要以及如何进行微调

Rifx.Online
Natural Language Processing , Machine Learning , Data Science
27 Dec, 2024

在使用LLM时，我们最常收到的问题之一就是关于微调。每第二位客户都会问他们是否应该对他们的模型进行额外的训练。在大多数情况下，答案是否定的，他们不需要。现代LLM在许多商业应用中已经足够好，无需微调，比如帮助客户从花店订购鲜花的机器人。此外，他们没有数据来进行微调，而他们拥有的20个对话样本并不算数（200个也是如此）。训练和微调模型是一项昂贵的工作，如果可以的话，你真的应该避免它，

如何根据自己的数据微调 Llama-3.2：详细指南

Rifx.Online
Programming , Natural Language Processing , Generative AI
15 Dec, 2024

介绍 Meta发布的Llama-3.2系列在开源AI领域标志着一个重要的里程碑。到目前为止，该系列中下载量最多的模型是臭名昭著的meta-llama/Llama-3.2–11B-Vision-Instruct。不幸

Anthropic 的克劳德人工智能现在可以复制你的写作风格

Rifx.Online
Programming , Natural Language Processing , Generative AI
05 Dec, 2024

我作为多个组织的AI大使已经工作了几个月，如果有一个问题是大多数用户不断询问的，那就是如何让AI聊天机器人像他们一样写作。基本上，他们希望像ChatGPT、Claude和Gemini这样的聊天机器人能够模仿他们的写作风格，这样他们就不必每次都给AI提供详细的指示。我总是告诉用户，他们可以通过两种方式做到这一点：简单的方法：创建一个自定义聊天机器人，添加指示，例如以

MythoMax 13B (extended)

Text 2 text

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

Gryphe 8K context $1.125/M input tokens $1.125/M output tokens

FREE

MythoMax 13B (free)

Text 2 text

# Free

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

Gryphe 8K context $0 input tokens $0 output tokens