Type something to search...

Fine tuning

利用模态微调 LLaMA-3 实现文本到 SQL 的生成:综合指南

利用模态微调 LLaMA-3 实现文本到 SQL 的生成:综合指南

微调大型语言模型(LLMs)传统上是一项复杂的工作,需要大量的基础设施设置和管理。然而,借助Modal的云平台和Axolotl的微调框架,您现在可以直接从本地机器对强大的模型如LLaMA-3进行微调,而无需处理基础设施的复杂性。 在本指南中,我们将通过使用Modal的远程GPU功能和Axolotl的先进训练优化,逐步演示如何对LLaMA-3 8B进行SQL查询生成的微调。 ![](htt

阅读更多
精细调优大语言模型:揭开HuggingFace的神秘面纱!如何克服GPU内存束缚?

精细调优大语言模型:揭开HuggingFace的神秘面纱!如何克服GPU内存束缚?

每次大型语言模型 (LLMs) 的新公告往往将性能推向新的高度,常常超越之前的基准(例如,巨量多任务语言理解或 MMLU)。这一进展激发了许多应用程序的出现,利用最大的和最优秀的模型。在我们之前的帖子中,我们讨论了 LLMs 的规模法则,并解释

阅读更多
Llm 微调指南:您是否需要以及如何进行微调

Llm 微调指南:您是否需要以及如何进行微调

在使用LLM时,我们最常收到的问题之一就是关于微调。每第二位客户都会问他们是否应该对他们的模型进行额外的训练。 在大多数情况下,答案是否定的,他们不需要。现代LLM在许多商业应用中已经足够好,无需微调,比如帮助客户从花店订购鲜花的机器人。此外,他们没有数据来进行微调,而他们拥有的20个对话样本并不算数(200个也是如此)。 训练和微调模型是一项昂贵的工作,如果可以的话,你真的应该避免它,

阅读更多
如何根据自己的数据微调 Llama-3.2:详细指南

如何根据自己的数据微调 Llama-3.2:详细指南

介绍 Meta发布的Llama-3.2系列在开源AI领域标志着一个重要的里程碑。到目前为止,该系列中下载量最多的模型是臭名昭著的meta-llama/Llama-3.2–11B-Vision-Instruct。不幸

阅读更多
Anthropic 的克劳德人工智能现在可以复制你的写作风格

Anthropic 的克劳德人工智能现在可以复制你的写作风格

我作为多个组织的AI大使已经工作了几个月,如果有一个问题是大多数用户不断询问的,那就是如何让AI聊天机器人像他们一样写作。基本上,他们希望像ChatGPT、Claude和Gemini这样的聊天机器人能够模仿他们的写作风格,这样他们就不必每次都给AI提供详细的指示。 我总是告诉用户,他们可以通过两种方式做到这一点:简单的方法: 创建一个自定义聊天机器人,添加指示,例如以

阅读更多

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

MythoMax 13B (extended)
Gryphe
8K context $1.125/M input tokens $1.125/M output tokens
FREE

One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay. #merge 这些是 MythoMax 13B 的扩展上下文端点。它们可能价格更高。 ...

MythoMax 13B (free)
Gryphe
8K context $0 input tokens $0 output tokens