Openchat

no content

OpenChat 3.5 7B

OpenChat 7B 是一个开源语言模型库，采用“C-RLFT（条件强化学习微调）”策略进行了微调，该策略受到离线强化学习的启发。它在没有偏好标签的混合质量数据上进行了训练。对于在 Mistral 7B 上微调的 OpenChat，请查看 OpenChat 7B。对于在 Llama 8B 上微调的 Op...

Openchat 8K context $0.055/M input tokens $0.055/M output tokens

OpenChat 3.5 7B

Text 2 text

OpenChat 7B 是一个开源语言模型库，经过“C-RLFT（条件强化学习微调）”的微调——这是一种受离线强化学习启发的策略。它在混合质量的数据上进行训练，没有偏好标签。对于在 Mistral 7B 上微调的 OpenChat，请查看 OpenChat 7B。对于在 Llama 8B 上微调的 OpenChat，请查看 [Ope...

Openchat 8K context $0.055/M input tokens $0.055/M output tokens