
黑森林实验室推出 Flux Pro 微调 API
- Rifx.Online
- Programming , Generative AI , Technology/WebAPI
- 24 Jan, 2025
当黑森林实验室 (BFL) 发布 Flux 开发者微调时,AI 社区为之疯狂,因为任何人都可以通过展示一小组示例图像来教模型识别和生成新概念,从而允许用户根据特定风格、角色或物体自定义模型的输出。
它迅速成为市场上最好的图像模型微调解决方案之一。如果您想了解如何微调 Flux Dev 模型,请查看本指南:
今天,BFL 更进一步,允许用户通过 API 微调 Flux Pro 模型。
根据 BFL 的说法,用户只需 1-5 张示例图像即可轻松通过文本提示重新构想用户提供的内容。这些图像可以采用不同格式,如 JPG、JPEG、PNG 或 WebP,分辨率限制为一百万像素,以获得最佳效果。
以下是一些示例输入图像:
训练时长取决于使用的图像数量和用户设置的迭代次数。以下是一些示例结果:
此外,Flux Pro 微调模型支持对给定图像进行迭代编辑的修复。这种技术结合了输入图像中的主题,以增强效果。
以下是 BFL API 上所有 Flux 模型的定价详情:
- Flux 1.1 Pro Ultra: 每张 $0.06
- Flux 1.1 Pro: 每张 $0.04
- Flux 1.0 Pro: 每张 $0.05
- Flux 1.0 Dev: 每张 $0.025
如何尝试 Flux Pro 微调
尝试 Flux Pro 微调 的最简单直接的方法是在 Fal AI 上进行。在探索页面中查找 fal-ai/flux-pro-trainer
模型,您应该会看到如下屏幕。
在 数据 URL 中,上传您的输入图像集,或上传一个包含图像的 zip 文件。可选地,修改微调评论和触发词。
将您的肖像图像作为训练输入添加。其他设置保持默认,然后点击 开始 按钮。
注意,触发词已更改为 Jimportrait
,训练步骤设置为 300。您可以将此值推高至 1000,以获得最佳结果,但这也会耗费较长时间且成本更高。
训练完成后,您将在屏幕右侧看到“已完成”状态和一个微调 ID。
要从训练好的模型生成图像,请点击 运行推理 按钮。使用如下示例提示:
提示: Jimportrait 在现代办公室环境中。他穿着合身的深色西装和干净的白衬衫,面带自信而友好的表情。办公室具有简约的设计,大窗户让自然光透入,桌子上放着一台笔记本电脑,背景有几排书架。
我不知道我在这里做错了什么,因为结果与我预期的相差甚远。我尝试调整参数和设置,但无法使其正常工作。
在成本方面,请查看以下详细信息:
- 少于 150 次迭代的请求费用为 $2\。
- 150 到 500 次迭代的请求费用为 $4\。
- 超过 500 次迭代的请求费用为 $6\。
您还可以通过 Fal 的 API 访问微调模型。只需打开 API 标签,按照说明将 API 集成到您自己的应用中。
以下是一个示例 NPM 调用:
import { fal } from "@fal-ai/client";
const result = await fal.subscribe("fal-ai/flux-pro-trainer", {
input: {
data_url: "",
finetune_comment: "test-1"
},
logs: true,
onQueueUpdate: (update) => {
if (update.status === "IN_PROGRESS") {
update.logs.map((log) => log.message).forEach(console.log);
}
},
});
console.log(result.data);
console.log(result.requestId);
注意: 在 Fal 上生成的图像是无商业用途限制的,因此您可以将结果用于商业目的。
如何尝试 Flux Pro 微调 API
好的,如果您有兴趣直接使用 Black Forest Labs 的 API,请按照以下步骤操作。
首先,添加一个 API 密钥,以便在尝试访问图像模型时获得授权。
微调 API 参考可以在这个 交互式文档 中找到。
以下是一个示例 POST 请求。请确保将 YOUR_SECRET_TOKEN 参数替换为您自己的 API 密钥。
fetch('https://api.us1.bfl.ai/v1/finetune', {
method: 'POST',
headers: {
'Content-Type': 'application/json',
'X-Key': 'YOUR_SECRET_TOKEN'
}
})
请注意 POST 请求主体部分的参数。
{
"file_data": "",
"finetune_comment": "my-first-finetune",
"trigger_word": "TOK",
"mode": "general",
"iterations": 300,
"learning_rate": 1,
"captioning": true,
"priority": "quality",
"finetune_type": "full",
"lora_rank": 32
}
让我们谈谈定价
Black Forest Labs 保持了定价的简单,以便您可以专注于您的项目。
以下是定价细分:
- 150 次迭代以下:快速测试或小规模实验的费用为 $2。
- 150 到 500 次迭代:大多数注重质量的项目费用为 $4,不会过于昂贵。
- 500 次迭代以上:复杂任务需要更多精确度和细节的费用为 $6。
您还需要单独支付从微调模型生成图像的费用。
虽然较旧的 Flux Dev 模型允许以显著较低的价格进行微调和图像生成,但 Flux Pro 的成本增加反映了其增强的功能。然而,这可能使得预算紧张的用户或习惯于 Flux Dev 经济实惠的用户感到不太可及。
不过,对于那些重视高质量输出和先进微调功能便利性的用户来说,Flux Pro 可能会为额外的费用提供合理的理由。这是成本与能力之间的权衡。
让我们谈谈优点和缺点
BFL 进行了一项用户研究,发现 68.9% 的受访者更喜欢 Flux Pro 微调的结果,而不是其他现有的微调服务。
黑森林实验室分享了针对不同用例的具体建议。对于角色模型训练,他们建议使用包含单个角色的图像。在风格迁移任务中,增加微调强度通常会产生更好的结果。
然而,对于那些还不知道的人来说,Flux Pro 不是开放权重。这意味着您不能从互联网上下载模型并在本地机器上运行。它们只允许您通过 API 为 Flux Pro 训练一个 lora。
这意味着什么?
这意味着您需要通过 BFL 的 API 为每次训练付费。
这意味着您需要为从微调模型生成的每个图像付费。
最后的想法
作为一名使用人工智能构建网页应用的开发者,这对我来说是个重大消息。我在四个月前推出了 Flux Labs AI,允许用户使用 Flux 图像模型创建自定义 LoRA。虽然这很不错,但一些用户指出生成的图像并不总是与输入示例匹配。
我希望升级到 Flux Pro 微调能在解决这个问题和提高微调图像质量方面产生重大影响。只需 1–5 张图像进行微调的想法听起来像是一个游戏规则改变者。
不过,微调的成本现在更高,而且由于 Flux Pro 不是开放权重,我们只能使用 BFL 的 API 进行训练和生成图像。这意味着可用的自定义 LoRA 可能会减少,这让人感到失望。
尽管如此,这仍然是一个令人兴奋的更新。我希望 API 访问能够扩展到像 Fal AI 和 Replicate 这样的平台,因为它们对开发者来说非常容易使用。希望这只是更多改进的开始。
这个故事发布在 Generative AI。请在 LinkedIn 上与我们联系,并关注 Zeniteq,以便及时了解最新的 AI 故事。
订阅我们的 newsletter 和 YouTube 频道,以获取最新的生成 AI 新闻和更新。让我们一起塑造 AI 的未来!