Type something to search...
黑森林实验室推出 Flux Pro 微调 API

黑森林实验室推出 Flux Pro 微调 API

当黑森林实验室 (BFL) 发布 Flux 开发者微调时,AI 社区为之疯狂,因为任何人都可以通过展示一小组示例图像来教模型识别和生成新概念,从而允许用户根据特定风格、角色或物体自定义模型的输出。

它迅速成为市场上最好的图像模型微调解决方案之一。如果您想了解如何微调 Flux Dev 模型,请查看本指南:

今天,BFL 更进一步,允许用户通过 API 微调 Flux Pro 模型。

根据 BFL 的说法,用户只需 1-5 张示例图像即可轻松通过文本提示重新构想用户提供的内容。这些图像可以采用不同格式,如 JPG、JPEG、PNG 或 WebP,分辨率限制为一百万像素,以获得最佳效果。

以下是一些示例输入图像:

训练时长取决于使用的图像数量和用户设置的迭代次数。以下是一些示例结果:

此外,Flux Pro 微调模型支持对给定图像进行迭代编辑的修复。这种技术结合了输入图像中的主题,以增强效果。

以下是 BFL API 上所有 Flux 模型的定价详情:

  • Flux 1.1 Pro Ultra: 每张 $0.06
  • Flux 1.1 Pro: 每张 $0.04
  • Flux 1.0 Pro: 每张 $0.05
  • Flux 1.0 Dev: 每张 $0.025

如何尝试 Flux Pro 微调

尝试 Flux Pro 微调 的最简单直接的方法是在 Fal AI 上进行。在探索页面中查找 fal-ai/flux-pro-trainer 模型,您应该会看到如下屏幕。

数据 URL 中,上传您的输入图像集,或上传一个包含图像的 zip 文件。可选地,修改微调评论和触发词。

将您的肖像图像作为训练输入添加。其他设置保持默认,然后点击 开始 按钮。

注意,触发词已更改为 Jimportrait,训练步骤设置为 300。您可以将此值推高至 1000,以获得最佳结果,但这也会耗费较长时间且成本更高。

训练完成后,您将在屏幕右侧看到“已完成”状态和一个微调 ID。

要从训练好的模型生成图像,请点击 运行推理 按钮。使用如下示例提示:

提示: Jimportrait 在现代办公室环境中。他穿着合身的深色西装和干净的白衬衫,面带自信而友好的表情。办公室具有简约的设计,大窗户让自然光透入,桌子上放着一台笔记本电脑,背景有几排书架。

我不知道我在这里做错了什么,因为结果与我预期的相差甚远。我尝试调整参数和设置,但无法使其正常工作。

在成本方面,请查看以下详细信息:

  • 少于 150 次迭代的请求费用为 $2\。
  • 150 到 500 次迭代的请求费用为 $4\。
  • 超过 500 次迭代的请求费用为 $6\。

您还可以通过 Fal 的 API 访问微调模型。只需打开 API 标签,按照说明将 API 集成到您自己的应用中。

以下是一个示例 NPM 调用:

import { fal } from "@fal-ai/client";

const result = await fal.subscribe("fal-ai/flux-pro-trainer", {
  input: {
    data_url: "",
    finetune_comment: "test-1"
  },
  logs: true,
  onQueueUpdate: (update) => {
    if (update.status === "IN_PROGRESS") {
      update.logs.map((log) => log.message).forEach(console.log);
    }
  },
});
console.log(result.data);
console.log(result.requestId);

注意: 在 Fal 上生成的图像是无商业用途限制的,因此您可以将结果用于商业目的。

如何尝试 Flux Pro 微调 API

好的,如果您有兴趣直接使用 Black Forest Labs 的 API,请按照以下步骤操作。

首先,添加一个 API 密钥,以便在尝试访问图像模型时获得授权。

微调 API 参考可以在这个 交互式文档 中找到。

以下是一个示例 POST 请求。请确保将 YOUR_SECRET_TOKEN 参数替换为您自己的 API 密钥。

fetch('https://api.us1.bfl.ai/v1/finetune', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
    'X-Key': 'YOUR_SECRET_TOKEN'
  }
})

请注意 POST 请求主体部分的参数。

{
  "file_data": "",
  "finetune_comment": "my-first-finetune",
  "trigger_word": "TOK",
  "mode": "general",
  "iterations": 300,
  "learning_rate": 1,
  "captioning": true,
  "priority": "quality",
  "finetune_type": "full",
  "lora_rank": 32
}

让我们谈谈定价

Black Forest Labs 保持了定价的简单,以便您可以专注于您的项目。

以下是定价细分:

  • 150 次迭代以下:快速测试或小规模实验的费用为 $2
  • 150 到 500 次迭代:大多数注重质量的项目费用为 $4,不会过于昂贵。
  • 500 次迭代以上:复杂任务需要更多精确度和细节的费用为 $6

您还需要单独支付从微调模型生成图像的费用。

虽然较旧的 Flux Dev 模型允许以显著较低的价格进行微调和图像生成,但 Flux Pro 的成本增加反映了其增强的功能。然而,这可能使得预算紧张的用户或习惯于 Flux Dev 经济实惠的用户感到不太可及。

不过,对于那些重视高质量输出和先进微调功能便利性的用户来说,Flux Pro 可能会为额外的费用提供合理的理由。这是成本与能力之间的权衡。

让我们谈谈优点和缺点

BFL 进行了一项用户研究,发现 68.9% 的受访者更喜欢 Flux Pro 微调的结果,而不是其他现有的微调服务。

黑森林实验室分享了针对不同用例的具体建议。对于角色模型训练,他们建议使用包含单个角色的图像。在风格迁移任务中,增加微调强度通常会产生更好的结果。

然而,对于那些还不知道的人来说,Flux Pro 不是开放权重。这意味着您不能从互联网上下载模型并在本地机器上运行。它们只允许您通过 API 为 Flux Pro 训练一个 lora。

这意味着什么?

这意味着您需要通过 BFL 的 API 为每次训练付费。

这意味着您需要为从微调模型生成的每个图像付费。

最后的想法

作为一名使用人工智能构建网页应用的开发者,这对我来说是个重大消息。我在四个月前推出了 Flux Labs AI,允许用户使用 Flux 图像模型创建自定义 LoRA。虽然这很不错,但一些用户指出生成的图像并不总是与输入示例匹配。

我希望升级到 Flux Pro 微调能在解决这个问题和提高微调图像质量方面产生重大影响。只需 1–5 张图像进行微调的想法听起来像是一个游戏规则改变者。

不过,微调的成本现在更高,而且由于 Flux Pro 不是开放权重,我们只能使用 BFL 的 API 进行训练和生成图像。这意味着可用的自定义 LoRA 可能会减少,这让人感到失望。

尽管如此,这仍然是一个令人兴奋的更新。我希望 API 访问能够扩展到像 Fal AI 和 Replicate 这样的平台,因为它们对开发者来说非常容易使用。希望这只是更多改进的开始。

这个故事发布在 Generative AI。请在 LinkedIn 上与我们联系,并关注 Zeniteq,以便及时了解最新的 AI 故事。

订阅我们的 newsletterYouTube 频道,以获取最新的生成 AI 新闻和更新。让我们一起塑造 AI 的未来!

Related Posts

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

AI 研究报告和论文写作 合并两个系统指令以获得两个模型的最佳效果 Perplexity AI 的 Deep Research 工具提供专家级的研究报告,而 OpenAI 的 ChatGPT-o3-mini-high 擅长推理。我发现你可以将它们结合起来生成令人难以置信的论文,这些论文比任何一个模型单独撰写的都要好。你只需要将这个一次性提示复制到 **

阅读更多
让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

Non members click here作为一名软件开发人员,多年来的一个发现总是让我感到惊讶,那就是人们还在 Excel

阅读更多
使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

10 个常见问题解答 本文是我推出的一个名为“10 个常见问题解答”的新系列的一部分。在本系列中,我旨在通过回答关于该主题的十个最常见问题来分解复杂的概念。我的目标是使用简单的语言和相关的类比,使这些想法易于理解。 图片来自 [Solen Feyissa](https://unsplash.com/@solenfeyissa?utm_source=medium&utm_medi

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

在AI军备竞赛中分辨事实与虚构 DeepSeek AI真的是它所宣传的游戏规则改变者,还是仅仅聪明的营销和战略炒作?👀 虽然一些人将其视为AI效率的革命性飞跃,但另一些人则认为它的成功建立在借用(甚至窃取的)创新和可疑的做法之上。传言称,DeepSeek的首席执行官在疫情期间像囤积卫生纸一样囤积Nvidia芯片——这只是冰山一角。 从其声称的550万美元培训预算到使用Open

阅读更多
Type something to search...