Stable Diffusionのオリジナル開発陣によるAI企業「Black Forest Labs」が画像生成AI「FLUX1.1 [pro]」とアプリケーション統合用の「BFL API」をリリース
画像生成AIの「Stable Diffusion」などの開発に携わったAI研究者が立ち上げたAI開発企業「Black Forest Labs」が、次世代画像生成AIの「FLUX1.1 [pro]」をリリースしました。同時に、画像生成AIを自身のアプリケーションに統合するための「BFL API」のベータ版も公開しています。
Announcing FLUX1.1 [pro] and the BFL API - Black Forest Labs
https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/
Black Forest Labsが2024年10月2日にリリースした「FLUX1.1 [pro]」は、前モデルのFLUX.1 [pro]よりも生成速度が6倍速く、画像の品質やプロンプトの順守、生成される画像の多様性が向上しているのが特徴です。前世代のFLUX.1 [pro]については、以下の記事で詳しくまとめています。
Stable Diffusionのオリジナル開発陣がAI企業「Black Forest Labs」を立ち上げ独自の画像生成AIモデル「Flux」をリリース - GIGAZINE
以下は実際にFLUX1.1 [pro]で作成した画像の一例です。なお、これらの画像はReplicateのデモページで生成しました。
デモページにあらかじめ入力されている「black forest gateau cake spelling out the words "FLUX 1.1 Pro", tasty, food photography(『FLUX 1.1 Pro』と書かれた黒い森のガトーショコラケーキ、おいしそうな料理の写真)」というプロンプトだと、こんな感じの画像を生成可能。
「surprised child, colorful playground, anime style(驚いた表情の子供、カラフルな遊び場、アニメ風)」というプロンプトを入力すると、高品質なアニメ風画像を生成できました。
「Close-up view of a tin toy. The background is a cyberpunk world. The word "GIGAZINE" is written in an electrified font on the forefront of the image.(ブリキのおもちゃのクローズアップ写真。背景はサイバーパンクな世界。画像の最前面にはエレクトリカルなフォントで『GIGAZINE』と書かれている)」というプロンプトで生成した画像が以下。指示通りの文字列を含む画像が生成されました。
Black Forest Labsによると、FLUX1.1 [pro]は「blueberry」というコードネームでText to Image Arenaに導入され、テストを受けたとのこと。FLUX1.1 [pro]とその他の画像生成AIモデルのELOスコアを比較したのが以下のグラフ。FLUX1.1 [pro]は前世代のFLUX.1 [pro]やライバルのIdeogram V2やMidJourney V6よりも高いスコアを記録しています。
各画像生成AIにおいて、ELOスコアと画像生成に要するコストを比較した表が以下。高いELOスコアを残すことができるFLUX1.1 [pro]ですが、コストパフォーマンスにも比較的優れていることが示されています。
以下はELOスコアと画像生成に要する秒数を比較した表です。FLUX1.1 [pro]は優れた画像を短時間のうちに生成できることが明らかとなりました。
なお、FLUX1.1 [pro]は後述のBFL APIやReplicate利用できるほか、Together.ai、、fal.ai、Freepikでも提供されています。
Black Forest Labsが提供するBFL APIは、Black Forest Labsの画像生成AIを自身のアプリケーションに統合するためのAPIです。Black Forest LabsはBFL APIについて「モデルの選択や画像の解像度、およびコンテンツのモデレーションに関するカスタマイズオプションを使用することで、ユーザーのニーズに合わせて生成される画像を調整可能」「小規模なプロジェクト、エンタープライズレベルのアプリケーションを問わず、さまざまなシチュエーションでアプリケーションをシームレスに拡張可能」「低コストで優れた画像を生成可能」と主張しています。
なお、BFL APIは以下のサイトから利用可能です。
BFL Docs
https://docs.bfl.ml/
Black Forest LabsはFLUX1.1 [pro]について、今後高速な2K解像度での画像生成に対応する予定であることを報告しています。
10/04 14:00
GIGAZINE