英Stability AIは、同社のフラッグシップ画像モデル「SDXL 1.0」を、7月28日(現地時間)にオープンモデルとしてリリースした。
SDXLは、あらゆるアートスタイルで高品質の画像を生成可能な、フォトリアリズムに最適なオープンモデルであり、モデルによって特定の「フィール」が付与されることなく、個性的な画像を生成できるので、スタイルの自由度を極限まで高められる。
今回、リリースされた「SDXL 1.0」は、1024×1024のネイティブ解像度でコントラスト、ライティング、シャドウが前モデルよりも向上し、鮮やかで正確な色に調整されている。
3.5Bのパラメータベースモデルと6.6Bのパラメータリファイナから構成される新アーキテクチャに基づいて構築されており、オープンアクセス画像モデルの中でも最大級のパラメータ数を誇る。
また、最初のステップで基本モデルが潜在情報を生成し、最終的なノイズ除去ステップに特化したリファインメントモデルでさらに処理されるという2段階のアーキテクチャによって、速度を損なうことなく、また過剰な計算リソースを必要とすることなく、ロバストな画像を生成でき、8GBのVRAMを搭載したコンシューマ向けGPUや、クラウドインスタンスで問題なく動作する。
さらに、カスタムデータに対するモデルのファインチューニングがこれまで以上に容易となり、カスタムのLoRAやチェックポイントをデータ調整の必要性を減らして生成可能となった。
そのほか同社は、SDXLに特化したT2I/ControlNetを使用して、新たなタスク固有の構造、スタイル、コンポジションコントロールの構築を進めており、現在ベータプレビューを行っている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です