こんにちは。NEOと申します。研究者兼プログラマーで、たまにココナラというサイトで生成AIのレクチャーをしていたりもします。
今回は、FLUX.1-devのLoRAを作成するための環境構築方法をまとめましたので共有します。FLUX.1-devは120億のパラメータを誇り、既存モデルよりも入力プロンプトの理解能力と描写品質の向上、手足がおかしくなりにくいと言った特徴があります(2024年9月時点)。今後はFLUX.1を使った画像生成が人気を博すことになるでしょう。
しかし、FLUXを学習するためのツールのインストールが困難であるという障壁があり、多くの人が躓いているのではないかと思います。そのため、本noteでは、FLUXのLoRAを作成するためのローカル環境構築方法をまとめました。エラーが発生した時の対処法もまとめています。なおLoRA作成ツール自体はGUIで動作します。
FLUX LoRAの作成環境構築(ローカル版)
FLUXの学習に必要な推奨スペック
FLUXの学習には現時点では最低でも16GBのVRAMがないと学習が難しいです。ただ、今後はFLIUXモデルの圧縮版が出ると予想されるため、12GBのVRAMでも学習ができるようになるかもしれません。もしかすると、既に12GBのVRAMで学習する手法もあるかもしれませんが、動作の保証はしません。
・メモリ:32GB、GPU:RTX 4090(VARAM 24GB)
・メモリ:32GB、GPU:RTX 4070 TI(VARAM 16GB)
FLUXの学習に必要なツール
- Kohya GUI:https://github.com/bmaltais/kohya_ss
- Python 3.10.11:https://www.python.org/ftp/python/3.10.11/python-3.10.11-amd64.exe
- CUDA 12.4 toolkit:https://developer.nvidia.com/cuda-12-4-0-download-archive?target_os=Windows&target_arch=x86_64
- Git:https://git-scm.com/download/win
- Visual Studio 2015, 2017, 2019, and 2022 redistributable:https://aka.ms/vs/17/release/vc_redist.x64.exe