CFG Scale の数値を調整すると、プロンプトの反映が厳密にされますが、画像が崩れることがありました。その解決策として、Dynamic Thresholding(CFG Scale Fix) という拡張機能があります。この記事では、その拡張機能の詳細と使い方をご紹介します。
Dynamic Thresholding(CFG Scale Fix)とは?
CFG Scale とは、生成画像に対するプロンプトの影響度を示す数値です。この数値を高くすると、プロンプトに忠実な画像が生成され、逆に小さくすると、生成画像に多くの自由度が出ることになります。
Dynamic Thresholding(CFG Scale Fix) は、CFG Scale を大きくした場合でも破綻せずに画像が綺麗に生成されるようにする拡張機能です。
Dynamic Thresholdingの導入方法
「AUTOMATIC1111版web UI」が動作していることが前提になります。
- WebUI を起動し、「Extensions」タブを選択します。
- 「Install from URL」タブを開きます。
- 「URL for extension’s git repository」 欄に
https://github.com/mcmonkeyprojects/sd-dynamic-thresholding.git
と入力し、「Install」ボタンを選択します。
- インストールが完了したら、「Extensions」内の「Installed」タブをクリックし、 sd-dynamic-thresholding がインストールされていることを確認します。
- 確認できたら、「Apply and restart UI」ボタンをクリックして再起動します。
Dynamic Thresholdingの使い方
- 「txt2img」タブを選択。
- プロンプトを入力。
- 「Enable Dynamic Thresholding(CFG Scale Fix)」にチェックを入れ、画像を生成。
これだけで使用でき、使用することで、より鮮明な画像を得ることができます。ただし、色彩が薄れる場合がありますので、「Mimic CFG Scale」を適切に調整することをおすすめします。
検証
CFG Scale 25 で、左が Dynamic Thresholding(CFG Scale Fix) なし、右が Dynamic Thresholding(CFG Scale Fix) ありになります。絵の構成に破綻はなくなります。少し色彩は薄くなります。
まとめ
Dynamic-Thresholding(CFG Scale Fix)は、Stable Diffusionの便利な拡張機能の一つです。CFG Scaleを大きくしても破綻はなくなります。是非この機能を活用して、イメージ通りの画像を生成してみてください。