Stable Diffusion バージョンによるパラメータの違い比較(txt2img)

どうやらStable Diffusionのパラメータがv1とv2変わっている模様です。
今回はどう変わったかを比較してみます。

本記事は以下の順で記載します。

  • txt2img v1とv2 パラメータ比較
  • txt2img v1とv2 パラメータのヘルプの比較(Google翻訳付き)

txt2img パラメータ比較

GitHub CompVis/stable-diffusion(v1) Stableility-AI/stablediffusion(v2)
prompt
outdir
skip_grid
skip_save
ddim_steps
plms
dpm_solver
laion400m
fixed_code
ddim_eta
n_iter
H
W
C
f
n_samples
n_rows
scale
from-file
config
ckpt
seed
precision
steps
dpm
repeat
device
torchscript
ipex
bf16

ヘルプの比較(Google翻訳付き)

GitHub CompVis/stable-diffusion(v1) Stableility-AI/stablediffusion(v2)
prompt the prompt to render
レンダリングのプロンプト
同左
outdir dir to write results to
結果を書き込むディレクトリ
同左
skip_grid do not save a grid, only individual samples. Helpful when evaluating lots of samples
グリッドは保存せず、個々のサンプルのみを保存します。多くのサンプルを評価するときに役立ちます
skip_save do not save individual samples. For speed measurements.
個々のサンプルを保存しないでください。速度測定用。
ddim_steps number of ddim sampling steps
DDIM サンプリング ステップの数
plms use plms sampling
PLM サンプリングを使用する
同左
dpm_solver use dpm_solver sampling
dpm_solverサンプリングの使用
laion400m uses the LAION400M model
LAION400Mモデルを使用
fixed_code if enabled, uses the same starting code across samples
有効にすると、サンプル間で同じ開始コードが使用されます。
同左
ddim_eta ddim eta (eta=0.0 corresponds to deterministic sampling
ddim eta (eta=0.0 は確定的サンプリングに対応します)
同左
n_iter sample this often
これを頻繁にサンプリングする
同左
H image height, in pixel space
画像の高さ、ピクセル空間
同左
W image width, in pixel space
画像の幅、ピクセル空間
同左
C latent channels
潜在チャネル
同左
f downsampling factor
ダウンサンプリング係数
downsampling factor, most often 8 or 16
ダウンサンプリング係数、ほとんどの場合 8 または 16
n_samples how many samples to produce for each given prompt. A.k.a. batch size
特定のプロンプトごとに生成するサンプルの数。別名バッチサイズ
同左
n_rows rows in the grid (default: n_samples)
グリッド内の行 (デフォルト: n_samples)
同左
scale unconditional guidance scale: eps = eps(x, empty) + scale (eps(x, cond) – eps(x, empty))
無条件ガイダンス スケール: eps = eps(x, empty) + scale
(eps(x, cond) – eps(x, empty))
同左
from-file if specified, load prompts from this file
指定されている場合、このファイルからプロンプトを読み込みます
if specified, load prompts from this file, separated by newlines
指定されている場合、改行で区切られたこのファイルからプロンプトを読み込みます
config path to config which constructs model
モデルを構築する config へのパス
同左
ckpt path to checkpoint of model
モデルのチェックポイントへのパス
同左
seed the seed (for reproducible sampling)
シード (再現可能なサンプリング用)
同左
precision evaluate at this precision
この精度で評価する
同左
steps number of ddim sampling steps
ddim サンプリング ステップ数
dpm use DPM (2) sampler
DPM (2) サンプラーを使用
repeat repeat each prompt in file this often
ファイル内の各プロンプトをこの頻度で繰り返します
device Device on which Stable Diffusion will be run
Stable Diffusionを走らせるデバイス
torchscript Use TorchScript
TorchScript を使用する
ipex Use Intel® Extension for PyTorch
Intel® Extension for PyTorch
を使用
bf16 Use bfloat16
bfloat16 を使用

まとめ

大差はありませんが、微妙に変わっているようです。
v1で使ってたskip_gridなどのパラメータが消えているのは少し残念です。

おわり

PR

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です