mirror of
https://github.com/kohya-ss/sd-scripts.git
synced 2026-04-09 06:45:09 +00:00
update readme
This commit is contained in:
66
README.md
66
README.md
@@ -127,6 +127,39 @@ The majority of scripts is licensed under ASL 2.0 (including codes from Diffuser
|
|||||||
|
|
||||||
## Change History
|
## Change History
|
||||||
|
|
||||||
|
- 27 Mar. 2023, 2023/3/27:
|
||||||
|
- Fix issues when `--persistent_data_loader_workers` is specified.
|
||||||
|
- The batch members of the bucket are not shuffled.
|
||||||
|
- `--caption_dropout_every_n_epochs` does not work.
|
||||||
|
- These issues occurred because the epoch transition was not recognized correctly. Thanks to u-haru for reporting the issue.
|
||||||
|
- Fix an issue that images are loaded twice in Windows environment.
|
||||||
|
- Add Min-SNR Weighting strategy. Details are in [#308](https://github.com/kohya-ss/sd-scripts/pull/308). Thank you to AI-Casanova for this great work!
|
||||||
|
- Add `--min_snr_gamma` option to training scripts, 5 is recommended by paper.
|
||||||
|
|
||||||
|
- Add tag warmup. Details are in [#322](https://github.com/kohya-ss/sd-scripts/pull/322). Thanks to u-haru!
|
||||||
|
- Add `token_warmup_min` and `token_warmup_step` to dataset settings.
|
||||||
|
- Gradually increase the number of tokens from `token_warmup_min` to `token_warmup_step`.
|
||||||
|
- For example, if `token_warmup_min` is `3` and `token_warmup_step` is `10`, the first step will use the first 3 tokens, and the 10th step will use all tokens.
|
||||||
|
- Fix a bug in `resize_lora.py`. Thanks to mgz-dev! [#328](https://github.com/kohya-ss/sd-scripts/pull/328)
|
||||||
|
- Add `--debug_dataset` option to step to the next step with `S` key and to the next epoch with `E` key.
|
||||||
|
- Fix other bugs.
|
||||||
|
|
||||||
|
- `--persistent_data_loader_workers` を指定した時の各種不具合を修正しました。
|
||||||
|
- `--caption_dropout_every_n_epochs` が効かない。
|
||||||
|
- バケットのバッチメンバーがシャッフルされない。
|
||||||
|
- エポックの遷移が正しく認識されないために発生していました。ご指摘いただいたu-haru氏に感謝します。
|
||||||
|
- Windows環境で画像が二重に読み込まれる不具合を修正しました。
|
||||||
|
- Min-SNR Weighting strategyを追加しました。 詳細は [#308](https://github.com/kohya-ss/sd-scripts/pull/308) をご参照ください。AI-Casanova氏の素晴らしい貢献に感謝します。
|
||||||
|
- `--min_snr_gamma` オプションを学習スクリプトに追加しました。論文では5が推奨されています。
|
||||||
|
- タグのウォームアップを追加しました。詳細は [#322](https://github.com/kohya-ss/sd-scripts/pull/322) をご参照ください。u-haru氏に感謝します。
|
||||||
|
- データセット設定に `token_warmup_min` と `token_warmup_step` を追加しました。
|
||||||
|
- `token_warmup_min` で指定した数のトークン(カンマ区切りの文字列)から、`token_warmup_step` で指定したステップまで、段階的にトークンを増やしていきます。
|
||||||
|
- たとえば `token_warmup_min`に `3` を、`token_warmup_step` に `10` を指定すると、最初のステップでは最初から3個のトークンが使われ、10ステップ目では全てのトークンが使われます。
|
||||||
|
- `resize_lora.py` の不具合を修正しました。mgz-dev氏に感謝します。[#328](https://github.com/kohya-ss/sd-scripts/pull/328)
|
||||||
|
- `--debug_dataset` オプションで、`S`キーで次のステップへ、`E`キーで次のエポックへ進めるようにしました。
|
||||||
|
- その他の不具合を修正しました。
|
||||||
|
|
||||||
|
|
||||||
- 21 Mar. 2023, 2023/3/21:
|
- 21 Mar. 2023, 2023/3/21:
|
||||||
- Add `--vae_batch_size` for faster latents caching to each training script. This batches VAE calls.
|
- Add `--vae_batch_size` for faster latents caching to each training script. This batches VAE calls.
|
||||||
- Please start with`2` or `4` depending on the size of VRAM.
|
- Please start with`2` or `4` depending on the size of VRAM.
|
||||||
@@ -143,17 +176,16 @@ The majority of scripts is licensed under ASL 2.0 (including codes from Diffuser
|
|||||||
- Windows以外の環境向けに、画像ファイルの大文字の拡張子をサポートしました。
|
- Windows以外の環境向けに、画像ファイルの大文字の拡張子をサポートしました。
|
||||||
- `resize_lora.py` を dynamic rank (rankが各LoRAモジュールで異なる場合、`conv_dim` が `network_dim` と異なる場合も含む)の時に正しく動作しない不具合を修正しました。toshiaki氏に感謝します。
|
- `resize_lora.py` を dynamic rank (rankが各LoRAモジュールで異なる場合、`conv_dim` が `network_dim` と異なる場合も含む)の時に正しく動作しない不具合を修正しました。toshiaki氏に感謝します。
|
||||||
|
|
||||||
|
## Sample image generation during traiing
|
||||||
- Sample image generation:
|
|
||||||
A prompt file might look like this, for example
|
A prompt file might look like this, for example
|
||||||
|
|
||||||
```
|
```
|
||||||
# prompt 1
|
# prompt 1
|
||||||
masterpiece, best quality, (1girl), in white shirts, upper body, looking at viewer, simple background --n low quality, worst quality, bad anatomy,bad composition, poor, low effort --w 768 --h 768 --d 1 --l 7.5 --s 28
|
masterpiece, best quality, (1girl), in white shirts, upper body, looking at viewer, simple background --n low quality, worst quality, bad anatomy,bad composition, poor, low effort --w 768 --h 768 --d 1 --l 7.5 --s 28
|
||||||
|
|
||||||
# prompt 2
|
# prompt 2
|
||||||
masterpiece, best quality, 1boy, in business suit, standing at street, looking back --n (low quality, worst quality), bad anatomy,bad composition, poor, low effort --w 576 --h 832 --d 2 --l 5.5 --s 40
|
masterpiece, best quality, 1boy, in business suit, standing at street, looking back --n (low quality, worst quality), bad anatomy,bad composition, poor, low effort --w 576 --h 832 --d 2 --l 5.5 --s 40
|
||||||
```
|
```
|
||||||
|
|
||||||
Lines beginning with `#` are comments. You can specify options for the generated image with options like `--n` after the prompt. The following can be used.
|
Lines beginning with `#` are comments. You can specify options for the generated image with options like `--n` after the prompt. The following can be used.
|
||||||
|
|
||||||
@@ -166,16 +198,16 @@ The majority of scripts is licensed under ASL 2.0 (including codes from Diffuser
|
|||||||
|
|
||||||
The prompt weighting such as `( )` and `[ ]` are working.
|
The prompt weighting such as `( )` and `[ ]` are working.
|
||||||
|
|
||||||
- サンプル画像生成:
|
## サンプル画像生成
|
||||||
プロンプトファイルは例えば以下のようになります。
|
プロンプトファイルは例えば以下のようになります。
|
||||||
|
|
||||||
```
|
```
|
||||||
# prompt 1
|
# prompt 1
|
||||||
masterpiece, best quality, 1girl, in white shirts, upper body, looking at viewer, simple background --n low quality, worst quality, bad anatomy,bad composition, poor, low effort --w 768 --h 768 --d 1 --l 7.5 --s 28
|
masterpiece, best quality, (1girl), in white shirts, upper body, looking at viewer, simple background --n low quality, worst quality, bad anatomy,bad composition, poor, low effort --w 768 --h 768 --d 1 --l 7.5 --s 28
|
||||||
|
|
||||||
# prompt 2
|
# prompt 2
|
||||||
masterpiece, best quality, 1boy, in business suit, standing at street, looking back --n low quality, worst quality, bad anatomy,bad composition, poor, low effort --w 576 --h 832 --d 2 --l 5.5 --s 40
|
masterpiece, best quality, 1boy, in business suit, standing at street, looking back --n (low quality, worst quality), bad anatomy,bad composition, poor, low effort --w 576 --h 832 --d 2 --l 5.5 --s 40
|
||||||
```
|
```
|
||||||
|
|
||||||
`#` で始まる行はコメントになります。`--n` のように「ハイフン二個+英小文字」の形でオプションを指定できます。以下が使用可能できます。
|
`#` で始まる行はコメントになります。`--n` のように「ハイフン二個+英小文字」の形でオプションを指定できます。以下が使用可能できます。
|
||||||
|
|
||||||
@@ -186,7 +218,7 @@ The majority of scripts is licensed under ASL 2.0 (including codes from Diffuser
|
|||||||
* `--l` Specifies the CFG scale of the generated image.
|
* `--l` Specifies the CFG scale of the generated image.
|
||||||
* `--s` Specifies the number of steps in the generation.
|
* `--s` Specifies the number of steps in the generation.
|
||||||
|
|
||||||
`( )` や `[ ]` などの重みづけは動作しません。
|
`( )` や `[ ]` などの重みづけも動作します。
|
||||||
|
|
||||||
Please read [Releases](https://github.com/kohya-ss/sd-scripts/releases) for recent updates.
|
Please read [Releases](https://github.com/kohya-ss/sd-scripts/releases) for recent updates.
|
||||||
最近の更新情報は [Release](https://github.com/kohya-ss/sd-scripts/releases) をご覧ください。
|
最近の更新情報は [Release](https://github.com/kohya-ss/sd-scripts/releases) をご覧ください。
|
||||||
|
|||||||
Reference in New Issue
Block a user