Avoid always sync

2026-04-09 06:45:09 +00:00 · 2024-01-23 11:49:03 +08:00
parent 696dd7f668
commit 711b40ccda
1 changed files with 5 additions and 4 deletions
--- a/train_network.py
+++ b/train_network.py
@@ -847,8 +847,9 @@ class NetworkTrainer:
                    loss = loss.mean()  # 平均なのでbatch_sizeで割る必要なし
                    accelerator.backward(loss)
                    if accelerator.sync_gradients:
                        self.all_reduce_network(accelerator, network)  # sync DDP grad manually
-                    if accelerator.sync_gradients and args.max_grad_norm != 0.0:
+                        if args.max_grad_norm != 0.0:
                            params_to_clip = accelerator.unwrap_model(network).get_trainable_params()
                            accelerator.clip_grad_norm_(params_to_clip, args.max_grad_norm)