From 045a3dbe489ef731e593ebbed088d065e77ed87d Mon Sep 17 00:00:00 2001
From: unknown <hard2251@o365.yonsei.ac.kr>
Date: Sun, 19 Feb 2023 18:37:07 +0900
Subject: [PATCH 1/2] apply dadaptation

---
 library/train_util.py |  2 ++
 test.bat              | 10 ++++++++++
 train_network.py      | 15 +++++++++++++++
 3 files changed, 27 insertions(+)
 create mode 100644 test.bat

diff --git a/library/train_util.py b/library/train_util.py
index 63868f98..2a15fa05 100644
--- a/library/train_util.py
+++ b/library/train_util.py
@@ -1391,6 +1391,8 @@ def add_training_arguments(parser: argparse.ArgumentParser, support_dreambooth:
                       help="use 8bit Adam optimizer (requires bitsandbytes) / 8bit Adamã‚ªãƒ—ãƒ†ã‚£ãƒžã‚¤ã‚¶ã‚’ä½¿ã†ï¼ˆbitsandbytesã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ãŒå¿…è¦ï¼‰")
   parser.add_argument("--use_lion_optimizer", action="store_true",
                       help="use Lion optimizer (requires lion-pytorch) / Lionã‚ªãƒ—ãƒ†ã‚£ãƒžã‚¤ã‚¶ã‚’ä½¿ã†ï¼ˆ lion-pytorch ã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ãŒå¿…è¦ï¼‰")
+  parser.add_argument("--use_dadaptation_optimizer", action="store_true",
+                      help="use dadaptation optimizer (requires dadaptation) / dadaptaionã‚ªãƒ—ãƒ†ã‚£ãƒžã‚¤ã‚¶ã‚’ä½¿ã†ï¼ˆ dadaptation ã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ãŒå¿…è¦ï¼‰")
   parser.add_argument("--mem_eff_attn", action="store_true",
                       help="use memory efficient attention for CrossAttention / CrossAttentionã«çœãƒ¡ãƒ¢ãƒªç‰ˆattentionã‚’ä½¿ã†")
   parser.add_argument("--xformers", action="store_true",
diff --git a/test.bat b/test.bat
new file mode 100644
index 00000000..de7fa5da
--- /dev/null
+++ b/test.bat
@@ -0,0 +1,10 @@
+@echo off
+
+set VENV_DIR=.\venv
+set PYTHON=python
+
+call %VENV_DIR%\Scripts\activate.bat
+
+accelerate launch --num_cpu_threads_per_process=2 "train_network.py" --enable_bucket --pretrained_model_name_or_path="D:\NovelAI\stable-diffusion-webui\models\Stable-diffusion\anime/animefull-final-pruned.safetensors" --train_data_dir="D:\NovelAI\additinal pt\Train\´ÙÀÌÅ¸Äí Çï¸®¿À½º v2/img" --resolution=768,768 --output_dir="D:\NovelAI\additinal pt\Train\´ÙÀÌÅ¸Äí Çï¸®¿À½º v2/model" --logging_dir="D:\NovelAI\additinal pt\Train\´ÙÀÌÅ¸Äí Çï¸®¿À½º v2/logs" --network_alpha="16" --training_comment="trigger word : daitaku helios \(umamusume\)" --save_model_as=safetensors --network_module=networks.lora --text_encoder_lr=0.5 --unet_lr=1.0 --network_dim=16 --output_name="daitaku_helios_lora" --lr_scheduler_num_cycles="10" --learning_rate="1.0" --lr_scheduler="constant_with_warmup" --lr_warmup_steps="156" --train_batch_size="4" --max_train_steps="1560" --save_every_n_epochs="1" --mixed_precision="fp16" --save_precision="fp16" --seed="1234" --caption_extension=".txt" --max_token_length=150 --bucket_reso_steps=64 --shuffle_caption --gradient_checkpointing --xformers --use_dadaptation --persistent_data_loader_workers --bucket_no_upscale --random_crop
+
+pause
\ No newline at end of file
diff --git a/train_network.py b/train_network.py
index 1489691d..9bf07d84 100644
--- a/train_network.py
+++ b/train_network.py
@@ -37,6 +37,9 @@ def generate_step_logs(args: argparse.Namespace, current_loss, avr_loss, lr_sche
     logs["lr/textencoder"] = lr_scheduler.get_last_lr()[0]
     logs["lr/unet"] = lr_scheduler.get_last_lr()[-1]          # may be same to textencoder
 
+  if args.use_dadaptation_optimizer: # tracking d*lr value of unet.
+    logs["lr/d*lr"] = lr_scheduler.optimizers[-1].param_groups[0]['d']*lr_scheduler.optimizers[-1].param_groups[0]['lr']
+
   return logs
 
 
@@ -223,6 +226,18 @@ def train(args):
       raise ImportError("No lion_pytorch / lion_pytorch ãŒã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã•ã‚Œã¦ã„ãªã„ã‚ˆã†ã§ã™")
     print("use Lion optimizer")
     optimizer_class = lion_pytorch.Lion
+  elif args.use_dadaptation_optimizer:
+    try:
+      import dadaptation
+    except ImportError:
+      raise ImportError("No dadaptation / dadaptation ãŒã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã•ã‚Œã¦ã„ãªã„ã‚ˆã†ã§ã™")
+    print("use dadaptation optimizer")
+    optimizer_class = dadaptation.DAdaptAdam
+    if args.network_dim > args.network_alpha:
+      print('network dimension is greater than network alpha. It possibly makes network blow up.')
+    if args.learning_rate <= 0.1 or args.text_encoder_lr <= 0.1 or args.unet_lr <= 0.1:
+      print('learning rate is too low. If using dadaptaion, set learning rate around 1.0.')
+      print('recommend option: lr=1.0, unet_lr=1.0, txtencoder_lr=0.5')
   else:
     optimizer_class = torch.optim.AdamW
 

From b612d0b091213f39f4864b4cfe63a44f1e1974d7 Mon Sep 17 00:00:00 2001
From: unknown <hard2251@o365.yonsei.ac.kr>
Date: Sun, 19 Feb 2023 18:37:36 +0900
Subject: [PATCH 2/2] apply dadaptation

---
 fine_tune.py | 10 ++++++++++
 test.bat     | 10 ----------
 2 files changed, 10 insertions(+), 10 deletions(-)
 delete mode 100644 test.bat

diff --git a/fine_tune.py b/fine_tune.py
index 13241bc6..b368d1ea 100644
--- a/fine_tune.py
+++ b/fine_tune.py
@@ -165,6 +165,16 @@ def train(args):
       raise ImportError("No lion_pytorch / lion_pytorch ãŒã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã•ã‚Œã¦ã„ãªã„ã‚ˆã†ã§ã™")
     print("use Lion optimizer")
     optimizer_class = lion_pytorch.Lion
+  elif args.use_dadaptation_optimizer:
+    try:
+      import dadaptation
+    except ImportError:
+      raise ImportError("No dadaptation / dadaptation ãŒã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã•ã‚Œã¦ã„ãªã„ã‚ˆã†ã§ã™")
+    print("use dadaptation optimizer")
+    optimizer_class = dadaptation.DAdaptAdam
+    if args.learning_rate <= 0.1:
+      print('learning rate is too low. If using dadaptaion, set learning rate around 1.0.')
+      print('recommend option: lr=1.0')
   else:
     optimizer_class = torch.optim.AdamW
 
diff --git a/test.bat b/test.bat
deleted file mode 100644
index de7fa5da..00000000
--- a/test.bat
+++ /dev/null
@@ -1,10 +0,0 @@
-@echo off
-
-set VENV_DIR=.\venv
-set PYTHON=python
-
-call %VENV_DIR%\Scripts\activate.bat
-
-accelerate launch --num_cpu_threads_per_process=2 "train_network.py" --enable_bucket --pretrained_model_name_or_path="D:\NovelAI\stable-diffusion-webui\models\Stable-diffusion\anime/animefull-final-pruned.safetensors" --train_data_dir="D:\NovelAI\additinal pt\Train\´ÙÀÌÅ¸Äí Çï¸®¿À½º v2/img" --resolution=768,768 --output_dir="D:\NovelAI\additinal pt\Train\´ÙÀÌÅ¸Äí Çï¸®¿À½º v2/model" --logging_dir="D:\NovelAI\additinal pt\Train\´ÙÀÌÅ¸Äí Çï¸®¿À½º v2/logs" --network_alpha="16" --training_comment="trigger word : daitaku helios \(umamusume\)" --save_model_as=safetensors --network_module=networks.lora --text_encoder_lr=0.5 --unet_lr=1.0 --network_dim=16 --output_name="daitaku_helios_lora" --lr_scheduler_num_cycles="10" --learning_rate="1.0" --lr_scheduler="constant_with_warmup" --lr_warmup_steps="156" --train_batch_size="4" --max_train_steps="1560" --save_every_n_epochs="1" --mixed_precision="fp16" --save_precision="fp16" --seed="1234" --caption_extension=".txt" --max_token_length=150 --bucket_reso_steps=64 --shuffle_caption --gradient_checkpointing --xformers --use_dadaptation --persistent_data_loader_workers --bucket_no_upscale --random_crop
-
-pause
\ No newline at end of file