fix: rank dropout handling in LoRAModule for Conv2d and Linear layers, see #2272 for details

2026-04-14 16:22:28 +00:00 · 2026-02-23 15:15:59 +09:00
parent eb3af82252
commit 2c2e2e02d7
1 changed files with 7 additions and 4 deletions
--- a/networks/lora_anima.py
+++ b/networks/lora_anima.py
@@ -93,10 +93,13 @@ class LoRAModule(torch.nn.Module):
        # rank dropout
        if self.rank_dropout is not None and self.training:
            mask = torch.rand((lx.size(0), self.lora_dim), device=lx.device) > self.rank_dropout
-            if len(lx.size()) == 3:
-                mask = mask.unsqueeze(1)  # for Text Encoder
-            elif len(lx.size()) == 4:
-                mask = mask.unsqueeze(-1).unsqueeze(-1)  # for Conv2d
+            if isinstance(self.lora_down, torch.nn.Conv2d):
+                # Conv2d: lora_dim is at dim 1 → [B, dim, 1, 1]
+                mask = mask.unsqueeze(-1).unsqueeze(-1)
+            else:
+                # Linear: lora_dim is at last dim → [B, 1, ..., 1, dim]
+                for _ in range(len(lx.size()) - 2):
+                    mask = mask.unsqueeze(1)
            lx = lx * mask

            # scaling for rank dropout: treat as if the rank is changed