delete unnecessary lines

2026-04-09 06:45:09 +00:00 · 2023-04-12 23:16:47 +09:00
parent 893c2fc08a
commit e09966024c
1 changed files with 1 additions and 146 deletions
--- a/networks/extract_lora_from_dylora.py
+++ b/networks/extract_lora_from_dylora.py
@@ -30,151 +30,6 @@ def save_to_file(file_name, model, metadata):
        torch.save(model, file_name)


-# Indexing functions
-
-
-def index_sv_cumulative(S, target):
-    original_sum = float(torch.sum(S))
-    cumulative_sums = torch.cumsum(S, dim=0) / original_sum
-    index = int(torch.searchsorted(cumulative_sums, target)) + 1
-    index = max(1, min(index, len(S) - 1))
-
-    return index
-
-
-def index_sv_fro(S, target):
-    S_squared = S.pow(2)
-    s_fro_sq = float(torch.sum(S_squared))
-    sum_S_squared = torch.cumsum(S_squared, dim=0) / s_fro_sq
-    index = int(torch.searchsorted(sum_S_squared, target**2)) + 1
-    index = max(1, min(index, len(S) - 1))
-
-    return index
-
-
-def index_sv_ratio(S, target):
-    max_sv = S[0]
-    min_sv = max_sv / target
-    index = int(torch.sum(S > min_sv).item())
-    index = max(1, min(index, len(S) - 1))
-
-    return index
-
-
-# Modified from Kohaku-blueleaf's extract/merge functions
-def extract_conv(weight, lora_rank, dynamic_method, dynamic_param, device, scale=1):
-    out_size, in_size, kernel_size, _ = weight.size()
-    U, S, Vh = torch.linalg.svd(weight.reshape(out_size, -1).to(device))
-
-    param_dict = rank_resize(S, lora_rank, dynamic_method, dynamic_param, scale)
-    lora_rank = param_dict["new_rank"]
-
-    U = U[:, :lora_rank]
-    S = S[:lora_rank]
-    U = U @ torch.diag(S)
-    Vh = Vh[:lora_rank, :]
-
-    param_dict["lora_down"] = Vh.reshape(lora_rank, in_size, kernel_size, kernel_size).cpu()
-    param_dict["lora_up"] = U.reshape(out_size, lora_rank, 1, 1).cpu()
-    del U, S, Vh, weight
-    return param_dict
-
-
-def extract_linear(weight, lora_rank, dynamic_method, dynamic_param, device, scale=1):
-    out_size, in_size = weight.size()
-
-    U, S, Vh = torch.linalg.svd(weight.to(device))
-
-    param_dict = rank_resize(S, lora_rank, dynamic_method, dynamic_param, scale)
-    lora_rank = param_dict["new_rank"]
-
-    U = U[:, :lora_rank]
-    S = S[:lora_rank]
-    U = U @ torch.diag(S)
-    Vh = Vh[:lora_rank, :]
-
-    param_dict["lora_down"] = Vh.reshape(lora_rank, in_size).cpu()
-    param_dict["lora_up"] = U.reshape(out_size, lora_rank).cpu()
-    del U, S, Vh, weight
-    return param_dict
-
-
-def merge_conv(lora_down, lora_up, device):
-    in_rank, in_size, kernel_size, k_ = lora_down.shape
-    out_size, out_rank, _, _ = lora_up.shape
-    assert in_rank == out_rank and kernel_size == k_, f"rank {in_rank} {out_rank} or kernel {kernel_size} {k_} mismatch"
-
-    lora_down = lora_down.to(device)
-    lora_up = lora_up.to(device)
-
-    merged = lora_up.reshape(out_size, -1) @ lora_down.reshape(in_rank, -1)
-    weight = merged.reshape(out_size, in_size, kernel_size, kernel_size)
-    del lora_up, lora_down
-    return weight
-
-
-def merge_linear(lora_down, lora_up, device):
-    in_rank, in_size = lora_down.shape
-    out_size, out_rank = lora_up.shape
-    assert in_rank == out_rank, f"rank {in_rank} {out_rank} mismatch"
-
-    lora_down = lora_down.to(device)
-    lora_up = lora_up.to(device)
-
-    weight = lora_up @ lora_down
-    del lora_up, lora_down
-    return weight
-
-
-# Calculate new rank
-
-
-def rank_resize(S, rank, dynamic_method, dynamic_param, scale=1):
-    param_dict = {}
-
-    if dynamic_method == "sv_ratio":
-        # Calculate new dim and alpha based off ratio
-        new_rank = index_sv_ratio(S, dynamic_param) + 1
-        new_alpha = float(scale * new_rank)
-
-    elif dynamic_method == "sv_cumulative":
-        # Calculate new dim and alpha based off cumulative sum
-        new_rank = index_sv_cumulative(S, dynamic_param) + 1
-        new_alpha = float(scale * new_rank)
-
-    elif dynamic_method == "sv_fro":
-        # Calculate new dim and alpha based off sqrt sum of squares
-        new_rank = index_sv_fro(S, dynamic_param) + 1
-        new_alpha = float(scale * new_rank)
-    else:
-        new_rank = rank
-        new_alpha = float(scale * new_rank)
-
-    if S[0] <= MIN_SV:  # Zero matrix, set dim to 1
-        new_rank = 1
-        new_alpha = float(scale * new_rank)
-    elif new_rank > rank:  # cap max rank at rank
-        new_rank = rank
-        new_alpha = float(scale * new_rank)
-
-    # Calculate resize info
-    s_sum = torch.sum(torch.abs(S))
-    s_rank = torch.sum(torch.abs(S[:new_rank]))
-
-    S_squared = S.pow(2)
-    s_fro = torch.sqrt(torch.sum(S_squared))
-    s_red_fro = torch.sqrt(torch.sum(S_squared[:new_rank]))
-    fro_percent = float(s_red_fro / s_fro)
-
-    param_dict["new_rank"] = new_rank
-    param_dict["new_alpha"] = new_alpha
-    param_dict["sum_retained"] = (s_rank) / s_sum
-    param_dict["fro_retained"] = fro_percent
-    param_dict["max_ratio"] = S[0] / S[new_rank - 1]
-
-    return param_dict
-
-
 def split_lora_model(lora_sd, unit):
    max_rank = 0

@@ -220,7 +75,7 @@ def split(args):
        else:
            new_metadata = metadata.copy()

-        new_metadata["ss_training_comment"] = f"split from DyLoRA from {original_rank} to {new_rank}; {comment}"
+        new_metadata["ss_training_comment"] = f"split from DyLoRA, rank {original_rank} to {new_rank}; {comment}"
        new_metadata["ss_network_dim"] = str(new_rank)

        model_hash, legacy_hash = train_util.precalculate_safetensors_hashes(state_dict, metadata)