From 806d535ef1f906d0a85a79fe71d11a22e18957dc Mon Sep 17 00:00:00 2001
From: Kohya S <52813779+kohya-ss@users.noreply.github.com>
Date: Sun, 21 Sep 2025 13:10:41 +0900
Subject: [PATCH] fix: block-wise scaling is overwritten by per-tensor scaling

---
 library/fp8_optimization_utils.py | 4 ----
 1 file changed, 4 deletions(-)

diff --git a/library/fp8_optimization_utils.py b/library/fp8_optimization_utils.py
index 82ec6bfc..02f99ab6 100644
--- a/library/fp8_optimization_utils.py
+++ b/library/fp8_optimization_utils.py
@@ -220,10 +220,6 @@ def quantize_weight(
         tensor_max = torch.max(torch.abs(tensor).view(-1))
         scale = tensor_max / max_value
 
-    # Calculate scale factor
-    scale = torch.max(torch.abs(tensor.flatten())) / max_value
-    # print(f"Optimizing {key} with scale: {scale}")
-
     # numerical safety
     scale = torch.clamp(scale, min=1e-8)
     scale = scale.to(torch.float32)  # ensure scale is in float32 for division