Fixed policy evaluation for autoregressive

2024-02-29 23:23:11 +01:00
parent fe1e388ffb
commit 34335cd9fe
10 changed files with 191 additions and 95 deletions
--- a/src/data/dataset.py
+++ b/src/data/dataset.py
@@ -25,18 +25,22 @@ class NrvDataset(Dataset):
        self.sequence_length = sequence_length
        self.predict_sequence_length = predict_sequence_length

-        self.samples_to_skip = self.skip_samples(dataframe=dataframe, full_day_skip=self.full_day_skip)
+        self.samples_to_skip = self.skip_samples(
+            dataframe=dataframe, full_day_skip=self.full_day_skip
+        )
        total_indices = set(
            range(len(dataframe) - self.sequence_length - self.predict_sequence_length)
        )
        self.valid_indices = sorted(list(total_indices - set(self.samples_to_skip)))

-        # full day indices
-        full_day_skipped_samples = self.skip_samples(dataframe=dataframe, full_day_skip=True)
-        full_day_total_indices = set(
-            range(len(dataframe) - self.sequence_length - self.predict_sequence_length)
+        full_day_skipped_samples = self.skip_samples(
+            dataframe=dataframe, full_day_skip=True
+        )
+
+        full_day_total_indices = set(range(len(dataframe) - self.sequence_length - 96))
+        self.full_day_valid_indices = sorted(
+            list(full_day_total_indices - set(full_day_skipped_samples))
        )
-        self.full_day_valid_indices = sorted(list(full_day_total_indices - set(full_day_skipped_samples)))

        self.history_features = []
        if self.data_config.LOAD_HISTORY:
@@ -74,7 +78,7 @@ class NrvDataset(Dataset):
            self.time_feature = torch.tensor(time_feature).float().reshape(-1)
        else:
            self.time_feature = None
-    
+
        self.nrv = torch.tensor(dataframe["nrv"].values).float().reshape(-1)
        self.datetime = dataframe["datetime"]

@@ -84,12 +88,7 @@ class NrvDataset(Dataset):
        nan_rows = dataframe[dataframe.isnull().any(axis=1)]
        nan_indices = nan_rows.index
        skip_indices = [
-            list(
-                range(
-                    idx - self.sequence_length - 96, idx + 1
-                )
-            )
-            for idx in nan_indices
+            list(range(idx - self.sequence_length - 96, idx + 1)) for idx in nan_indices
        ]

        skip_indices = [item for sublist in skip_indices for item in sublist]
@@ -106,10 +105,12 @@ class NrvDataset(Dataset):
            skip_indices = list(set(skip_indices))

        return skip_indices
-    
-    def preprocess_data(self, dataframe):
-        return torch.tensor(dataframe[self.history_features].values).float(), torch.tensor(dataframe[self.forecast_features].values).float()

+    def preprocess_data(self, dataframe):
+        return (
+            torch.tensor(dataframe[self.history_features].values).float(),
+            torch.tensor(dataframe[self.forecast_features].values).float(),
+        )

    def __len__(self):
        return len(self.valid_indices)
@@ -117,21 +118,38 @@ class NrvDataset(Dataset):
    def _get_all_data(self, idx: int):
        history_df = self.dataframe.iloc[idx : idx + self.sequence_length]
        forecast_df = self.dataframe.iloc[
-            idx + self.sequence_length : idx + self.sequence_length + self.predict_sequence_length
+            idx
+            + self.sequence_length : idx
+            + self.sequence_length
+            + self.predict_sequence_length
        ]
        return history_df, forecast_df

    def __getitem__(self, idx):
-        actual_idx = self.valid_indices[idx]
-                
+        try:
+            actual_idx = self.valid_indices[idx]
+        except IndexError:
+            print(f"Index {idx} not in valid indices.")
+            raise
+
        # get nrv history features
        nrv_features = self.nrv[actual_idx : actual_idx + self.sequence_length]

-        history_features = self.history_features[actual_idx : actual_idx + self.sequence_length, :]
-        forecast_features = self.forecast_features[actual_idx + self.sequence_length : actual_idx + self.sequence_length + self.predict_sequence_length, :]
+        history_features = self.history_features[
+            actual_idx : actual_idx + self.sequence_length, :
+        ]
+        forecast_features = self.forecast_features[
+            actual_idx
+            + self.sequence_length : actual_idx
+            + self.sequence_length
+            + self.predict_sequence_length,
+            :,
+        ]

        if self.time_feature is not None:
-            time_features = self.time_feature[actual_idx : actual_idx + self.sequence_length]
+            time_features = self.time_feature[
+                actual_idx : actual_idx + self.sequence_length
+            ]
        else:
            time_features = None

@@ -154,7 +172,9 @@ class NrvDataset(Dataset):
            all_features_list = [nrv_features.unsqueeze(1)]

            if self.forecast_features.numel() > 0:
-                history_forecast_features = self.forecast_features[actual_idx + 1 : actual_idx + self.sequence_length + 1, :]
+                history_forecast_features = self.forecast_features[
+                    actual_idx + 1 : actual_idx + self.sequence_length + 1, :
+                ]
                all_features_list.append(history_forecast_features)

            if time_features is not None:
@@ -163,7 +183,12 @@ class NrvDataset(Dataset):
            all_features = torch.cat(all_features_list, dim=1)

        # Target sequence, flattened if necessary
-        nrv_target = self.nrv[actual_idx + self.sequence_length : actual_idx + self.sequence_length + self.predict_sequence_length]
+        nrv_target = self.nrv[
+            actual_idx
+            + self.sequence_length : actual_idx
+            + self.sequence_length
+            + self.predict_sequence_length
+        ]

        # check if nan values are present
        if torch.isnan(all_features).any():
@@ -188,7 +213,6 @@ class NrvDataset(Dataset):

        return all_features, nrv_target

-
    def get_batch(self, idx: list):
        features = []
        targets = []
@@ -216,8 +240,8 @@ class NrvDataset(Dataset):
        # check if the date is in the valid indices
        if date not in self.datetime.dt.date.unique():
            raise ValueError(f"Date {date} not in dataset.")
-        
+
        idx = self.datetime[self.datetime.dt.date == date].index[0]

        valid_idx = self.valid_indices.index(idx)
-        return valid_idx
+        return valid_idx
--- a/src/policies/PolicyEvaluator.py
+++ b/src/policies/PolicyEvaluator.py
@@ -45,7 +45,8 @@ class PolicyEvaluator:
    ):
        idx = test_loader.dataset.get_idx_for_date(date.date())

-        print("Evaluated for idx: ", idx)
+        if idx not in idx_samples:
+            print("No samples for idx: ", idx, date)
        (initial, samples) = idx_samples[idx]

        if len(initial.shape) == 2:
@@ -98,16 +99,17 @@ class PolicyEvaluator:

    def evaluate_test_set(self, idx_samples, test_loader):
        self.profits = []
-        try:
-            for date in tqdm(self.dates):
-                self.evaluate_for_date(date, idx_samples, test_loader)
-        except KeyboardInterrupt:
-            print("Interrupted")
-            raise KeyboardInterrupt

-        except Exception as e:
-            print(e)
-            pass
+        for date in tqdm(self.dates):
+            try:
+                self.evaluate_for_date(date, idx_samples, test_loader)
+            except KeyboardInterrupt:
+                print("Interrupted")
+                raise KeyboardInterrupt
+
+            except Exception as e:
+                print(e)
+                pass

        self.profits = pd.DataFrame(
            self.profits,
--- a/src/policies/baselines/BaselinePolicyEvaluator.py
+++ b/src/policies/baselines/BaselinePolicyEvaluator.py
@@ -151,13 +151,25 @@ class BaselinePolicyEvaluator(PolicyEvaluator):

        return best_thresholds

-    def evaluate_test_set(self, thresholds: dict):
+    def evaluate_test_set(self, thresholds: dict, data_processor=None):
        """Evaluate the test set using the given thresholds (multiple penalties)

        Args:
            thresholds (dict): Dictionary with penalties as keys and the corresponding thresholds tuple as values
        """
        self.profits = []
+
+        if data_processor:
+            filtered_dates = []
+            _, test_loader = data_processor.get_dataloaders()
+            for date in self.dates:
+                try:
+                    test_loader.dataset.get_idx_for_date(date.date())
+                    filtered_dates.append(date)
+                except:
+                    pass
+            self.dates = filtered_dates
+
        try:
            for date in tqdm(self.dates):
                real_imbalance_prices = self.get_imbanlance_prices_for_date(date.date())
--- a/src/policies/baselines/YesterdayBaselinePolicyExecutor.py
+++ b/src/policies/baselines/YesterdayBaselinePolicyExecutor.py
@@ -54,14 +54,26 @@ class YesterdayBaselinePolicyEvaluator(PolicyEvaluator):
                ]
            )

-    def evaluate_test_set(self):
+    def evaluate_test_set(self, data_processor):
+
+        if data_processor:
+            filtered_dates = []
+            _, test_loader = data_processor.get_dataloaders()
+            for date in self.dates:
+                try:
+                    test_loader.dataset.get_idx_for_date(date.date())
+                    filtered_dates.append(date)
+                except:
+                    pass
+            self.dates = filtered_dates
+
        self.profits = []
-        try:
-            for date in tqdm(self.dates):
+        for date in tqdm(self.dates):
+            try:
                self.evaluate_for_date(date)
-        except Exception as e:
-            print(e)
-            pass
+            except Exception as e:
+                print(e)
+                pass

        self.profits = pd.DataFrame(
            self.profits,
--- a/src/policies/baselines/global_threshold_baseline.py
+++ b/src/policies/baselines/global_threshold_baseline.py
@@ -7,6 +7,25 @@ task.execute_remotely(queue_name="default", exit_process=True)

 from src.policies.baselines.BaselinePolicyEvaluator import BaselinePolicyEvaluator
 from src.policies.simple_baseline import BaselinePolicy, Battery
+from src.data import DataProcessor, DataConfig
+
+### Data Processor ###
+data_config = DataConfig()
+data_config.NRV_HISTORY = True
+data_config.LOAD_HISTORY = True
+data_config.LOAD_FORECAST = True
+
+data_config.WIND_FORECAST = True
+data_config.WIND_HISTORY = True
+
+data_config.QUARTER = False
+data_config.DAY_OF_WEEK = False
+
+data_config.NOMINAL_NET_POSITION = True
+
+data_processor = DataProcessor(data_config, path="", lstm=False)
+data_processor.set_batch_size(64)
+data_processor.set_full_day_skip(True)

 ### Policy Evaluator ###
 battery = Battery(2, 1)
@@ -14,7 +33,7 @@ baseline_policy = BaselinePolicy(battery, data_path="")
 policy_evaluator = BaselinePolicyEvaluator(baseline_policy, task)

 thresholds = policy_evaluator.determine_best_thresholds()
-policy_evaluator.evaluate_test_set(thresholds)
+policy_evaluator.evaluate_test_set(thresholds, data_processor=data_processor)

 policy_evaluator.plot_profits_table()

--- a/src/policies/baselines/yesterday_baseline.py
+++ b/src/policies/baselines/yesterday_baseline.py
@@ -2,7 +2,7 @@ from src.utils.clearml import ClearMLHelper

 #### ClearML ####
 clearml_helper = ClearMLHelper(project_name="Thesis/NrvForecast")
-task = clearml_helper.get_task(task_name="Global Thresholds Baseline")
+task = clearml_helper.get_task(task_name="Yesterday Baseline")
 task.execute_remotely(queue_name="default", exit_process=True)

 from src.policies.baselines.BaselinePolicyEvaluator import BaselinePolicyEvaluator
@@ -10,13 +10,32 @@ from src.policies.simple_baseline import BaselinePolicy, Battery
 from src.policies.baselines.YesterdayBaselinePolicyExecutor import (
    YesterdayBaselinePolicyEvaluator,
 )
+from src.data import DataProcessor, DataConfig
+
+### Data Processor ###
+data_config = DataConfig()
+data_config.NRV_HISTORY = True
+data_config.LOAD_HISTORY = True
+data_config.LOAD_FORECAST = True
+
+data_config.WIND_FORECAST = True
+data_config.WIND_HISTORY = True
+
+data_config.QUARTER = False
+data_config.DAY_OF_WEEK = False
+
+data_config.NOMINAL_NET_POSITION = True
+
+data_processor = DataProcessor(data_config, path="", lstm=False)
+data_processor.set_batch_size(64)
+data_processor.set_full_day_skip(True)

 ### Policy Evaluator ###
 battery = Battery(2, 1)
 baseline_policy = BaselinePolicy(battery, data_path="")
 policy_evaluator = YesterdayBaselinePolicyEvaluator(baseline_policy, task)

-policy_evaluator.evaluate_test_set()
+policy_evaluator.evaluate_test_set(data_processor=data_processor)
 policy_evaluator.plot_profits_table()

 task.close()
--- a/src/trainers/quantile_trainer.py
+++ b/src/trainers/quantile_trainer.py
@@ -155,31 +155,38 @@ class AutoRegressiveQuantileTrainer(AutoRegressiveTrainer):
        generated_samples = {}

        with torch.no_grad():
-            total_samples = len(dataloader.dataset) - 96
-            for _, _, idx_batch in tqdm(dataloader):
-                idx_batch = [idx for idx in idx_batch if idx < total_samples]
+            total_samples = len(dataloader.dataset)
+            print(
+                "Full day valid indices: ",
+                len(dataloader.dataset.full_day_valid_indices),
+            )
+            print(
+                "Valid indices: ",
+                len(dataloader.dataset.valid_indices),
+            )

-                if len(idx_batch) == 0:
-                    continue
+            print(dataloader.dataset.valid_indices)

-                for idx in tqdm(idx_batch):
-                    computed_idx_batch = [idx] * 100
-                    initial, _, samples, targets = self.auto_regressive(
-                        dataloader.dataset, idx_batch=computed_idx_batch
-                    )
+            for i in tqdm(dataloader.dataset.full_day_valid_indices):
+                idx = dataloader.dataset.valid_indices.index(i)

-                    generated_samples[idx.item()] = (
-                        self.data_processor.inverse_transform(initial),
-                        self.data_processor.inverse_transform(samples),
-                    )
+                computed_idx_batch = [idx] * 100
+                initial, _, samples, targets = self.auto_regressive(
+                    dataloader.dataset, idx_batch=computed_idx_batch
+                )

-                    samples = samples.unsqueeze(0)
-                    targets = targets.squeeze(-1)
-                    targets = targets[0].unsqueeze(0)
+                generated_samples[idx] = (
+                    self.data_processor.inverse_transform(initial),
+                    self.data_processor.inverse_transform(samples),
+                )

-                    crps = crps_from_samples(samples, targets)
+                samples = samples.unsqueeze(0)
+                targets = targets.squeeze(-1)
+                targets = targets[0].unsqueeze(0)

-                    crps_from_samples_metric.append(crps[0].mean().item())
+                crps = crps_from_samples(samples, targets)
+
+                crps_from_samples_metric.append(crps[0].mean().item())

        task.get_logger().report_scalar(
            title="CRPS_from_samples",
@@ -190,10 +197,7 @@ class AutoRegressiveQuantileTrainer(AutoRegressiveTrainer):

        # using the policy evaluator, evaluate the policy with the generated samples
        if self.policy_evaluator is not None:
-            _, test_loader = self.data_processor.get_dataloaders(
-                predict_sequence_length=self.model.output_size, full_day_skip=True
-            )
-            self.policy_evaluator.evaluate_test_set(generated_samples, test_loader)
+            self.policy_evaluator.evaluate_test_set(generated_samples, dataloader)
            df = self.policy_evaluator.get_profits_as_scalars()

            # for each row, report the profits
--- a/src/trainers/trainer.py
+++ b/src/trainers/trainer.py
@@ -8,6 +8,7 @@ from plotly.subplots import make_subplots
 from clearml.config import running_remotely
 from torchinfo import summary

+
 class Trainer:
    def __init__(
        self,
@@ -95,13 +96,15 @@ class Trainer:
            loader = test_loader

        np.random.seed(42)
-        actual_indices = np.random.choice(loader.dataset.full_day_valid_indices, num_samples, replace=False)
+        actual_indices = np.random.choice(
+            loader.dataset.full_day_valid_indices, num_samples, replace=False
+        )
        indices = {}
        for i in actual_indices:
            indices[i] = loader.dataset.valid_indices.index(i)

        print(actual_indices)
-        
+
        return indices

    def train(self, epochs: int, remotely: bool = False, task: Task = None):
@@ -190,9 +193,7 @@ class Trainer:
                            # )

                        if hasattr(self, "calculate_crps_from_samples"):
-                            self.calculate_crps_from_samples(
-                                task, full_day_skip_test_loader, epoch
-                            )
+                            self.calculate_crps_from_samples(task, test_loader, epoch)

            if task:
                self.finish_training(task=task)
@@ -259,7 +260,6 @@ class Trainer:
            self.model = torch.load("checkpoint.pt")
        self.model.eval()

-        
        # set full day skip
        self.data_processor.set_full_day_skip(True)
        train_loader, test_loader = self.data_processor.get_dataloaders(
@@ -361,7 +361,6 @@ class Trainer:
            for trace in sub_fig.data:
                fig.add_trace(trace, row=row, col=col)

-
            # loss = self.criterion(predictions.to(self.device), target.squeeze(-1).to(self.device)).item()

            # fig['layout']['annotations'][i].update(text=f"{loss.__class__.__name__}: {loss:.6f}")
--- a/src/training_scripts/autoregressive_quantiles.py
+++ b/src/training_scripts/autoregressive_quantiles.py
@@ -49,7 +49,7 @@ data_processor.set_full_day_skip(False)


 #### Hyperparameters ####
-data_processor.set_output_size(96)
+data_processor.set_output_size(1)
 inputDim = data_processor.get_input_size()
 epochs = 300

@@ -80,7 +80,7 @@ time_embedding = TimeEmbedding(
 # lstm_model = GRUModel(time_embedding.output_dim(inputDim), len(quantiles), hidden_size=model_parameters["hidden_size"], num_layers=model_parameters["num_layers"], dropout=model_parameters["dropout"])
 non_linear_model = NonLinearRegression(
    time_embedding.output_dim(inputDim),
-    len(quantiles) * 96,
+    len(quantiles),
    hiddenSize=model_parameters["hidden_size"],
    numLayers=model_parameters["num_layers"],
    dropout=model_parameters["dropout"],
@@ -97,18 +97,7 @@ baseline_policy = BaselinePolicy(battery, data_path="")
 policy_evaluator = PolicyEvaluator(baseline_policy, task)

 #### Trainer ####
-# trainer = AutoRegressiveQuantileTrainer(
-#     model,
-#     inputDim,
-#     optimizer,
-#     data_processor,
-#     quantiles,
-#     "cuda",
-#     policy_evaluator=policy_evaluator,
-#     debug=False,
-# )
-
-trainer = NonAutoRegressiveQuantileRegression(
+trainer = AutoRegressiveQuantileTrainer(
    model,
    inputDim,
    optimizer,
@@ -119,6 +108,17 @@ trainer = NonAutoRegressiveQuantileRegression(
    debug=False,
 )

+# trainer = NonAutoRegressiveQuantileRegression(
+#     model,
+#     inputDim,
+#     optimizer,
+#     data_processor,
+#     quantiles,
+#     "cuda",
+#     policy_evaluator=policy_evaluator,
+#     debug=False,
+# )
+
 trainer.add_metrics_to_track(
    [PinballLoss(quantiles), MSELoss(), L1Loss(), CRPSLoss(quantiles)]
 )