From 01f97f0046fef8a6a37c208b12dc5a11a71ad83a Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Mon, 5 Dec 2022 14:52:56 +0100
Subject: [PATCH 01/12] added config to reproduce drnas results

---
 naslib/defaults/darts_defaults.yaml |   4 +-
 naslib/defaults/drnas_defaults.yaml | 115 ++++++++++++++++++++++++++++
 naslib/runners/nas/runner.py        |   2 +-
 3 files changed, 118 insertions(+), 3 deletions(-)
 create mode 100644 naslib/defaults/drnas_defaults.yaml

diff --git a/naslib/defaults/darts_defaults.yaml b/naslib/defaults/darts_defaults.yaml
index cc1af7a71a..3fc52c082f 100644
--- a/naslib/defaults/darts_defaults.yaml
+++ b/naslib/defaults/darts_defaults.yaml
@@ -1,6 +1,6 @@
 dataset: cifar10
 seed: 99
-search_space: nasbench201
+search_space: nasbench301
 out_dir: run
 optimizer: darts
 
@@ -11,7 +11,7 @@ search:
   learning_rate_min: 0.001
   momentum: 0.9
   weight_decay: 0.0003
-  epochs: 50
+  epochs: 1
   warm_start_epochs: 0
   grad_clip: 5
   train_portion: 0.5
diff --git a/naslib/defaults/drnas_defaults.yaml b/naslib/defaults/drnas_defaults.yaml
new file mode 100644
index 0000000000..13fa9b1dc3
--- /dev/null
+++ b/naslib/defaults/drnas_defaults.yaml
@@ -0,0 +1,115 @@
+# options cifar10, cifar100, ImageNet reports on their test acc is avaliable
+dataset: cifar10
+# in the code base the deafult value for the seed is 2.
+# using random seeds that are logged but log files are not provided
+# not mentioned in the paper what are the random seeds are
+seed: 99
+# darts (or nb301)
+# nb201
+search_space: nasbench301
+out_dir: run
+optimizer: darts
+
+search:
+  checkpoint_freq: 5
+  # default value batch size in code is 64
+  batch_size: 64
+  # lr_rate for progressive and original: 0.025
+  learning_rate: 0.025
+  # lr_rate for progressive and original: 0.025
+  learning_rate_min: 0.001
+  momentum: 0.9
+  # weight_decay for progressive and original: 0.0003
+  weight_decay: 0.0003
+  # for cifar10 the learning process is 2 stages of 25 epochs
+  epochs: 1
+  warm_start_epochs: 0
+  grad_clip: 5
+  # for cifar10 the train and optimization data (50k) is equally partitioned
+  train_portion: 0.5
+  # for cifar10 the train and optimization data (50k) is equally partitioned
+  data_size: 25000
+
+  cutout: False
+  cutout_length: 16
+  cutout_prob: 1.0
+  drop_path_prob: 0.0
+
+  unrolled: False
+  arch_learning_rate: 0.0003
+  arch_weight_decay: 0.001
+  output_weights: True
+
+  fidelity: 200
+
+  # GDAS
+  tau_max: 10
+  tau_min: 0.1
+
+  # RE
+  sample_size: 10
+  population_size: 100
+
+  #LS
+  num_init: 10
+
+  #GSparsity-> Uncomment the lines below for GSparsity
+  #seed: 50
+  #grad_clip: 0
+  #threshold: 0.000001
+  #weight_decay: 120
+  #learning_rate: 0.01
+  #momentum: 0.8
+  #normalization: div
+  #normalization_exponent: 0.5
+  #batch_size: 256
+  #learning_rate_min: 0.0001
+  #epochs: 100
+  #warm_start_epochs: 0
+  #train_portion: 0.9
+  #data_size: 25000
+
+
+  # BANANAS
+  k: 10
+  num_ensemble: 3
+  acq_fn_type: its
+  acq_fn_optimization: mutation
+  encoding_type: path
+  num_arches_to_mutate: 2
+  max_mutations: 1
+  num_candidates: 100
+
+  # BasePredictor
+  predictor_type: var_sparse_gp
+  debug_predictor: False
+
+evaluation:
+  checkpoint_freq: 30
+  # Neither the paper nor the code base indicates the batch size but the default value is 64
+  batch_size: 96
+
+  learning_rate: 0.025
+  learning_rate_min: 0.00
+  # momentum is 0.9
+  momentum: 0.9
+  # for cifar weight_decay is 3e-4
+  weight_decay: 0.0003
+  # cifar's eval is 600 epochs
+  epochs: 600
+  warm_start_epochs: 0
+  grad_clip: 5
+  # uses the whole training data of cifar10 (50K) to train from scratch for 600 epochs
+  train_portion: 1.
+  data_size: 50000
+
+  # cifar10 the cutout is done to have fair comparisons with previous work
+  cutout: True
+  # cifar10 cutout length is 16
+  cutout_length: 16
+  # cifar10 the cutout is done to have fair comparisons with previous work
+  cutout_prob: 1.0
+  # cifar drop out is 0.3
+  drop_path_prob: 0.2
+  # cifar auxiliary is 0.4
+  auxiliary_weight: 0.4
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index 2c0b96aa7b..dd41adc042 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -72,5 +72,5 @@
 
 trainer = Trainer(optimizer, config, lightweight_output=True)
 
-trainer.search(resume_from="")
+# trainer.search(resume_from="")
 trainer.evaluate(resume_from="", dataset_api=dataset_api)

From 6cb1e7b21b987b9c88dc4453d516965ad06b6cb4 Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Mon, 5 Dec 2022 17:05:46 +0100
Subject: [PATCH 02/12] update config for drnas

---
 naslib/defaults/drnas_defaults.yaml | 13 +++++++++++--
 1 file changed, 11 insertions(+), 2 deletions(-)

diff --git a/naslib/defaults/drnas_defaults.yaml b/naslib/defaults/drnas_defaults.yaml
index 13fa9b1dc3..b8a89025a8 100644
--- a/naslib/defaults/drnas_defaults.yaml
+++ b/naslib/defaults/drnas_defaults.yaml
@@ -3,7 +3,7 @@ dataset: cifar10
 # in the code base the deafult value for the seed is 2.
 # using random seeds that are logged but log files are not provided
 # not mentioned in the paper what are the random seeds are
-seed: 99
+seed: 2
 # darts (or nb301)
 # nb201
 search_space: nasbench301
@@ -21,7 +21,8 @@ search:
   momentum: 0.9
   # weight_decay for progressive and original: 0.0003
   weight_decay: 0.0003
-  # for cifar10 the learning process is 2 stages of 25 epochs
+  # for cifar10 the learning process is 2 stages of 25 epochs each
+  # in code it states that the number of training epochs has the default value of 100 in nb201
   epochs: 1
   warm_start_epochs: 0
   grad_clip: 5
@@ -30,13 +31,16 @@ search:
   # for cifar10 the train and optimization data (50k) is equally partitioned
   data_size: 25000
 
+  # for the four args the values are same for oridinary and progressive mode for nb201
   cutout: False
   cutout_length: 16
   cutout_prob: 1.0
   drop_path_prob: 0.0
 
+  # for nb201 this value is false
   unrolled: False
   arch_learning_rate: 0.0003
+  # not mentiond for progressive mode but for ordinary it is 1e-3 in nb201
   arch_weight_decay: 0.001
   output_weights: True
 
@@ -113,3 +117,8 @@ evaluation:
   drop_path_prob: 0.2
   # cifar auxiliary is 0.4
   auxiliary_weight: 0.4
+
+
+
+# has a partial channel variable that for oridinary is 1 and in progressive mode has 4 as the default value.
+# mentions some things about regularization scale of l2 and kl (used for dirichlet) in code of nb201

From 788b517a3b1090343108d8c524bd075586bb47af Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Thu, 8 Dec 2022 11:56:57 +0100
Subject: [PATCH 03/12] add batch_size and train_portion for eval mode

---
 naslib/defaults/drnas_defaults.yaml          |  6 +++---
 naslib/evaluators/zc_evaluator.py            |  1 +
 naslib/optimizers/oneshot/drnas/optimizer.py |  2 +-
 naslib/runners/nas/runner.py                 |  2 +-
 naslib/utils/utils.py                        | 11 ++++++++---
 5 files changed, 14 insertions(+), 8 deletions(-)

diff --git a/naslib/defaults/drnas_defaults.yaml b/naslib/defaults/drnas_defaults.yaml
index b8a89025a8..9c269d3b7a 100644
--- a/naslib/defaults/drnas_defaults.yaml
+++ b/naslib/defaults/drnas_defaults.yaml
@@ -6,9 +6,9 @@ dataset: cifar10
 seed: 2
 # darts (or nb301)
 # nb201
-search_space: nasbench301
+search_space: nasbench201
 out_dir: run
-optimizer: darts
+optimizer: drnas
 
 search:
   checkpoint_freq: 5
@@ -91,7 +91,7 @@ search:
 evaluation:
   checkpoint_freq: 30
   # Neither the paper nor the code base indicates the batch size but the default value is 64
-  batch_size: 96
+  batch_size: 64
 
   learning_rate: 0.025
   learning_rate_min: 0.00
diff --git a/naslib/evaluators/zc_evaluator.py b/naslib/evaluators/zc_evaluator.py
index 677bba4551..ba5cb2674a 100644
--- a/naslib/evaluators/zc_evaluator.py
+++ b/naslib/evaluators/zc_evaluator.py
@@ -138,6 +138,7 @@ def single_evaluate(self, test_data, zc_api):
         logger.info("Querying the predictor")
         query_time_start = time.time()
 
+        # TODO: shouldn't mode="val" be passed?
         _, _, test_loader, _, _ = utils.get_train_val_loaders(self.config)
 
         # Iterate over the architectures, instantiate a graph with each architecture
diff --git a/naslib/optimizers/oneshot/drnas/optimizer.py b/naslib/optimizers/oneshot/drnas/optimizer.py
index 787df25c8b..a3da1529be 100644
--- a/naslib/optimizers/oneshot/drnas/optimizer.py
+++ b/naslib/optimizers/oneshot/drnas/optimizer.py
@@ -67,7 +67,7 @@ def __init__(
     def new_epoch(self, epoch):
         super().new_epoch(epoch)
 
-    def adapt_search_space(self, search_space, scope=None):
+    def adapt_search_space(self, search_space, scope=None, **kwargs):
         """
         Same as in darts with a different mixop.
         If you want to checkpoint the dirichlet 'concentration' parameter (beta) add it to the buffer here.
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index dd41adc042..2c0b96aa7b 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -72,5 +72,5 @@
 
 trainer = Trainer(optimizer, config, lightweight_output=True)
 
-# trainer.search(resume_from="")
+trainer.search(resume_from="")
 trainer.evaluate(resume_from="", dataset_api=dataset_api)
diff --git a/naslib/utils/utils.py b/naslib/utils/utils.py
index 999540c822..7966891b55 100644
--- a/naslib/utils/utils.py
+++ b/naslib/utils/utils.py
@@ -170,13 +170,14 @@ def get_config_from_args(args=None, config_type="nas"):
     if args is None:
         args = parse_args()
     logger.info("Command line args: {}".format(args))
-
+    print("~~~~~~~~~~", args)
     if args.config_file is None:
         config = load_default_config(config_type=config_type)
     else:
         config = load_config(path=args.config_file)
 
     # Override file args with ones from command line
+    print("~~~~~~~~~", config)
     try:
         for arg, value in pairwise(args.opts):
             if "." in arg:
@@ -322,8 +323,12 @@ def get_train_val_loaders(config, mode="train"):
     data = config.data
     dataset = config.dataset
     seed = config.search.seed
-    batch_size = config.batch_size
-    train_portion = config.train_portion
+    if mode == "train":
+        batch_size = config.search.batch_size #changed this to config.search.batch_size
+        train_portion = config.search.train_portion #changed this to config.search.train_portion
+    elif mode == "val":
+        batch_size = config.evaluation.batch_size
+        train_portion = config.evaluation.batch_size
     config = config.search if mode == "train" else config.evaluation
     if dataset == "cifar10":
         train_transform, valid_transform = _data_transforms_cifar10(config)

From d021f0598a3df9713851f45a31a085063fd6c05e Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Wed, 14 Dec 2022 16:30:34 +0100
Subject: [PATCH 04/12] add todo to drnas optimizer

---
 naslib/defaults/drnas_defaults.yaml          | 2 +-
 naslib/optimizers/oneshot/drnas/optimizer.py | 5 ++++-
 naslib/utils/utils.py                        | 2 --
 3 files changed, 5 insertions(+), 4 deletions(-)

diff --git a/naslib/defaults/drnas_defaults.yaml b/naslib/defaults/drnas_defaults.yaml
index 9c269d3b7a..ff1a8f4513 100644
--- a/naslib/defaults/drnas_defaults.yaml
+++ b/naslib/defaults/drnas_defaults.yaml
@@ -23,7 +23,7 @@ search:
   weight_decay: 0.0003
   # for cifar10 the learning process is 2 stages of 25 epochs each
   # in code it states that the number of training epochs has the default value of 100 in nb201
-  epochs: 1
+  epochs: 25
   warm_start_epochs: 0
   grad_clip: 5
   # for cifar10 the train and optimization data (50k) is equally partitioned
diff --git a/naslib/optimizers/oneshot/drnas/optimizer.py b/naslib/optimizers/oneshot/drnas/optimizer.py
index a3da1529be..82e49a2905 100644
--- a/naslib/optimizers/oneshot/drnas/optimizer.py
+++ b/naslib/optimizers/oneshot/drnas/optimizer.py
@@ -65,6 +65,8 @@ def __init__(
         self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 
     def new_epoch(self, epoch):
+        #TODO: use this for the things that should be done for progressive learning
+        #at the beginning of each epoch
         super().new_epoch(epoch)
 
     def adapt_search_space(self, search_space, scope=None, **kwargs):
@@ -94,7 +96,7 @@ def step(self, data_train, data_val):
         self.arch_optimizer.zero_grad()
         logits_val = self.graph(input_val)
         val_loss = self.loss(logits_val, target_val)
-
+        # todo: this is the additional loss in eq2 in the paper
         if self.reg_type == "kl":
             val_loss += self._get_kl_reg()
 
@@ -182,6 +184,7 @@ def process_weights(self, weights):
         return weights
 
     def apply_weights(self, x, weights):
+        # TODO: have this changed based on the progressive formulation
         weighted_sum = sum(
             w * op(x, None)
             for w, op in zip(weights, self.primitives)
diff --git a/naslib/utils/utils.py b/naslib/utils/utils.py
index 7966891b55..c4d49c51ed 100644
--- a/naslib/utils/utils.py
+++ b/naslib/utils/utils.py
@@ -170,14 +170,12 @@ def get_config_from_args(args=None, config_type="nas"):
     if args is None:
         args = parse_args()
     logger.info("Command line args: {}".format(args))
-    print("~~~~~~~~~~", args)
     if args.config_file is None:
         config = load_default_config(config_type=config_type)
     else:
         config = load_config(path=args.config_file)
 
     # Override file args with ones from command line
-    print("~~~~~~~~~", config)
     try:
         for arg, value in pairwise(args.opts):
             if "." in arg:

From 73c70c880647dddea3f0066e5e7ad7a61d5c29d1 Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Thu, 12 Jan 2023 22:10:51 +0100
Subject: [PATCH 05/12] remove auxiliry head when running nb301

---
 naslib/defaults/drnas_defaults.yaml       | 4 ++--
 naslib/runners/nas/runner.py              | 2 +-
 naslib/search_spaces/nasbench301/graph.py | 2 +-
 3 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/naslib/defaults/drnas_defaults.yaml b/naslib/defaults/drnas_defaults.yaml
index ff1a8f4513..068e2b1def 100644
--- a/naslib/defaults/drnas_defaults.yaml
+++ b/naslib/defaults/drnas_defaults.yaml
@@ -6,7 +6,7 @@ dataset: cifar10
 seed: 2
 # darts (or nb301)
 # nb201
-search_space: nasbench201
+search_space: nasbench301
 out_dir: run
 optimizer: drnas
 
@@ -23,7 +23,7 @@ search:
   weight_decay: 0.0003
   # for cifar10 the learning process is 2 stages of 25 epochs each
   # in code it states that the number of training epochs has the default value of 100 in nb201
-  epochs: 25
+  epochs: 1
   warm_start_epochs: 0
   grad_clip: 5
   # for cifar10 the train and optimization data (50k) is equally partitioned
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index 2c0b96aa7b..6b9abd9f92 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -47,7 +47,7 @@
 supported_search_spaces = {
     'nasbench101': NasBench101SearchSpace(),
     'nasbench201': NasBench201SearchSpace(),
-    'nasbench301': NasBench301SearchSpace(),
+    'nasbench301': NasBench301SearchSpace(auxiliary=False),
     'nlp': NasBenchNLPSearchSpace(),
     'transbench101_micro': TransBench101SearchSpaceMicro(config.dataset),
     'transbench101_macro': TransBench101SearchSpaceMacro(),
diff --git a/naslib/search_spaces/nasbench301/graph.py b/naslib/search_spaces/nasbench301/graph.py
index 212fdaf91d..647966c45d 100644
--- a/naslib/search_spaces/nasbench301/graph.py
+++ b/naslib/search_spaces/nasbench301/graph.py
@@ -402,7 +402,7 @@ def query(
                 genotype = convert_naslib_to_genotype(self)
             else:
                 genotype = convert_compact_to_genotype(self.compact)
-            if metric == Metric.VAL_ACCURACY:
+            if metric == Metric.VAL_ACCURACY or metric == Metric.TEST_ACCURACY:
                 val_acc = dataset_api["nb301_model"][0].predict(
                     config=genotype, representation="genotype"
                 )

From 44891c989665b63221b13c425f5a35195ca9012a Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Sun, 29 Jan 2023 16:59:54 +0100
Subject: [PATCH 06/12] bug fix: able to do full eval with spaces

---
 naslib/defaults/darts_defaults.yaml |  6 +++---
 naslib/defaults/drnas_defaults.yaml | 10 +++++-----
 naslib/defaults/trainer.py          |  2 +-
 naslib/runners/nas/runner.py        |  5 ++++-
 4 files changed, 13 insertions(+), 10 deletions(-)

diff --git a/naslib/defaults/darts_defaults.yaml b/naslib/defaults/darts_defaults.yaml
index 3fc52c082f..e326b9f72a 100644
--- a/naslib/defaults/darts_defaults.yaml
+++ b/naslib/defaults/darts_defaults.yaml
@@ -1,6 +1,6 @@
-dataset: cifar10
+dataset: cifar100
 seed: 99
-search_space: nasbench301
+search_space: nasbench201
 out_dir: run
 optimizer: darts
 
@@ -26,7 +26,7 @@ search:
   arch_learning_rate: 0.0003
   arch_weight_decay: 0.001
   output_weights: True
-  
+
   fidelity: 200
 
   # GDAS
diff --git a/naslib/defaults/drnas_defaults.yaml b/naslib/defaults/drnas_defaults.yaml
index 068e2b1def..ba6273822d 100644
--- a/naslib/defaults/drnas_defaults.yaml
+++ b/naslib/defaults/drnas_defaults.yaml
@@ -1,14 +1,14 @@
-# options cifar10, cifar100, ImageNet reports on their test acc is avaliable
-dataset: cifar10
+# options cifar10, cifar100, ImageNet16-120 reports on their test acc is avaliable
+dataset: ImageNet16-120
 # in the code base the deafult value for the seed is 2.
 # using random seeds that are logged but log files are not provided
 # not mentioned in the paper what are the random seeds are
 seed: 2
 # darts (or nb301)
 # nb201
-search_space: nasbench301
+search_space: nasbench201
 out_dir: run
-optimizer: drnas
+optimizer: darts
 
 search:
   checkpoint_freq: 5
@@ -23,7 +23,7 @@ search:
   weight_decay: 0.0003
   # for cifar10 the learning process is 2 stages of 25 epochs each
   # in code it states that the number of training epochs has the default value of 100 in nb201
-  epochs: 1
+  epochs: 100
   warm_start_epochs: 0
   grad_clip: 5
   # for cifar10 the train and optimization data (50k) is equally partitioned
diff --git a/naslib/defaults/trainer.py b/naslib/defaults/trainer.py
index ccffda1c7f..fcce0bd51b 100644
--- a/naslib/defaults/trainer.py
+++ b/naslib/defaults/trainer.py
@@ -286,7 +286,7 @@ def evaluate(
             best_arch = self.optimizer.get_final_architecture()
         logger.info(f"Final architecture hash: {best_arch.get_hash()}")
 
-        if best_arch.QUERYABLE:
+        if best_arch.QUERYABLE and (not retrain):
             if metric is None:
                 metric = Metric.TEST_ACCURACY
             result = best_arch.query(
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index 6b9abd9f92..58c57b5046 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -73,4 +73,7 @@
 trainer = Trainer(optimizer, config, lightweight_output=True)
 
 trainer.search(resume_from="")
-trainer.evaluate(resume_from="", dataset_api=dataset_api)
+if config.search_space == 'nasbench301':
+    trainer.evaluate(resume_from="", retrain=True, dataset_api=dataset_api)
+else:
+    trainer.evaluate(resume_from="", retrain=False, dataset_api=dataset_api)

From 9766329ade4302e94b63b3c9f62d62598f0d24db Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Mon, 30 Jan 2023 13:00:39 +0100
Subject: [PATCH 07/12] refactored naslib runner

---
 naslib/defaults/darts_defaults.yaml |  2 +-
 naslib/runners/nas/runner.py        | 33 -----------------------------
 2 files changed, 1 insertion(+), 34 deletions(-)

diff --git a/naslib/defaults/darts_defaults.yaml b/naslib/defaults/darts_defaults.yaml
index e326b9f72a..64a36145f2 100644
--- a/naslib/defaults/darts_defaults.yaml
+++ b/naslib/defaults/darts_defaults.yaml
@@ -2,7 +2,7 @@ dataset: cifar100
 seed: 99
 search_space: nasbench201
 out_dir: run
-optimizer: darts
+optimizer: drnas
 
 search:
   checkpoint_freq: 5
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index 58c57b5046..ccf552e84f 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -2,29 +2,16 @@
 
 from naslib.defaults.trainer import Trainer
 from naslib.optimizers import (
-    RandomSearch,
-    Npenas,
-    RegularizedEvolution,
-    LocalSearch,
-    Bananas,
-    DARTSOptimizer,
     DrNASOptimizer,
-    GDASOptimizer
 )
 
 from naslib.search_spaces import (
-    NasBench101SearchSpace,
     NasBench201SearchSpace,
     NasBench301SearchSpace,
-    NasBenchNLPSearchSpace,
-    TransBench101SearchSpaceMicro,
-    TransBench101SearchSpaceMacro,
-    NasBenchASRSearchSpace
 )
 
 from naslib.utils import utils, setup_logger, get_dataset_api
 
-from naslib.search_spaces.transbench101.loss import SoftmaxCrossEntropyWithLogits
 
 config = utils.get_config_from_args(config_type='nas')
 
@@ -34,24 +21,12 @@
 utils.log_args(config)
 
 supported_optimizers = {
-    'rs': RandomSearch(config),
-    're': RegularizedEvolution(config),
-    'bananas': Bananas(config),
-    'npenas': Npenas(config),
-    'ls': LocalSearch(config),
-    'darts': DARTSOptimizer(config),
     'drnas': DrNASOptimizer(config),
-    'gdas': GDASOptimizer(config),
 }
 
 supported_search_spaces = {
-    'nasbench101': NasBench101SearchSpace(),
     'nasbench201': NasBench201SearchSpace(),
     'nasbench301': NasBench301SearchSpace(auxiliary=False),
-    'nlp': NasBenchNLPSearchSpace(),
-    'transbench101_micro': TransBench101SearchSpaceMicro(config.dataset),
-    'transbench101_macro': TransBench101SearchSpaceMacro(),
-    'asr': NasBenchASRSearchSpace(),
 }
 
 dataset_api = get_dataset_api(config.search_space, config.dataset)
@@ -61,14 +36,6 @@
 
 optimizer = supported_optimizers[config.optimizer]
 optimizer.adapt_search_space(search_space, dataset_api=dataset_api)
- 
-import torch
-
-if config.dataset in ['class_object', 'class_scene']:
-    optimizer.loss = SoftmaxCrossEntropyWithLogits()
-elif config.dataset == 'autoencoder':
-    optimizer.loss = torch.nn.L1Loss()
-    
 
 trainer = Trainer(optimizer, config, lightweight_output=True)
 

From cf68cefe343aeffce41b58feb89cee4e463aa712 Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Thu, 2 Feb 2023 15:56:57 +0100
Subject: [PATCH 08/12] added feature to handels the number of classes based on
 the dataset

---
 examples/example_runner.ipynb             |  8 ++++----
 examples/naslib_tutorial.ipynb            | 10 +++++-----
 naslib/defaults/darts_defaults.yaml       |  4 ++--
 naslib/defaults/drnas_defaults.yaml       | 13 +++++++------
 naslib/runners/nas/runner.py              |  4 ++--
 naslib/search_spaces/simple_cell/graph.py |  2 +-
 naslib/utils/utils.py                     |  9 +++++++++
 7 files changed, 30 insertions(+), 20 deletions(-)

diff --git a/examples/example_runner.ipynb b/examples/example_runner.ipynb
index bdb2127bcf..52cc74c5dc 100644
--- a/examples/example_runner.ipynb
+++ b/examples/example_runner.ipynb
@@ -71,10 +71,10 @@
      "evalue": "name 'utils' is not defined",
      "output_type": "error",
      "traceback": [
-      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[0;31mNameError\u001b[0m                                 Traceback (most recent call last)",
-      "\u001b[0;32m<ipython-input-4-11fe646b1b18>\u001b[0m in \u001b[0;36m<module>\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mconfig\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mutils\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mget_config_from_args\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mconfig_type\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0;34m'nas'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m      2\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      3\u001b[0m \u001b[0mlogger\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0msetup_logger\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mconfig\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0msave\u001b[0m \u001b[0;34m+\u001b[0m \u001b[0;34m\"/log.log\"\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      4\u001b[0m \u001b[0mlogger\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0msetLevel\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlogging\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mINFO\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      5\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;31mNameError\u001b[0m: name 'utils' is not defined"
+      "\u001B[0;31m---------------------------------------------------------------------------\u001B[0m",
+      "\u001B[0;31mNameError\u001B[0m                                 Traceback (most recent call last)",
+      "\u001B[0;32m<ipython-input-4-11fe646b1b18>\u001B[0m in \u001B[0;36m<module>\u001B[0;34m\u001B[0m\n\u001B[0;32m----> 1\u001B[0;31m \u001B[0mconfig\u001B[0m \u001B[0;34m=\u001B[0m \u001B[0mutils\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0mget_config_from_args\u001B[0m\u001B[0;34m(\u001B[0m\u001B[0mconfig_type\u001B[0m\u001B[0;34m=\u001B[0m\u001B[0;34m'nas'\u001B[0m\u001B[0;34m)\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[0m\u001B[1;32m      2\u001B[0m \u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      3\u001B[0m \u001B[0mlogger\u001B[0m \u001B[0;34m=\u001B[0m \u001B[0msetup_logger\u001B[0m\u001B[0;34m(\u001B[0m\u001B[0mconfig\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0msave\u001B[0m \u001B[0;34m+\u001B[0m \u001B[0;34m\"/log.log\"\u001B[0m\u001B[0;34m)\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      4\u001B[0m \u001B[0mlogger\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0msetLevel\u001B[0m\u001B[0;34m(\u001B[0m\u001B[0mlogging\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0mINFO\u001B[0m\u001B[0;34m)\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      5\u001B[0m \u001B[0;34m\u001B[0m\u001B[0m\n",
+      "\u001B[0;31mNameError\u001B[0m: name 'utils' is not defined"
      ]
     }
    ],
diff --git a/examples/naslib_tutorial.ipynb b/examples/naslib_tutorial.ipynb
index 7d7ac59ae0..74cd1af4b1 100644
--- a/examples/naslib_tutorial.ipynb
+++ b/examples/naslib_tutorial.ipynb
@@ -159,11 +159,11 @@
      "evalue": "No module named 'naslib.search_spaces.simple_cell'",
      "output_type": "error",
      "traceback": [
-      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[0;31mModuleNotFoundError\u001b[0m                       Traceback (most recent call last)",
-      "\u001b[0;32m<ipython-input-3-76203c895428>\u001b[0m in \u001b[0;36m<module>\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0;32mfrom\u001b[0m \u001b[0mnaslib\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0msearch_spaces\u001b[0m \u001b[0;32mimport\u001b[0m \u001b[0mNasBench201SearchSpace\u001b[0m \u001b[0;32mas\u001b[0m \u001b[0mNB201\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m      2\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      3\u001b[0m \u001b[0;31m# instantiate the search space object\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      4\u001b[0m \u001b[0msearch_space\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mNB201\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m~/anaconda3/envs/naslib/lib/python3.7/site-packages/naslib/search_spaces/__init__.py\u001b[0m in \u001b[0;36m<module>\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0;32mfrom\u001b[0m \u001b[0;34m.\u001b[0m\u001b[0msimple_cell\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mgraph\u001b[0m \u001b[0;32mimport\u001b[0m \u001b[0mSimpleCellSearchSpace\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m      2\u001b[0m \u001b[0;32mfrom\u001b[0m \u001b[0;34m.\u001b[0m\u001b[0mdarts\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mgraph\u001b[0m \u001b[0;32mimport\u001b[0m \u001b[0mDartsSearchSpace\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      3\u001b[0m \u001b[0;32mfrom\u001b[0m \u001b[0;34m.\u001b[0m\u001b[0mnasbench101\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mgraph\u001b[0m \u001b[0;32mimport\u001b[0m \u001b[0mNasBench101SearchSpace\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      4\u001b[0m \u001b[0;32mfrom\u001b[0m \u001b[0;34m.\u001b[0m\u001b[0mnasbench201\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mgraph\u001b[0m \u001b[0;32mimport\u001b[0m \u001b[0mNasBench201SearchSpace\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      5\u001b[0m \u001b[0;32mfrom\u001b[0m \u001b[0;34m.\u001b[0m\u001b[0mhierarchical\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mgraph\u001b[0m \u001b[0;32mimport\u001b[0m \u001b[0mHierarchicalSearchSpace\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;31mModuleNotFoundError\u001b[0m: No module named 'naslib.search_spaces.simple_cell'"
+      "\u001B[0;31m---------------------------------------------------------------------------\u001B[0m",
+      "\u001B[0;31mModuleNotFoundError\u001B[0m                       Traceback (most recent call last)",
+      "\u001B[0;32m<ipython-input-3-76203c895428>\u001B[0m in \u001B[0;36m<module>\u001B[0;34m\u001B[0m\n\u001B[0;32m----> 1\u001B[0;31m \u001B[0;32mfrom\u001B[0m \u001B[0mnaslib\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0msearch_spaces\u001B[0m \u001B[0;32mimport\u001B[0m \u001B[0mNasBench201SearchSpace\u001B[0m \u001B[0;32mas\u001B[0m \u001B[0mNB201\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[0m\u001B[1;32m      2\u001B[0m \u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      3\u001B[0m \u001B[0;31m# instantiate the search space object\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      4\u001B[0m \u001B[0msearch_space\u001B[0m \u001B[0;34m=\u001B[0m \u001B[0mNB201\u001B[0m\u001B[0;34m(\u001B[0m\u001B[0;34m)\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n",
+      "\u001B[0;32m~/anaconda3/envs/naslib/lib/python3.7/site-packages/naslib/search_spaces/__init__.py\u001B[0m in \u001B[0;36m<module>\u001B[0;34m\u001B[0m\n\u001B[0;32m----> 1\u001B[0;31m \u001B[0;32mfrom\u001B[0m \u001B[0;34m.\u001B[0m\u001B[0msimple_cell\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0mgraph\u001B[0m \u001B[0;32mimport\u001B[0m \u001B[0mSimpleCellSearchSpace\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[0m\u001B[1;32m      2\u001B[0m \u001B[0;32mfrom\u001B[0m \u001B[0;34m.\u001B[0m\u001B[0mdarts\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0mgraph\u001B[0m \u001B[0;32mimport\u001B[0m \u001B[0mDartsSearchSpace\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      3\u001B[0m \u001B[0;32mfrom\u001B[0m \u001B[0;34m.\u001B[0m\u001B[0mnasbench101\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0mgraph\u001B[0m \u001B[0;32mimport\u001B[0m \u001B[0mNasBench101SearchSpace\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      4\u001B[0m \u001B[0;32mfrom\u001B[0m \u001B[0;34m.\u001B[0m\u001B[0mnasbench201\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0mgraph\u001B[0m \u001B[0;32mimport\u001B[0m \u001B[0mNasBench201SearchSpace\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n\u001B[1;32m      5\u001B[0m \u001B[0;32mfrom\u001B[0m \u001B[0;34m.\u001B[0m\u001B[0mhierarchical\u001B[0m\u001B[0;34m.\u001B[0m\u001B[0mgraph\u001B[0m \u001B[0;32mimport\u001B[0m \u001B[0mHierarchicalSearchSpace\u001B[0m\u001B[0;34m\u001B[0m\u001B[0;34m\u001B[0m\u001B[0m\n",
+      "\u001B[0;31mModuleNotFoundError\u001B[0m: No module named 'naslib.search_spaces.simple_cell'"
      ]
     }
    ],
diff --git a/naslib/defaults/darts_defaults.yaml b/naslib/defaults/darts_defaults.yaml
index 64a36145f2..766049cff9 100644
--- a/naslib/defaults/darts_defaults.yaml
+++ b/naslib/defaults/darts_defaults.yaml
@@ -1,4 +1,4 @@
-dataset: cifar100
+dataset: ImageNet16-120
 seed: 99
 search_space: nasbench201
 out_dir: run
@@ -11,7 +11,7 @@ search:
   learning_rate_min: 0.001
   momentum: 0.9
   weight_decay: 0.0003
-  epochs: 1
+  epochs: 100
   warm_start_epochs: 0
   grad_clip: 5
   train_portion: 0.5
diff --git a/naslib/defaults/drnas_defaults.yaml b/naslib/defaults/drnas_defaults.yaml
index ba6273822d..d7a045c1a6 100644
--- a/naslib/defaults/drnas_defaults.yaml
+++ b/naslib/defaults/drnas_defaults.yaml
@@ -3,12 +3,12 @@ dataset: ImageNet16-120
 # in the code base the deafult value for the seed is 2.
 # using random seeds that are logged but log files are not provided
 # not mentioned in the paper what are the random seeds are
-seed: 2
+seed: 99
 # darts (or nb301)
 # nb201
-search_space: nasbench201
+search_space: nasbench301
 out_dir: run
-optimizer: darts
+optimizer: drnas
 
 search:
   checkpoint_freq: 5
@@ -99,9 +99,10 @@ evaluation:
   momentum: 0.9
   # for cifar weight_decay is 3e-4
   weight_decay: 0.0003
-  # cifar's eval is 600 epochs
-  epochs: 600
-  warm_start_epochs: 0
+  # cifar's eval is 600 epochs, for imagenet it is 250
+  epochs: 250
+  # for image net it has 5 epochs of warm starting
+  warm_start_epochs: 5
   grad_clip: 5
   # uses the whole training data of cifar10 (50K) to train from scratch for 600 epochs
   train_portion: 1.
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index ccf552e84f..53c357d7fe 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -25,8 +25,8 @@
 }
 
 supported_search_spaces = {
-    'nasbench201': NasBench201SearchSpace(),
-    'nasbench301': NasBench301SearchSpace(auxiliary=False),
+    'nasbench201': NasBench201SearchSpace(n_classes=config.n_classes),
+    'nasbench301': NasBench301SearchSpace(n_classes=config.n_classes, auxiliary=False),
 }
 
 dataset_api = get_dataset_api(config.search_space, config.dataset)
diff --git a/naslib/search_spaces/simple_cell/graph.py b/naslib/search_spaces/simple_cell/graph.py
index de51ba346f..2f3ded011a 100644
--- a/naslib/search_spaces/simple_cell/graph.py
+++ b/naslib/search_spaces/simple_cell/graph.py
@@ -6,7 +6,7 @@
 from naslib.search_spaces.core.graph import Graph, EdgeData
 from naslib.search_spaces.core import primitives as ops
 
-from ..nasbench301.graph import _truncate_input_edges
+# from ..nasbench301.graph import _truncate_input_edges
 from ..nasbench301.primitives import FactorizedReduce
 
 
diff --git a/naslib/utils/utils.py b/naslib/utils/utils.py
index d1413b117c..c9b7587db2 100644
--- a/naslib/utils/utils.py
+++ b/naslib/utils/utils.py
@@ -195,6 +195,15 @@ def get_config_from_args(args=None, config_type="nas"):
         config.set_new_allowed(True)
         config.merge_from_list(args.opts)
 
+        if config.dataset == 'cifar10':
+            config.n_classes = 10
+        elif config.dataset == 'cifar100':
+            config.n_classes = 100
+        elif config.dataset == 'ImageNet16-120':
+            config.n_classes = 120
+        else:
+            config.n_classes = 10
+
     except AttributeError:
         for arg, value in pairwise(args):
             config[arg] = value

From 7ba12ea1af137afc3bbec8bde277ddbc71ae32fb Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Mon, 6 Mar 2023 15:51:08 +0100
Subject: [PATCH 09/12] added arch_weights as additional checkpointables

---
 naslib/defaults/darts_defaults.yaml | 8 ++++----
 naslib/defaults/trainer.py          | 3 ++-
 naslib/runners/nas/runner.py        | 9 +++++----
 3 files changed, 11 insertions(+), 9 deletions(-)

diff --git a/naslib/defaults/darts_defaults.yaml b/naslib/defaults/darts_defaults.yaml
index 766049cff9..dfd348f13d 100644
--- a/naslib/defaults/darts_defaults.yaml
+++ b/naslib/defaults/darts_defaults.yaml
@@ -1,17 +1,17 @@
-dataset: ImageNet16-120
+dataset: cifar10
 seed: 99
 search_space: nasbench201
 out_dir: run
-optimizer: drnas
+optimizer: darts
 
 search:
-  checkpoint_freq: 5
+  checkpoint_freq: 1
   batch_size: 64
   learning_rate: 0.025
   learning_rate_min: 0.001
   momentum: 0.9
   weight_decay: 0.0003
-  epochs: 100
+  epochs: 5
   warm_start_epochs: 0
   grad_clip: 5
   train_portion: 0.5
diff --git a/naslib/defaults/trainer.py b/naslib/defaults/trainer.py
index fcce0bd51b..ae4405e531 100644
--- a/naslib/defaults/trainer.py
+++ b/naslib/defaults/trainer.py
@@ -146,7 +146,7 @@ def search(self, resume_from="", summary_writer=None, after_epoch: Callable[[int
 
                     self.train_loss.update(float(train_loss.detach().cpu()))
                     self.val_loss.update(float(val_loss.detach().cpu()))
-
+                    break
                 self.scheduler.step()
 
                 end_time = time.time()
@@ -569,6 +569,7 @@ def _setup_checkpointers(
 
         checkpointer = utils.Checkpointer(
             model=checkpointables.pop("model"),
+                arch_weights=checkpointables.pop("arch_weights"),
             save_dir=self.config.save + "/search"
             if search
             else self.config.save + "/eval",
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index 53c357d7fe..f5cc29b14d 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -2,10 +2,11 @@
 
 from naslib.defaults.trainer import Trainer
 from naslib.optimizers import (
-    DrNASOptimizer,
+    DARTSOptimizer,
 )
 
 from naslib.search_spaces import (
+    NasBench101SearchSpace,
     NasBench201SearchSpace,
     NasBench301SearchSpace,
 )
@@ -21,12 +22,12 @@
 utils.log_args(config)
 
 supported_optimizers = {
-    'drnas': DrNASOptimizer(config),
+    'darts': DARTSOptimizer(config),
 }
 
 supported_search_spaces = {
     'nasbench201': NasBench201SearchSpace(n_classes=config.n_classes),
-    'nasbench301': NasBench301SearchSpace(n_classes=config.n_classes, auxiliary=False),
+    # 'nasbench301': NasBench301SearchSpace(n_classes=config.n_classes, auxiliary=False),
 }
 
 dataset_api = get_dataset_api(config.search_space, config.dataset)
@@ -39,7 +40,7 @@
 
 trainer = Trainer(optimizer, config, lightweight_output=True)
 
-trainer.search(resume_from="")
+trainer.search(resume_from="/home/moradias/nas-fix/run/nasbench201/cifar10/darts/99/search/model_0000004.pth")
 if config.search_space == 'nasbench301':
     trainer.evaluate(resume_from="", retrain=True, dataset_api=dataset_api)
 else:

From f0aa6a87da67c5960f2cc156970cd880352c550e Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Sat, 11 Mar 2023 21:33:11 +0100
Subject: [PATCH 10/12] added set_checkpointables to all optimizers

---
 naslib/defaults/darts_defaults.yaml           |  2 +-
 naslib/defaults/trainer.py                    | 20 +++++++++++++------
 naslib/optimizers/core/metaclasses.py         |  6 ++++++
 .../optimizers/discrete/bananas/optimizer.py  |  1 +
 .../oneshot/configurable/optimizer.py         |  5 +++++
 naslib/optimizers/oneshot/darts/optimizer.py  | 11 ++++++++++
 .../optimizers/oneshot/gsparsity/optimizer.py |  4 ++++
 naslib/runners/nas/runner.py                  |  3 ++-
 8 files changed, 44 insertions(+), 8 deletions(-)

diff --git a/naslib/defaults/darts_defaults.yaml b/naslib/defaults/darts_defaults.yaml
index dfd348f13d..eeb8cda0b8 100644
--- a/naslib/defaults/darts_defaults.yaml
+++ b/naslib/defaults/darts_defaults.yaml
@@ -1,5 +1,5 @@
 dataset: cifar10
-seed: 99
+seed: 98
 search_space: nasbench201
 out_dir: run
 optimizer: darts
diff --git a/naslib/defaults/trainer.py b/naslib/defaults/trainer.py
index ae4405e531..1f8f035fd4 100644
--- a/naslib/defaults/trainer.py
+++ b/naslib/defaults/trainer.py
@@ -88,7 +88,6 @@ def search(self, resume_from="", summary_writer=None, after_epoch: Callable[[int
         np.random.seed(self.config.search.seed)
         torch.manual_seed(self.config.search.seed)
 
-        self.optimizer.before_training()
         checkpoint_freq = self.config.search.checkpoint_freq
         if self.optimizer.using_step_function:
             self.scheduler = self.build_search_scheduler(
@@ -101,6 +100,8 @@ def search(self, resume_from="", summary_writer=None, after_epoch: Callable[[int
         else:
             start_epoch = self._setup_checkpointers(resume_from, period=checkpoint_freq)
 
+        self.optimizer.before_training()
+
         if self.optimizer.using_step_function:
             self.train_queue, self.valid_queue, _ = self.build_search_dataloaders(
                 self.config
@@ -146,7 +147,7 @@ def search(self, resume_from="", summary_writer=None, after_epoch: Callable[[int
 
                     self.train_loss.update(float(train_loss.detach().cpu()))
                     self.val_loss.update(float(val_loss.detach().cpu()))
-                    break
+                    # break
                 self.scheduler.step()
 
                 end_time = time.time()
@@ -179,7 +180,10 @@ def search(self, resume_from="", summary_writer=None, after_epoch: Callable[[int
                 self.train_top1.avg = train_acc
                 self.val_top1.avg = valid_acc
 
-            self.periodic_checkpointer.step(e)
+            # arch_weights = self.optimizer.get_checkpointables()["arch_weights"]
+            add_checkpointables = self.optimizer.get_checkpointables()
+            del add_checkpointables["model"]
+            self.periodic_checkpointer.step(e, **add_checkpointables)
 
             anytime_results = self.optimizer.test_statistics()
             # if anytime_results:
@@ -408,8 +412,10 @@ def evaluate(
                                     logits_valid, target_valid, "val"
                                 )
 
+                    arch_weights = self.optimizer.get_checkpointables()["arch_weights"]
+
                     scheduler.step()
-                    self.periodic_checkpointer.step(e)
+                    self.periodic_checkpointer.step(iteration=e, arch_weights=arch_weights)
                     self._log_and_reset_accuracies(e)
 
             # Disable drop path
@@ -569,7 +575,6 @@ def _setup_checkpointers(
 
         checkpointer = utils.Checkpointer(
             model=checkpointables.pop("model"),
-                arch_weights=checkpointables.pop("arch_weights"),
             save_dir=self.config.save + "/search"
             if search
             else self.config.save + "/eval",
@@ -586,8 +591,11 @@ def _setup_checkpointers(
 
         if resume_from:
             logger.info("loading model from file {}".format(resume_from))
-            checkpoint = checkpointer.resume_or_load(resume_from, resume=True)
+            # if resume=True starts from the last_checkpoint
+            # if resume=False starts from the path mentioned as resume_from
+            checkpoint = checkpointer.resume_or_load(resume_from, resume=False)
             if checkpointer.has_checkpoint():
+                self.optimizer.set_checkpointables(checkpoint)
                 return checkpoint.get("iteration", -1) + 1
         return 0
 
diff --git a/naslib/optimizers/core/metaclasses.py b/naslib/optimizers/core/metaclasses.py
index b97ce83e82..353af8ff65 100644
--- a/naslib/optimizers/core/metaclasses.py
+++ b/naslib/optimizers/core/metaclasses.py
@@ -121,3 +121,9 @@ def get_checkpointables(self):
             (dict): with name as key and object as value. e.g. graph, arch weights, optimizers, ...
         """
         pass
+
+    def set_checkpointables(self, architectural_weights):
+        """
+        would set the objects saved in the checkpoint during last phase of training
+        """
+        pass
diff --git a/naslib/optimizers/discrete/bananas/optimizer.py b/naslib/optimizers/discrete/bananas/optimizer.py
index d9abebe58a..5fbaaa59d0 100644
--- a/naslib/optimizers/discrete/bananas/optimizer.py
+++ b/naslib/optimizers/discrete/bananas/optimizer.py
@@ -318,3 +318,4 @@ def get_arch_as_string(self, arch):
         else:
             str_arch = str(arch)
         return str_arch
+
diff --git a/naslib/optimizers/oneshot/configurable/optimizer.py b/naslib/optimizers/oneshot/configurable/optimizer.py
index 23956502cf..025e333ec6 100644
--- a/naslib/optimizers/oneshot/configurable/optimizer.py
+++ b/naslib/optimizers/oneshot/configurable/optimizer.py
@@ -202,6 +202,11 @@ def get_checkpointables(self):
             "arch_weights": self.architectural_weights,
         }
 
+    def set_checkpointables(self, checkpointables):
+        self.op_optimizer = checkpointables.get("op_optimizer")
+        self.arch_optimizer = checkpointables.get("arch_optimizer")
+        self.architectural_weights = checkpointables.get("arch_weights")
+
     def before_training(self):
         """
         Move the graph into cuda memory if available.
diff --git a/naslib/optimizers/oneshot/darts/optimizer.py b/naslib/optimizers/oneshot/darts/optimizer.py
index ab4702a159..0e2c24c782 100644
--- a/naslib/optimizers/oneshot/darts/optimizer.py
+++ b/naslib/optimizers/oneshot/darts/optimizer.py
@@ -133,6 +133,12 @@ def new_epoch(self, epoch):
         """
         Just log the architecture weights.
         """
+        # print("=====================================")
+        # if self.architectural_weights.is_cuda:
+        #     print("The tensor is on a GPU with index:", self.architectural_weights.get_device())
+        # else:
+        #     print("The tensor is not on a GPU.")
+        # print("=====================================")
         alpha_str = [
             ", ".join(["{:+.06f}".format(x) for x in a])
             + ", {}".format(np.argmax(a.detach().cpu().numpy()))
@@ -200,6 +206,11 @@ def get_op_optimizer(self):
     def get_model_size(self):
         return count_parameters_in_MB(self.graph)
 
+    def set_checkpointables(self, checkpointables):
+        self.op_optimizer = checkpointables.get("op_optimizer")
+        self.arch_optimizer = checkpointables.get("arch_optimizer")
+        self.architectural_weights = checkpointables.get("arch_weights")
+
     def test_statistics(self):
         # nb301 is not there but we use it anyways to generate the arch strings.
         # if self.graph.QUERYABLE:
diff --git a/naslib/optimizers/oneshot/gsparsity/optimizer.py b/naslib/optimizers/oneshot/gsparsity/optimizer.py
index 814621a9e9..61f202f260 100644
--- a/naslib/optimizers/oneshot/gsparsity/optimizer.py
+++ b/naslib/optimizers/oneshot/gsparsity/optimizer.py
@@ -419,6 +419,10 @@ def get_op_optimizer(self):
     def get_model_size(self):
         return count_parameters_in_MB(self.graph)
 
+    def set_checkpointables(self, checkpointables):
+        self.op_optimizer = checkpointables.get("op_optimizer")
+        self.op_optimizer_evaluate = checkpointables.get("op_optimizer_evaluate")
+
     def get_checkpointables(self):
         """
         Return all objects that should be saved in a checkpoint during training.
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index f5cc29b14d..a3670a7f74 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -39,8 +39,9 @@
 optimizer.adapt_search_space(search_space, dataset_api=dataset_api)
 
 trainer = Trainer(optimizer, config, lightweight_output=True)
+trainer.search(resume_from="")
 
-trainer.search(resume_from="/home/moradias/nas-fix/run/nasbench201/cifar10/darts/99/search/model_0000004.pth")
+# trainer.search(resume_from="/home/moradias/nas-fix/run/nasbench201/cifar10/darts/97/search/model_0000002.pth")
 if config.search_space == 'nasbench301':
     trainer.evaluate(resume_from="", retrain=True, dataset_api=dataset_api)
 else:

From 09641d05172f19852510cf1baa27d4f952a39f48 Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Mon, 13 Mar 2023 17:10:02 +0100
Subject: [PATCH 11/12] bug fix, updated order of before_training and
 _set_checkpoint for evaluate_oneshot

---
 naslib/defaults/trainer.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/naslib/defaults/trainer.py b/naslib/defaults/trainer.py
index 1f8f035fd4..853083964b 100644
--- a/naslib/defaults/trainer.py
+++ b/naslib/defaults/trainer.py
@@ -220,8 +220,8 @@ def evaluate_oneshot(self, resume_from="", dataloader=None):
                 evaluate with the current one-shot weights.
         """
         logger.info("Start one-shot evaluation")
-        self.optimizer.before_training()
         self._setup_checkpointers(resume_from)
+        self.optimizer.before_training()
 
         loss = torch.nn.CrossEntropyLoss()
 

From a17a2844f74b08163ee67e021d93a485c761e4ff Mon Sep 17 00:00:00 2001
From: shakibamrd <shakiba.moradian@yahoo.com>
Date: Sat, 25 Mar 2023 22:40:39 +0100
Subject: [PATCH 12/12] resolve comments made on the pull request

---
 naslib/defaults/darts_defaults.yaml          | 14 +++----
 naslib/defaults/trainer.py                   |  3 +-
 naslib/optimizers/core/metaclasses.py        |  8 +++-
 naslib/optimizers/oneshot/darts/optimizer.py |  6 ---
 naslib/runners/nas/runner.py                 | 41 ++++++++++++++++----
 naslib/search_spaces/simple_cell/graph.py    |  2 +-
 naslib/utils/utils.py                        |  2 +
 7 files changed, 51 insertions(+), 25 deletions(-)

diff --git a/naslib/defaults/darts_defaults.yaml b/naslib/defaults/darts_defaults.yaml
index eeb8cda0b8..c5af7ae08d 100644
--- a/naslib/defaults/darts_defaults.yaml
+++ b/naslib/defaults/darts_defaults.yaml
@@ -1,17 +1,17 @@
 dataset: cifar10
-seed: 98
+seed: 99
 search_space: nasbench201
 out_dir: run
 optimizer: darts
 
 search:
-  checkpoint_freq: 1
+  checkpoint_freq: 5
   batch_size: 64
   learning_rate: 0.025
   learning_rate_min: 0.001
   momentum: 0.9
   weight_decay: 0.0003
-  epochs: 5
+  epochs: 50
   warm_start_epochs: 0
   grad_clip: 5
   train_portion: 0.5
@@ -36,7 +36,7 @@ search:
   # RE
   sample_size: 10
   population_size: 100
-  
+
   #LS
   num_init: 10
 
@@ -56,7 +56,7 @@ search:
   #train_portion: 0.9
   #data_size: 25000
 
-  
+
   # BANANAS
   k: 10
   num_ensemble: 3
@@ -66,7 +66,7 @@ search:
   num_arches_to_mutate: 2
   max_mutations: 1
   num_candidates: 100
-  
+
   # BasePredictor
   predictor_type: var_sparse_gp
   debug_predictor: False
@@ -88,4 +88,4 @@ evaluation:
   cutout_length: 16
   cutout_prob: 1.0
   drop_path_prob: 0.2
-  auxiliary_weight: 0.4
+  auxiliary_weight: 0.4
\ No newline at end of file
diff --git a/naslib/defaults/trainer.py b/naslib/defaults/trainer.py
index 853083964b..65a9587141 100644
--- a/naslib/defaults/trainer.py
+++ b/naslib/defaults/trainer.py
@@ -147,7 +147,7 @@ def search(self, resume_from="", summary_writer=None, after_epoch: Callable[[int
 
                     self.train_loss.update(float(train_loss.detach().cpu()))
                     self.val_loss.update(float(val_loss.detach().cpu()))
-                    # break
+                    
                 self.scheduler.step()
 
                 end_time = time.time()
@@ -180,7 +180,6 @@ def search(self, resume_from="", summary_writer=None, after_epoch: Callable[[int
                 self.train_top1.avg = train_acc
                 self.val_top1.avg = valid_acc
 
-            # arch_weights = self.optimizer.get_checkpointables()["arch_weights"]
             add_checkpointables = self.optimizer.get_checkpointables()
             del add_checkpointables["model"]
             self.periodic_checkpointer.step(e, **add_checkpointables)
diff --git a/naslib/optimizers/core/metaclasses.py b/naslib/optimizers/core/metaclasses.py
index 353af8ff65..d1abeb7456 100644
--- a/naslib/optimizers/core/metaclasses.py
+++ b/naslib/optimizers/core/metaclasses.py
@@ -122,8 +122,12 @@ def get_checkpointables(self):
         """
         pass
 
-    def set_checkpointables(self, architectural_weights):
+    def set_checkpointables(self, checkpointables):
         """
-        would set the objects saved in the checkpoint during last phase of training
+        would set values of the saved objects in the checkpoint during training/evaluation.
+
+        Args:
+            (dict): with name as key and object as value. e.g. op and arch optimizers, arch weights, ...
         """
+
         pass
diff --git a/naslib/optimizers/oneshot/darts/optimizer.py b/naslib/optimizers/oneshot/darts/optimizer.py
index 0e2c24c782..bc0b275bd9 100644
--- a/naslib/optimizers/oneshot/darts/optimizer.py
+++ b/naslib/optimizers/oneshot/darts/optimizer.py
@@ -133,12 +133,6 @@ def new_epoch(self, epoch):
         """
         Just log the architecture weights.
         """
-        # print("=====================================")
-        # if self.architectural_weights.is_cuda:
-        #     print("The tensor is on a GPU with index:", self.architectural_weights.get_device())
-        # else:
-        #     print("The tensor is not on a GPU.")
-        # print("=====================================")
         alpha_str = [
             ", ".join(["{:+.06f}".format(x) for x in a])
             + ", {}".format(np.argmax(a.detach().cpu().numpy()))
diff --git a/naslib/runners/nas/runner.py b/naslib/runners/nas/runner.py
index a3670a7f74..75264c4f01 100644
--- a/naslib/runners/nas/runner.py
+++ b/naslib/runners/nas/runner.py
@@ -2,17 +2,29 @@
 
 from naslib.defaults.trainer import Trainer
 from naslib.optimizers import (
+    RandomSearch,
+    Npenas,
+    RegularizedEvolution,
+    LocalSearch,
+    Bananas,
     DARTSOptimizer,
+    DrNASOptimizer,
+    GDASOptimizer
 )
 
 from naslib.search_spaces import (
     NasBench101SearchSpace,
     NasBench201SearchSpace,
     NasBench301SearchSpace,
+    NasBenchNLPSearchSpace,
+    TransBench101SearchSpaceMicro,
+    TransBench101SearchSpaceMacro,
+    NasBenchASRSearchSpace
 )
 
 from naslib.utils import utils, setup_logger, get_dataset_api
 
+from naslib.search_spaces.transbench101.loss import SoftmaxCrossEntropyWithLogits
 
 config = utils.get_config_from_args(config_type='nas')
 
@@ -22,12 +34,24 @@
 utils.log_args(config)
 
 supported_optimizers = {
+    'rs': RandomSearch(config),
+    're': RegularizedEvolution(config),
+    'bananas': Bananas(config),
+    'npenas': Npenas(config),
+    'ls': LocalSearch(config),
     'darts': DARTSOptimizer(config),
+    'drnas': DrNASOptimizer(config),
+    'gdas': GDASOptimizer(config),
 }
 
 supported_search_spaces = {
+    'nasbench101': NasBench101SearchSpace(n_classes=config.n_classes),
     'nasbench201': NasBench201SearchSpace(n_classes=config.n_classes),
-    # 'nasbench301': NasBench301SearchSpace(n_classes=config.n_classes, auxiliary=False),
+    'nasbench301': NasBench301SearchSpace(n_classes=config.n_classes, auxiliary=False),
+    'nlp': NasBenchNLPSearchSpace(),
+    'transbench101_micro': TransBench101SearchSpaceMicro(config.dataset),
+    'transbench101_macro': TransBench101SearchSpaceMacro(),
+    'asr': NasBenchASRSearchSpace(),
 }
 
 dataset_api = get_dataset_api(config.search_space, config.dataset)
@@ -38,11 +62,14 @@
 optimizer = supported_optimizers[config.optimizer]
 optimizer.adapt_search_space(search_space, dataset_api=dataset_api)
 
+import torch
+
+if config.dataset in ['class_object', 'class_scene']:
+    optimizer.loss = SoftmaxCrossEntropyWithLogits()
+elif config.dataset == 'autoencoder':
+    optimizer.loss = torch.nn.L1Loss()
+
 trainer = Trainer(optimizer, config, lightweight_output=True)
-trainer.search(resume_from="")
 
-# trainer.search(resume_from="/home/moradias/nas-fix/run/nasbench201/cifar10/darts/97/search/model_0000002.pth")
-if config.search_space == 'nasbench301':
-    trainer.evaluate(resume_from="", retrain=True, dataset_api=dataset_api)
-else:
-    trainer.evaluate(resume_from="", retrain=False, dataset_api=dataset_api)
+trainer.search(resume_from="")
+trainer.evaluate(resume_from="", dataset_api=dataset_api)
\ No newline at end of file
diff --git a/naslib/search_spaces/simple_cell/graph.py b/naslib/search_spaces/simple_cell/graph.py
index 2f3ded011a..de51ba346f 100644
--- a/naslib/search_spaces/simple_cell/graph.py
+++ b/naslib/search_spaces/simple_cell/graph.py
@@ -6,7 +6,7 @@
 from naslib.search_spaces.core.graph import Graph, EdgeData
 from naslib.search_spaces.core import primitives as ops
 
-# from ..nasbench301.graph import _truncate_input_edges
+from ..nasbench301.graph import _truncate_input_edges
 from ..nasbench301.primitives import FactorizedReduce
 
 
diff --git a/naslib/utils/utils.py b/naslib/utils/utils.py
index c9b7587db2..9c97122c8a 100644
--- a/naslib/utils/utils.py
+++ b/naslib/utils/utils.py
@@ -9,6 +9,7 @@
 from scipy import stats
 import copy
 import json
+import warnings
 
 from collections import OrderedDict
 
@@ -202,6 +203,7 @@ def get_config_from_args(args=None, config_type="nas"):
         elif config.dataset == 'ImageNet16-120':
             config.n_classes = 120
         else:
+            warnings.warn("Number of classes was not set. Default 10 is set.")
             config.n_classes = 10
 
     except AttributeError: