dcem optimizer working

facebookresearch · luisenp · Mar 23, 2023 · Oct 13, 2022 · Oct 14, 2022 · Oct 17, 2022
commit 245d80ca42b79f89fb65dabf5fc458c713d3a15e
diff --git a/theseus/__init__.py b/theseus/__init__.py
@@ -88,6 +88,7 @@
     BackwardMode,
     Dogleg,
     GaussNewton,
+    DCem,
     LevenbergMarquardt,
     NonlinearLeastSquares,
     NonlinearOptimizerInfo,

diff --git a/theseus/optimizer/nonlinear/__init__.py b/theseus/optimizer/nonlinear/__init__.py
@@ -3,6 +3,7 @@
 # This source code is licensed under the MIT license found in the
 # LICENSE file in the root directory of this source tree.
 from .dogleg import Dogleg
+from .dcem import DCem
 from .gauss_newton import GaussNewton
 from .levenberg_marquardt import LevenbergMarquardt
 from .nonlinear_least_squares import NonlinearLeastSquares

diff --git a/theseus/optimizer/nonlinear/dcem.py b/theseus/optimizer/nonlinear/dcem.py
@@ -31,12 +31,12 @@ def __init__(
         self,
         objective: Objective,
         ordering: VariableOrdering = None,
-        n_batch=1,
-        n_sample=20,
-        n_elite=10,
+        n_batch: int = 1,
+        n_sample: int = 20,
+        n_elite: int = 10,
         lb=None,
         ub=None,
-        temp=1.0,
+        temp: float = 1.0,
         normalize: bool = False,
         lml_verbose: bool = False,
         lml_eps: float = 1e-3,
@@ -53,6 +53,7 @@ def __init__(
         self.normalize = normalize
         self.lml_verbose = lml_verbose
         self.lml_eps = lml_eps
+        self.tot_dof = sum([x.dof() for x in self.ordering])
         self.sigma = {var.name: torch.ones(var.shape) for var in self.ordering}
 
     def solve(self):
@@ -62,25 +63,35 @@ def solve(self):
 
         idx = 0
         for var in self.ordering:
-            mu[:, idx + var.dof()] = var.tensor
+            mu[:, slice(idx, idx + var.dof())] = var.tensor
             idx += var.dof()
 
+        # print("mu", mu)
+        # print("sigma", self.sigma)
+
         X_samples = []
-        for i in self.n_samples:
+        for i in range(self.n_samples):
             sample = {}
             for var in self.ordering:
-                sample[var.name] = Normal(var.tensor, self.sigma).rsample().to(device)
-                assert sample[var.name].size() == var.size()
+                sample[var.name] = (
+                    Normal(var.tensor, self.sigma[var.name]).rsample().to(device)
+                )
+                assert sample[var.name].size() == var.shape
                 sample[var.name] = sample[var.name].contiguous()
                 if self.lb is not None or self.ub is not None:
                     sample[var.name] = torch.clamp(sample[var.name], self.lb, self.ub)
+            # print("sample", sample)
             X_samples.append(sample)
 
         # TODO: Check that self.objective.error_squared_norm(X_samples[i]).size() == (n_batch,)
         fX = torch.stack(
-            [self.objective.error_squared_norm(X_samples[i]) for i in self.n_samples],
+            [
+                self.objective.error_squared_norm(X_samples[i])
+                for i in range(self.n_samples)
+            ],
             dim=1,
         )
+        # print("fx:", fX.shape)
 
         assert fX.shape == (self.n_batch, self.n_samples)
 
@@ -113,22 +124,30 @@ def solve(self):
             I = I.unsqueeze(2)
         # I.shape should be (n_batch, n_sample, 1)
 
-        X = torch.zeros(
-            (self.n_batch, self.n_samples, sum([x.dof() for x in self.ordering]))
-        )
-        for i in self.n_samples:
+        X = torch.zeros((self.n_batch, self.n_samples, self.tot_dof))
+
+        for i in range(self.n_samples):
             sample = X_samples[i]
             idx = 0
-            for name, var in sample.items():
-                X[:, i, slice(idx, var.dof())] = var
+            for var in self.ordering:
+                X[:, i, slice(idx, idx + var.dof())] = sample[var.name]
                 idx += var.dof()
 
         assert I.shape[:2] == X.shape[:2]
-
+        # print("Samples:", X)
         X_I = I * X
         old_mu = mu.clone()
         mu = torch.sum(X_I, dim=1) / self.n_elite
-        self.sigma = ((I * (X - mu.unsqueeze(1)) ** 2).sum(dim=1) / self.n_elite).sqrt()
+
+        sigma = ((I * (X - mu.unsqueeze(1)) ** 2).sum(dim=1) / self.n_elite).sqrt()
+        # print("sigma_updates", sigma)
+
+        assert sigma.shape == (self.n_batch, self.tot_dof)
+
+        idx = 0
+        for var in self.ordering:
+            self.sigma[var.name] = sigma[:, slice(idx, idx + var.dof())]
+            idx += var.dof()
 
         # not sure about the detach
         return mu - old_mu.detach()
@@ -141,8 +160,8 @@ def __init__(
         cem_solver: Optional[abc.ABC] = DCemSolver,
         n_batch: int = 1,
         n_sample: int = 20,
-        n_elite: int = 10,
-        n_iter: int = 10,
+        n_elite: int = 5,
+        n_iter: int = 50,
         temp: float = 1.0,
         lb=None,
         ub=None,
@@ -151,20 +170,11 @@ def __init__(
         lml_verbose: bool = False,
         lml_eps: float = 1e-3,
         normalize: bool = True,
-        iter_eps=1e-4,
+        iter_eps: float = 1e-4,
         **kwargs,
     ) -> None:
         super().__init__(objective, vectorize=Vectorize, **kwargs)
-        self.params = NonlinearOptimizerParams(
-            n_batch,
-            n_sample,
-            n_elite,
-            n_iter,
-            temp,
-            lb,
-            ub,
-            iter_eps,
-        )
+        self.params = NonlinearOptimizerParams(iter_eps, iter_eps * 100, n_iter, 1e-2)
 
         self.ordering = VariableOrdering(objective)
         self.solver = cem_solver(
@@ -173,16 +183,24 @@ def __init__(
             n_batch,
             n_sample,
             n_elite,
-            n_iter,
-            temp,
             lb,
             ub,
+            temp,
+            normalize,
             lml_verbose,
             lml_eps,
-            normalize,
-            iter_eps,
         )
 
+    def _maybe_init_best_solution(
+        self, do_init: bool = False
+    ) -> Optional[Dict[str, torch.Tensor]]:
+        if not do_init:
+            return None
+        solution_dict = {}
+        for var in self.ordering:
+            solution_dict[var.name] = var.tensor.detach().clone().cpu()
+        return solution_dict
+
     def _init_info(
         self,
         track_best_solution: bool,
@@ -266,7 +284,7 @@ def _update_info(
             assert info.best_err is not None
             good_indices = err < info.best_err
             info.best_iter[good_indices] = current_iter
-            for var in self.linear_solver.linearization.ordering:
+            for var in self.ordering:
                 info.best_solution[var.name][good_indices] = (
                     var.tensor.detach().clone()[good_indices].cpu()
                 )
@@ -295,8 +313,8 @@ def _optimize_loop(
             except RuntimeError as error:
                 raise RuntimeError(f"There is an error in update {error}")
 
-            self.objective.retract_optim_var(
-                delta, self.ordering, ignore_mask=converged_indices, force_upate=False
+            self.objective.retract_optim_vars(
+                delta, self.ordering, ignore_mask=converged_indices, force_update=False
             )
 
             # check for convergence