started implementing case study with noise variance estimation

desResLab · May 31, 2024 · 19b8136 · 19b8136
1 parent 19e9a35
commit 19b8136
Show file tree

Hide file tree

Showing 3 changed files with 216 additions and 4 deletions.
diff --git a/linfa/models/discrepancy_models.py b/linfa/models/discrepancy_models.py
@@ -19,7 +19,7 @@ def __init__(self, var_inputs):
  self.stdRatio = 0.05 # standard deviation ratio
  self.defOut = self.solve_t(self.defParams)
 
- def solve_t(self, cal_inputs):
+ def solve_t(self, cal_inputs, noise = None):
 
  num_batch = len(cal_inputs)
  num_vars = len(self.var_in)
@@ -85,10 +85,10 @@ def genDataFile(self, dataFileNamePrefix='observations', use_true_model=True, st
  def_out = self.solve_t(self.defParams)
 
  # get standard deviation
- stdDev = self.stdRatio * torch.abs(def_out)
+ stdDev = self.stdRatio * torch.mean(torch.abs(def_out))
 
  # add noise to coverage data
- coverage = def_out.repeat(1,num_observations)
+ coverage = def_out.repeat(1, num_observations)
 
  for loopA in range(num_observations):
  noise = torch.randn((len(coverage),1)) * stdDev

diff --git a/linfa/tests/test_no_disc_TP15_error_estimation.py b/linfa/tests/test_no_disc_TP15_error_estimation.py
@@ -0,0 +1,212 @@
+from linfa.run_experiment import experiment
+from linfa.transform import Transformation
+from linfa.discrepancy import Discrepancy
+import torch
+import random
+import numpy as np
+
+# Import rcr model
+from linfa.models.discrepancy_models import PhysChem
+
+def run_test():
+
+ exp = experiment()
+ exp.name = "TP15_no_disc_error_estimation"
+ exp.flow_type = 'realnvp' # str: Type of flow (default 'realnvp') # TODO: generalize to work for TP1
+ exp.n_blocks = 15 # int: Number of hidden layers 
+ exp.hidden_size = 100 # int: Hidden layer size for MADE in each layer (default 100)
+ exp.n_hidden = 1 # int: Number of hidden layers in each MADE
+ exp.activation_fn = 'relu' # str: Activation function used (default 'relu')
+ exp.input_order = 'sequential' # str: Input oder for create_mask (default 'sequential')
+ exp.batch_norm_order = True # bool: Order to decide if batch_norm is used (default True)
+ exp.save_interval = 1000 # int: How often to sample from normalizing flow
+
+ exp.input_size = 2 # int: Dimensionalty of input (default 2)
+ exp.batch_size = 200 # int: Number of samples generated (default 100)
+ exp.true_data_num = 2 # double: Number of true model evaluted (default 2)
+ exp.n_iter = 10000 # int: Number of iterations (default 25001)
+ exp.lr = 0.001 # float: Learning rate (default 0.003)
+ exp.lr_decay = 0.9999 # float: Learning rate decay (default 0.9999)
+ exp.log_interal = 10 # int: How often to show loss stat (default 10)
+
+ exp.run_nofas = False # normalizing flow with adaptive surrogate
+ exp.surrogate_type = 'discrepancy' # type of surrogate we are using
+ exp.surr_pre_it = 1000 # int: Number of pre-training iterations for surrogate model
+ exp.surr_upd_it = 2000 # int: Number of iterations for the surrogate model update
+ exp.calibrate_interval = 1000 #:int: How often the surrogate model is updated
+
+ exp.annealing = False 
+ exp.budget = 216 # int: Total number of true model evaulations
+ exp.surr_folder = "./" 
+ exp.use_new_surr = True
+
+ exp.output_dir = './results/' + exp.name
+ exp.log_file = 'log.txt'
+
+ exp.seed = 35435 # int: Random seed used
+ exp.n_sample = 5000 # int: Batch size to generate final results/plots
+ exp.no_cuda = True # Running on CPU by default but teste on CUDA
+
+ exp.optimizer = 'RMSprop'
+ exp.lr_scheduler = 'ExponentialLR'
+
+ exp.device = torch.device('cuda:0' if torch.cuda.is_available() and not exp.no_cuda else 'cpu')
+
+ # Define transformation
+ trsf_info = [['tanh', -30.0, 30.0, 500.0, 1500.0],
+ ['tanh', -30.0, 30.0, -30000.0, -15000.0]]
+ trsf = Transformation(trsf_info)
+
+ # Apply the transformation
+ exp.transform = trsf
+
+ # Add temperatures and pressures for each evaluation
+ variable_inputs = [[350.0, 400.0, 450.0],
+ [1.0, 2.0, 3.0, 4.0, 5.0]]
+
+ # Define model
+ langmuir_model = PhysChem(variable_inputs)
+
+ # Assign as experiment model
+ exp.model = langmuir_model
+
+ # Read data
+ exp.model.data = np.loadtxt('observations.csv', delimiter = ',', skiprows = 1)
+
+ if(len(exp.model.data.shape) < 2):
+ exp.model.data = np.expand_dims(exp.model.data, axis=0)
+
+ # Form tensors for variables and results in observations
+ var_grid_in = torch.tensor(exp.model.data[:,:2])
+ var_grid_out = torch.tensor(exp.model.data[:,2:])
+
+ # Define surrogate
+ if(exp.run_nofas):
+
+ # Create new discrepancy
+ exp.surrogate = Discrepancy(model_name = exp.name, 
+ model_folder = exp.output_dir, 
+ lf_model = exp.model.solve_t,
+ input_size = exp.model.var_in.size(1),
+ output_size = 1,
+ var_grid_in = var_grid_in,
+ var_grid_out = var_grid_out)
+ # Initially tune on the default values of the calibration variables
+ # exp.surrogate.update(langmuir_model.defParams, exp.surr_pre_it, 0.03, 0.9999, 100, store=True)
+ # exp.surrogate.update(langmuir_model.defParams, 1, 0.03, 0.9999, 100, store=True)
+ # Load the surrogate
+ # exp.surrogate.surrogate_loaCCd()
+ else:
+ exp.surrogate = None
+
+ # Define log density
+ def log_density(calib_inputs, model, surrogate, transform):
+
+ # Compute transformation by log Jacobian
+ adjust = transform.compute_log_jacob_func(calib_inputs)
+
+ # Initialize negative log likelihood
+ total_nll = torch.zeros((calib_inputs.size(0), 1))
+
+ # Initialize total number of variable inputs
+ total_var_inputs = len(model.var_in)
+
+ # Evaluate model response - (num_var x num_batch)
+ modelOut = langmuir_model.solve_t(transform.forward(calib_inputs)).t()
+
+ # Evaluate discrepancy
+ if (surrogate is None):
+ discrepancy = torch.zeros(modelOut.shape).t()
+ else:
+ # (num_var)
+ discrepancy = surrogate.forward(model.var_in)
+
+ # Get the absolute values of the standard deviation (num_var)
+ std_dev = torch.mean(langmuir_model.defOut) * langmuir_model.stdRatio
+
+ # Get data - (num_var x num_obs)
+ Data = torch.tensor(langmuir_model.data[:,2:]).to(exp.device)
+ num_obs = Data.size(1)
+
+ # Evaluate log-likelihood:
+ # Loop on the available observations
+ for loopA in range(num_obs):
+
+ # -n / 2 * log ( 2 pi ) 
+ l1 = -0.5 * np.prod(langmuir_model.data.shape[1]) * np.log(2.0 * np.pi)
+
+ # Ask about this likelihood
+ # - n / 2 * log (sigma^2)
+ l2 = (-0.5 * langmuir_model.data.shape[1] * torch.log(std_dev ** 2)).item()
+
+ # - 1 / (2 * sigma^2) sum_{i = 1} ^ N (eta_i + disc_i - y_i)^2 
+ l3 = -0.5 / (std_dev ** 2) * torch.sum((modelOut + discrepancy.t() - Data[:,loopA].unsqueeze(0))**2, dim = 1)
+
+ if(False):
+ print('Compare')
+ print('%15s %15s %15s %15s' % ('lf out','discrep','lf+discr','obs'))
+ for loopB in range(discrepancy.size(0)):
+ test1 = modelOut[0,:]
+ test2 = discrepancy[:,0]
+ test3 = Data[:,loopA]
+ print('%15.3f %15.3f %15.3f %15.3f' % (modelOut[0,loopB],discrepancy[loopB,0],modelOut[0,loopB]+discrepancy[loopB,0],Data[loopB,loopA]))
+ print('')
+
+ # Compute negative ll (num_batch x 1)
+ negLL = -(l1 + l2 + l3) # sum contributions
+ res = -negLL.reshape(calib_inputs.size(0), 1) # reshape
+
+ # Accumulate
+ total_nll += res
+
+ # Return log-likelihood
+ return total_nll/num_obs + adjust
+
+ # Assign log density model
+ exp.model_logdensity = lambda x: log_density(x, exp.model, exp.surrogate, exp.transform)
+
+ # Define log prior
+ # TODO: can we use a half-normal or truncated normal prior? How to enforce bounds?
+ def log_prior(calib_inputs, transform):
+ # Compute transformation log Jacobian
+ adjust = transform.compute_log_jacob_func(calib_inputs)
+ # Compute the calibration inputs in the physical domain
+ phys_inputs = transform.forward(calib_inputs)
+ # Define prior moments
+ pr_avg = torch.tensor([[1E3, -21E3, 0.0]])
+ pr_std = torch.tensor([[1E2, 500, ^2]])
+
+ # Eval log prior
+ l1 = -0.5 * calib_inputs.size(1) * np.log(2.0 * np.pi) 
+ l2 = (-0.5 * torch.log(torch.prod(pr_std))).item()
+ l3 = -0.5 * torch.sum(((phys_inputs - pr_avg)/pr_std)**2, dim = 1).unsqueeze(1)
+ # Return 
+ res = l1 + l2 + l3 + adjust
+ return res
+
+ exp.model_logprior = lambda x: log_prior(x, exp.transform)
+
+ # Run VI
+ exp.run()
+
+def generate_data(use_true_model=False,num_observations=50):
+
+ # Set variable grid
+ var_grid = [[350.0, 400.0, 450.0],
+ [1.0, 2.0, 3.0, 4.0, 5.0]]
+
+ # Create model
+ model = PhysChem(var_grid)
+
+ # Generate data
+ model.genDataFile(use_true_model = use_true_model, num_observations = num_observations)
+
+# Main code
+if __name__ == "__main__":
+
+ generate_data(use_true_model = False, num_observations = 1)
+
+ run_test()
+
+
+
diff --git a/run_plot_res.sh b/run_plot_res.sh
@@ -1,4 +1,4 @@
-python3 linfa/plot_res.py --folder results/ --name TP15_no_disc_gaussian --iter 10000 --picformat png
+python3 linfa/plot_res.py --folder results/ --name TP15_no_disc_error_estimation --iter 10000 --picformat png
 # python3 linfa/plot_disc.py --folder results/ --name test_08_lf_w_disc_TP1_uniform_prior --iter 25000 --picformat png --mode histograms --num_points 10 --limfactor 1.0 --saveinterval 1000 --dropouts 10
 # python3 linfa/plot_disc.py --folder results/ --name test_19_lf_w_disc_TP15_rep_meas_dropout --iter 10000 --picformat png --mode discr_surface --num_points 10 --limfactor 1.0 --saveinterval 1000
 # python3 linfa/plot_disc.py --folder results/ --name test_08_lf_w_disc_TP1_uniform_prior --iter 25000 --picformat png --mode marginal_stats --num_points 10 --limfactor 1.0 --saveinterval 1000