Using @SuperBuilder for LayerConfigurations

Signed-off-by: brian <brian@brutex.de>
2023-04-25 13:25:23 +02:00 · 2023-04-25 13:25:23 +02:00 · 55f8486fe3
commit 55f8486fe3
parent 9139940101
16 changed files with 257 additions and 196 deletions
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/AbstractLSTM.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/AbstractLSTM.java
@ -27,8 +27,7 @@ import org.nd4j.linalg.activations.IActivation;
 import org.nd4j.linalg.activations.impl.ActivationSigmoid;
 import org.nd4j.linalg.activations.impl.ActivationTanH;
-@Data
+
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder
@ -38,13 +37,13 @@ public abstract class AbstractLSTM extends BaseRecurrentLayer {
   * Set forget gate bias initalizations. Values in range 1-5 can potentially help with learning or
   * longer-term dependencies.
   */
-  @lombok.Builder.Default protected double forgetGateBiasInit = 1.0;
+  @lombok.Builder.Default @Getter protected double forgetGateBiasInit = 1.0;
  /**
   * When using CuDNN and an error is encountered, should fallback to the non-CuDNN implementatation
   * be allowed? If set to false, an exception in CuDNN will be propagated back to the user. If
   * false, the built-in (non-CuDNN) implementation for LSTM/GravesLSTM will be used
   */
-  @lombok.Builder.Default protected boolean helperAllowFallback = true;
+  @lombok.Builder.Default @Getter protected boolean helperAllowFallback = true;
  /**
   * Activation function for the LSTM gates. Note: This should be bounded to range 0-1: sigmoid or
   * hard sigmoid, for example
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/ActivationLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/ActivationLayer.java
@ -135,7 +135,7 @@ public class ActivationLayer extends NoParamLayer {
  public static abstract class ActivationLayerBuilder<
          C extends ActivationLayer, B extends ActivationLayerBuilder<C, B>>
-      extends NoParamLayerBuilder<C, B> {
+      extends NoParamLayer.NoParamLayerBuilder<C, B> {
    public C build() {
      C l = this.build();
      l.initializeConstraints();
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/AutoEncoder.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/AutoEncoder.java
@ -36,8 +36,7 @@ import org.nd4j.linalg.api.ndarray.INDArray;
 import java.util.Collection;
 import java.util.Map;
-@Data
+
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder
@ -47,13 +46,13 @@ public class AutoEncoder extends BasePretrainNetwork {
     * Level of corruption - 0.0 (none) to 1.0 (all values corrupted)
     *
     */
-    @lombok.Builder.Default
+    @lombok.Builder.Default @Getter @Setter
    private double corruptionLevel = 3e-1f;
    /**
     * Autoencoder sparity parameter
     *
     */
-    @lombok.Builder.Default
+    @lombok.Builder.Default @Getter @Setter
    protected double sparsity = 0f;
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/BaseLayerConfiguration.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/BaseLayerConfiguration.java
@ -45,9 +45,7 @@ import org.nd4j.linalg.learning.regularization.Regularization;
 import org.nd4j.linalg.learning.regularization.WeightDecay;
 /** A neural network layer. */
@Data
@EqualsAndHashCode(callSuper = true)
@NoArgsConstructor(force = true)
@SuperBuilder
 public abstract class BaseLayerConfiguration extends LayerConfiguration
    implements ITraininableLayerConfiguration, Serializable, Cloneable {
@ -62,7 +60,7 @@ public abstract class BaseLayerConfiguration extends LayerConfiguration
   *
   * @param constraints Constraints to apply to all bias parameters of all layers
   */
-  @lombok.Builder.Default protected final List<LayerConstraint> biasConstraints = new ArrayList<>();
+  @lombok.Builder.Default @Getter protected final List<LayerConstraint> biasConstraints = new ArrayList<>();
  /**
   * Set constraints to be applied to all layers. Default: no constraints.<br>
   * Constraints can be used to enforce certain conditions (non-negativity of parameters, max-norm
@ -74,27 +72,33 @@ public abstract class BaseLayerConfiguration extends LayerConfiguration
   *
   * @param constraints Constraints to apply to all weight parameters of all layers
   */
-  @lombok.Builder.Default
+  @lombok.Builder.Default @Getter
  protected final List<LayerConstraint> constrainWeights = new ArrayList<>();
  /** Weight initialization scheme to use, for initial weight values */
  @Getter @Setter
  protected IWeightInit weightInit;
  /** Bias initialization value, for layers with biases. Defaults to 0 */
  @Getter @Setter @Builder.Default
  protected double biasInit = 0.0;
  /** Gain initialization value, for layers with ILayer Normalization. Defaults to 1 */
  @Getter @Setter @Builder.Default
  protected double gainInit = 0.0;
  /** Regularization for the parameters (excluding biases). */
-  @Builder.Default protected List<Regularization> regularization = new ArrayList<>();
+  @Builder.Default @Getter protected List<Regularization> regularization = new ArrayList<>();
  /** Regularization for the bias parameters only */
-  @Builder.Default protected List<Regularization> regularizationBias = new ArrayList<>();
+  @Builder.Default @Getter
  protected List<Regularization> regularizationBias = new ArrayList<>();
  /**
   * Gradient updater. For example, {@link org.nd4j.linalg.learning.config.Adam} or {@link
   * org.nd4j.linalg.learning.config.Nesterovs}
   */
  @Getter @Setter
  protected IUpdater updater;
  /**
   * Gradient updater configuration, for the biases only. If not set, biases will use the updater as
   * set by {@link #setUpdater(IUpdater)}
   */
  @Getter @Setter
  protected IUpdater biasUpdater;
  /**
   * Gradient normalization strategy. Used to specify gradient renormalization, gradient clipping
@ -103,7 +107,7 @@ public abstract class BaseLayerConfiguration extends LayerConfiguration
   * @see GradientNormalization
   */
  @Builder.Default
-  protected @Getter GradientNormalization gradientNormalization =
+  protected @Getter @Setter GradientNormalization gradientNormalization =
      GradientNormalization.None; // Clipping, rescale based on l2 norm, etc
  /**
   * Threshold for gradient normalization, only used for GradientNormalization.ClipL2PerLayer,
@ -113,10 +117,10 @@ public abstract class BaseLayerConfiguration extends LayerConfiguration
   * L2 threshold for first two types of clipping, or absolute value threshold for last type of
   * clipping.
   */
-  @Builder.Default
+  @Builder.Default @Getter @Setter
  protected double gradientNormalizationThreshold =
      1.0; // Threshold for l2 and element-wise gradient clipping
-
+@Getter @Setter
  private DataType dataType;
  /**
@ -206,6 +210,7 @@ public abstract class BaseLayerConfiguration extends LayerConfiguration
          C extends BaseLayerConfiguration, B extends BaseLayerConfigurationBuilder<C, B>>
      extends LayerConfigurationBuilder<C, B> {
    /**
     * Set weight initialization scheme to random sampling via the specified distribution.
     * Equivalent to: {@code .weightInit(new WeightInitDistribution(distribution))}
@ -411,16 +416,5 @@ public abstract class BaseLayerConfiguration extends LayerConfiguration
      regularizationBias$set = true;
      return self();
    }
    public B updater(IUpdater updater) {
      this.updater = updater;
      return self();
    }
    public B updater(Updater updater) {
      this.updater = updater.getIUpdaterWithDefaultConfig();
      return self();
    }
  }
 }
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/BasePretrainNetwork.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/BasePretrainNetwork.java
@ -26,8 +26,6 @@ import lombok.experimental.SuperBuilder;
 import org.deeplearning4j.nn.params.PretrainParamInitializer;
 import org.nd4j.linalg.lossfunctions.LossFunctions;
@Data
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@JsonIgnoreProperties("pretrain")
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/BaseRecurrentLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/BaseRecurrentLayer.java
@ -30,8 +30,7 @@ import org.deeplearning4j.nn.conf.RNNFormat;
 import org.deeplearning4j.nn.conf.inputs.InputType;
 import org.deeplearning4j.nn.weights.IWeightInit;
-@Data
+
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder
@ -42,12 +41,13 @@ public abstract class BaseRecurrentLayer extends FeedForwardLayer {
     * weight initialization as the layer input weights is also used for the recurrent weights.
     *
     */
    @Getter
    protected IWeightInit weightInitRecurrent;
    /**
     * Set the format of data expected by the RNN. NCW = [miniBatchSize, size, timeSeriesLength],
     * NWC = [miniBatchSize, timeSeriesLength, size]. Defaults to NCW.
     */
-    @Builder.Default
+    @Builder.Default @Getter @Setter
    protected RNNFormat dataFormat = RNNFormat.NCW;
    /**
     * Set constraints to be applied to the RNN recurrent weight parameters of this layer. Default: no
@ -55,6 +55,7 @@ public abstract class BaseRecurrentLayer extends FeedForwardLayer {
     * max-norm regularization, etc). These constraints are applied at each iteration, after the parameters have
     * been updated.
     */
    @Getter
    protected List<LayerConstraint> recurrentConstraints;
    /**
     * Set constraints to be applied to the RNN input weight parameters of this layer. Default: no constraints.<br>
@ -62,6 +63,7 @@ public abstract class BaseRecurrentLayer extends FeedForwardLayer {
     * etc). These constraints are applied at each iteration, after the parameters have been updated.
     *
     */
    @Getter
    protected List<LayerConstraint> inputWeightConstraints;
    @Override
@ -125,6 +127,4 @@ public abstract class BaseRecurrentLayer extends FeedForwardLayer {
            return self();
        }
    }
 }
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/CapsuleLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/CapsuleLayer.java
@ -39,7 +39,6 @@ import org.nd4j.linalg.api.ndarray.INDArray;
 import org.nd4j.linalg.factory.Nd4j;
@Data
@NoArgsConstructor
@EqualsAndHashCode(callSuper = true)
@SuperBuilder(buildMethodName = "initBuild", builderMethodName = "innerBuilder")
 public class CapsuleLayer extends SameDiffLayer {
@ -78,11 +77,6 @@ public class CapsuleLayer extends SameDiffLayer {
     * @return
     */
    @Builder.Default private int routings = 3;
    public CapsuleLayer(Builder builder){
    }
    @Override
    public void setNIn(InputType inputType, boolean override) {
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/ConvolutionLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/ConvolutionLayer.java
@ -41,16 +41,14 @@ import org.deeplearning4j.util.ValidationUtils;
 import org.nd4j.linalg.api.buffer.DataType;
 import org.nd4j.linalg.api.ndarray.INDArray;
@Data
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder(buildMethodName = "initBuild", builderMethodName = "innerBuilder")
 /**
 * ConvolutionLayer nIn in the input layer is the number of channels nOut is the number of filters
 * to be used in the net or in other words the channels The builder specifies the filter/kernel
 * size, the stride and padding The pooling layer takes the kernel size
 */
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder(buildMethodName = "initBuild", builderMethodName = "innerBuilder")
 public class ConvolutionLayer extends FeedForwardLayer {
  /**
   * Size of the convolution rows/columns
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/DenseLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/DenseLayer.java
@ -38,8 +38,7 @@ import org.nd4j.linalg.api.buffer.DataType;
 import org.nd4j.linalg.api.ndarray.INDArray;
 /** Dense Layer Uses WeightInitXavier as default */
-@Data
+
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder(
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/FeedForwardLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/FeedForwardLayer.java
@ -20,10 +20,7 @@
 package org.deeplearning4j.nn.conf.layers;
-import lombok.Data;
+import lombok.*;
 import lombok.EqualsAndHashCode;
 import lombok.NoArgsConstructor;
 import lombok.ToString;
 import lombok.experimental.SuperBuilder;
 import net.brutex.ai.dnn.api.LayerType;
 import org.deeplearning4j.nn.conf.DataFormat;
@ -33,30 +30,29 @@ import org.deeplearning4j.nn.conf.preprocessor.Cnn3DToFeedForwardPreProcessor;
 import org.deeplearning4j.nn.conf.preprocessor.CnnToFeedForwardPreProcessor;
 import org.deeplearning4j.nn.conf.preprocessor.RnnToFeedForwardPreProcessor;
@Data
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder
 public abstract class FeedForwardLayer extends BaseLayerConfiguration {
    /**
     * Number of inputs for the layer (usually the size of the last layer). <br> Note that for Convolutional layers,
     * this is the input channels, otherwise is the previous layer size.
     *
     */
    @Getter
    protected long nIn;
    /**
     * Number of inputs for the layer (usually the size of the last layer). <br> Note that for Convolutional layers,
     * this is the input channels, otherwise is the previous layer size.
     *
     */
    @Getter
    protected long nOut;
    protected DataFormat timeDistributedFormat;
-    { //Initializer block
+//
-        setType(LayerType.FC);
+  //  { //Initializer block
-    }
+      // setType(LayerType.FC);
    //}
    @Override
    public InputType getOutputType(int layerIndex, InputType inputType) {
@ -129,4 +125,5 @@ public abstract class FeedForwardLayer extends BaseLayerConfiguration {
    public boolean isPretrainParam(String paramName) {
        return false; //No pretrain params in standard FF layers
    }
 }
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/GravesLSTM.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/GravesLSTM.java
@ -20,6 +20,10 @@
 package org.deeplearning4j.nn.conf.layers;
 import java.util.ArrayList;
 import java.util.Collection;
 import java.util.Collections;
 import java.util.Map;
 import lombok.*;
 import lombok.experimental.SuperBuilder;
 import org.deeplearning4j.nn.api.Layer;
@ -36,77 +40,74 @@ import org.nd4j.linalg.activations.impl.ActivationSigmoid;
 import org.nd4j.linalg.api.buffer.DataType;
 import org.nd4j.linalg.api.ndarray.INDArray;
 import java.util.ArrayList;
 import java.util.Collection;
 import java.util.Collections;
 import java.util.Map;
@Deprecated
@Data
@NoArgsConstructor
@ToString(callSuper = true)
@EqualsAndHashCode(callSuper = true)
@SuperBuilder(buildMethodName = "initBuild")
 public class GravesLSTM extends AbstractLSTM {
-    public static abstract class GravesLSTMBuilder<C extends GravesLSTM, B extends GravesLSTMBuilder<C, B>> extends AbstractLSTMBuilder<C, B> {
+  private double forgetGateBiasInit;
-        public C build() {
+  @Builder.Default @Getter private IActivation gateActivationFunction = new ActivationSigmoid();
-            C l = initBuild();
+
-            l.initializeConstraints();
+  @Override
-            return l;
+  protected void initializeConstraints() {
-        }
+    super.initializeConstraints();
    if (getRecurrentConstraints() != null) {
      if (constraints == null) {
        constraints = new ArrayList<>();
      }
      for (LayerConstraint c : getRecurrentConstraints()) {
        LayerConstraint c2 = c.clone();
        c2.setParams(Collections.singleton(GravesLSTMParamInitializer.RECURRENT_WEIGHT_KEY));
        constraints.add(c2);
      }
    }
-    private double forgetGateBiasInit;
+  }
    @Builder.Default
    private IActivation gateActivationFunction = new ActivationSigmoid();
  @Override
  public Layer instantiate(
      NeuralNetConfiguration conf,
      Collection<TrainingListener> trainingListeners,
      int layerIndex,
      INDArray layerParamsView,
      boolean initializeParams,
      DataType networkDataType) {
    LayerValidation.assertNInNOutSet("GravesLSTM", getName(), layerIndex, getNIn(), getNOut());
-    @Override
+    LayerConfiguration lconf = conf.getFlattenedLayerConfigurations().get(layerIndex);
-    protected void initializeConstraints( ) {
+    lconf.setNetConfiguration(conf);
-        super.initializeConstraints();
+    runInheritance();
-        if (getRecurrentConstraints() != null) {
+
-            if (constraints == null) {
+    org.deeplearning4j.nn.layers.recurrent.GravesLSTM ret =
-                constraints = new ArrayList<>();
+        new org.deeplearning4j.nn.layers.recurrent.GravesLSTM(lconf, networkDataType);
-            }
+
-            for (LayerConstraint c : getRecurrentConstraints()) {
+    ret.addTrainingListeners(trainingListeners);
-                LayerConstraint c2 = c.clone();
+    ret.setIndex(layerIndex);
-                c2.setParams(Collections.singleton(GravesLSTMParamInitializer.RECURRENT_WEIGHT_KEY));
+    ret.setParamsViewArray(layerParamsView);
-                constraints.add(c2);
+    Map<String, INDArray> paramTable = initializer().init(this, layerParamsView, initializeParams);
-            }
+    ret.setParamTable(paramTable);
-        }
+    ret.setLayerConfiguration(lconf);
    return ret;
  }
  @Override
  public ParamInitializer initializer() {
    return GravesLSTMParamInitializer.getInstance();
  }
  @Override
  public LayerMemoryReport getMemoryReport(InputType inputType) {
    // TODO - CuDNN etc
    return LSTMHelpers.getMemoryReport(this, inputType);
  }
  public abstract static class GravesLSTMBuilder<
          C extends GravesLSTM, B extends GravesLSTMBuilder<C, B>>
      extends AbstractLSTMBuilder<C, B> {
    public C build() {
      C l = initBuild();
      l.initializeConstraints();
      return l;
    }
-
+  }
    @Override
    public Layer instantiate(NeuralNetConfiguration conf, Collection<TrainingListener> trainingListeners,
                             int layerIndex, INDArray layerParamsView, boolean initializeParams, DataType networkDataType) {
        LayerValidation.assertNInNOutSet("GravesLSTM", getName(), layerIndex, getNIn(), getNOut());
        LayerConfiguration lconf = conf.getFlattenedLayerConfigurations().get(layerIndex);
        lconf.setNetConfiguration(conf);
        runInheritance();
        org.deeplearning4j.nn.layers.recurrent.GravesLSTM ret =
                        new org.deeplearning4j.nn.layers.recurrent.GravesLSTM(lconf, networkDataType);
        ret.addTrainingListeners(trainingListeners);
        ret.setIndex(layerIndex);
        ret.setParamsViewArray(layerParamsView);
        Map<String, INDArray> paramTable = initializer().init(this, layerParamsView, initializeParams);
        ret.setParamTable(paramTable);
        ret.setLayerConfiguration(lconf);
        return ret;
    }
    @Override
    public ParamInitializer initializer() {
        return GravesLSTMParamInitializer.getInstance();
    }
    @Override
    public LayerMemoryReport getMemoryReport(InputType inputType) {
        //TODO - CuDNN etc
        return LSTMHelpers.getMemoryReport(this, inputType);
    }
 }
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/LayerConfiguration.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/LayerConfiguration.java
@ -42,7 +42,6 @@ import org.deeplearning4j.nn.conf.weightnoise.IWeightNoise;
 import org.deeplearning4j.optimize.api.TrainingListener;
 import org.nd4j.linalg.activations.Activation;
 import org.nd4j.linalg.activations.IActivation;
 import org.nd4j.linalg.activations.impl.ActivationIdentity;
 import org.nd4j.linalg.api.buffer.DataType;
 import org.nd4j.linalg.api.ndarray.INDArray;
 import org.nd4j.linalg.learning.config.IUpdater;
@ -50,8 +49,6 @@ import org.nd4j.linalg.learning.regularization.Regularization;
 /** A neural network layer. */
@JsonTypeInfo(use = JsonTypeInfo.Id.CLASS, include = JsonTypeInfo.As.PROPERTY, property = "@class")
@Data
@NoArgsConstructor
@EqualsAndHashCode
 // @JsonIdentityInfo(generator= ObjectIdGenerators.IntSequenceGenerator.class, property="@id")
@Slf4j
@ -59,18 +56,16 @@ import org.nd4j.linalg.learning.regularization.Regularization;
 public abstract class LayerConfiguration
    implements ILayerConfiguration, Serializable, Cloneable { // ITrainableLayerConfiguration
-  protected String name;
+  @Getter @Setter protected String name;
-    protected List<LayerConstraint> allParamConstraints;
+  @Getter protected List<LayerConstraint> allParamConstraints;
-    protected List<LayerConstraint> weightConstraints;
+  @Getter protected List<LayerConstraint> weightConstraints;
-    protected List<LayerConstraint> biasConstraints;
+  @Getter protected List<LayerConstraint> biasConstraints;
-  protected List<LayerConstraint> constraints;
+  @Getter protected List<LayerConstraint> constraints;
-  protected IWeightNoise weightNoise;
+  @Getter @Setter protected IWeightNoise weightNoise;
-  @Builder.Default
+  @Builder.Default private @Getter @Setter LinkedHashSet<String> variables = new LinkedHashSet<>();
-  private @Getter @Setter LinkedHashSet<String> variables = new LinkedHashSet<>();
+  @Getter @Setter private IDropout dropOut;
  private IDropout dropOut;
  /** The type of the layer, basically defines the base class and its properties */
-  @Builder.Default
+  @Builder.Default @Getter @Setter @NonNull private LayerType type = LayerType.UNKNOWN;
  @Getter @Setter @NonNull private LayerType type = LayerType.UNKNOWN;
  /**
   * A reference to the neural net configuration. This field is excluded from json serialization as
   * well as from equals check to avoid circular referenced.
@ -87,10 +82,9 @@ public abstract class LayerConfiguration
   * From an Activation, we can derive the IActivation (function) using {@link
   * Activation#getActivationFunction()} but not vice versa. The default is Identity Activation.
   */
-  @Builder.Default
+  @Builder.Default @Getter @Setter private IActivation activation = Activation.IDENTITY;
  @Getter @Setter private IActivation activation = Activation.IDENTITY;
-    /**
+  /**
   * Get the activation interface (function) from the activation. The activation must have been set
   * prior to this call.
   *
@ -293,9 +287,7 @@ public abstract class LayerConfiguration
  public void setIUpdater(IUpdater iUpdater) {
    log.warn(
-        "Setting an IUpdater on {} with name {} has no effect.",
+        "Setting an IUpdater on {} with name {} has no effect.", getClass().getSimpleName(), name);
        getClass().getSimpleName(),
        getName());
  }
  /**
@ -333,12 +325,29 @@ public abstract class LayerConfiguration
    runInheritance(getNetConfiguration());
  }
-  public static abstract class LayerConfigurationBuilder<C extends LayerConfiguration, B extends LayerConfigurationBuilder<C, B>>  {
+  public abstract static class LayerConfigurationBuilder<
      C extends LayerConfiguration, B extends LayerConfigurationBuilder<C, B>> {
    private String name;
    private List<LayerConstraint> allParamConstraints;
    private List<LayerConstraint> weightConstraints;
    private List<LayerConstraint> biasConstraints;
    private List<LayerConstraint> constraints;
    private IWeightNoise weightNoise;
    private LinkedHashSet<String> variables$value;
    private boolean variables$set;
    private IDropout dropOut;
    private @NonNull LayerType type$value;
    private boolean type$set;
    private NeuralNetConfiguration netConfiguration;
    private IActivation activation$value;
    private boolean activation$set;
    public B activation(Activation activation) {
      this.activation$value = activation;
      this.activation$set = true;
      return self();
    }
    public B activation(IActivation activation) {
      this.activation$value = activation;
      this.activation$set = true;
@ -349,6 +358,7 @@ public abstract class LayerConfiguration
      this.dropOut = new Dropout(d);
      return self();
    }
    public B dropOut(IDropout d) {
      this.dropOut = d;
      return self();
@ -361,6 +371,95 @@ public abstract class LayerConfiguration
    public B constrainWeights(LayerConstraint constraint) {
      return this.weightConstraints(List.of(constraint));
    }
  }
    public B name(String name) {
      this.name = name;
      return self();
    }
    public B allParamConstraints(List<LayerConstraint> allParamConstraints) {
      this.allParamConstraints = allParamConstraints;
      return self();
    }
    public B weightConstraints(List<LayerConstraint> weightConstraints) {
      this.weightConstraints = weightConstraints;
      return self();
    }
    public B biasConstraints(List<LayerConstraint> biasConstraints) {
      this.biasConstraints = biasConstraints;
      return self();
    }
    public B constraints(List<LayerConstraint> constraints) {
      this.constraints = constraints;
      return self();
    }
    public B weightNoise(IWeightNoise weightNoise) {
      this.weightNoise = weightNoise;
      return self();
    }
    public B variables(LinkedHashSet<String> variables) {
      this.variables$value = variables;
      this.variables$set = true;
      return self();
    }
    public B type(@NonNull LayerType type) {
      this.type$value = type;
      this.type$set = true;
      return self();
    }
    @JsonIgnore
    public B netConfiguration(NeuralNetConfiguration netConfiguration) {
      this.netConfiguration = netConfiguration;
      return self();
    }
    protected abstract B self();
    public abstract C build();
    public String toString() {
      return "LayerConfiguration.LayerConfigurationBuilder(name="
          + this.name
          + ", allParamConstraints="
          + this.allParamConstraints
          + ", weightConstraints="
          + this.weightConstraints
          + ", biasConstraints="
          + this.biasConstraints
          + ", constraints="
          + this.constraints
          + ", weightNoise="
          + this.weightNoise
          + ", variables$value="
          + this.variables$value
          + ", variables$set="
          + this.variables$set
          + ", dropOut="
          + this.dropOut
          + ", type$value="
          + this.type$value
          + ", type$set="
          + this.type$set
          + ", netConfiguration="
          + this.netConfiguration
          + ", activation$value="
          + this.activation$value
          + ", activation$set="
          + this.activation$set
          + ", variables$value="
          + this.variables$value
          + ", type$value="
          + this.type$value
          + ", activation$value="
          + this.activation$value
          + ")";
    }
  }
 }
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/NoParamLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/NoParamLayer.java
@ -21,7 +21,6 @@
 package org.deeplearning4j.nn.conf.layers;
 import java.util.List;
 import lombok.NoArgsConstructor;
 import lombok.experimental.SuperBuilder;
 import net.brutex.ai.dnn.api.LayerType;
 import org.deeplearning4j.nn.api.ParamInitializer;
@ -31,10 +30,8 @@ import org.deeplearning4j.nn.params.EmptyParamInitializer;
 import org.nd4j.linalg.learning.config.IUpdater;
 import org.nd4j.linalg.learning.regularization.Regularization;
@NoArgsConstructor
@SuperBuilder
 public abstract class NoParamLayer extends LayerConfiguration {
  {
    setType(LayerType.POOL);
  }
@ -68,4 +65,8 @@ public abstract class NoParamLayer extends LayerConfiguration {
  public IUpdater getIUpdater() {
    return Updater.NONE.getIUpdaterWithDefaultConfig();
  }
  public static abstract class NoParamLayerBuilder<C extends NoParamLayer, B extends NoParamLayerBuilder<C,B>>
    extends LayerConfigurationBuilder<C,B>
  {}
 }
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/samediff/AbstractSameDiffLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/samediff/AbstractSameDiffLayer.java
@ -48,10 +48,8 @@ import org.nd4j.linalg.learning.regularization.Regularization;
 import org.nd4j.linalg.learning.regularization.WeightDecay;
@Slf4j
@Data
@EqualsAndHashCode(callSuper = true, doNotUseGetters = true)
@SuperBuilder
@NoArgsConstructor
 public abstract class AbstractSameDiffLayer extends LayerConfiguration {
  /**
@ -245,9 +243,10 @@ public abstract class AbstractSameDiffLayer extends LayerConfiguration {
    }
  }
-  public static abstract class AbstractSameDiffLayerBuilder<
+  public abstract static class AbstractSameDiffLayerBuilder<
          C extends AbstractSameDiffLayer, B extends AbstractSameDiffLayerBuilder<C, B>>
      extends LayerConfigurationBuilder<C, B> {
    /**
     * L1 regularization coefficient (weights only). Use {@link #l1Bias(double)} to configure the l1
     * regularization coefficient for the bias.
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/samediff/SameDiffLayer.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/samediff/SameDiffLayer.java
@ -20,7 +20,7 @@
 package org.deeplearning4j.nn.conf.layers.samediff;
-import lombok.*;
+import lombok.EqualsAndHashCode;
 import lombok.experimental.SuperBuilder;
 import org.deeplearning4j.nn.api.Layer;
 import org.deeplearning4j.nn.api.MaskState;
@ -31,15 +31,15 @@ import org.deeplearning4j.nn.weights.WeightInit;
 import org.deeplearning4j.optimize.api.TrainingListener;
 import org.nd4j.autodiff.samediff.SDVariable;
 import org.nd4j.autodiff.samediff.SameDiff;
 import org.nd4j.common.primitives.Pair;
 import org.nd4j.linalg.api.buffer.DataType;
 import org.nd4j.linalg.api.ndarray.INDArray;
 import org.nd4j.common.primitives.Pair;
 import java.util.Collection;
 import java.util.HashMap;
 import java.util.Map;
-@Data
+
@EqualsAndHashCode(callSuper = true)
@SuperBuilder
 public abstract class SameDiffLayer extends AbstractSameDiffLayer {
@ -47,14 +47,9 @@ public abstract class SameDiffLayer extends AbstractSameDiffLayer {
    /**
     * WeightInit, default is XAVIER.
     */
    @Builder.Default
    protected WeightInit weightInit = WeightInit.XAVIER;
    @Builder.Default
    protected Map<String,IWeightInit> paramWeightInit = new HashMap<>();
    protected SameDiffLayer() {
        //No op constructor for Jackson
    }
    /**
     * Define the layer
@ -100,6 +95,7 @@ public abstract class SameDiffLayer extends AbstractSameDiffLayer {
        return ret;
    }
    public static abstract class SameDiffLayerBuilder<C extends SameDiffLayer, B extends SameDiffLayerBuilder<C, B>> extends AbstractSameDiffLayerBuilder<C,B> {
-
+    }
 }
--- a/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/wrapper/BaseWrapperLayerConfiguration.java
+++ b/cavis-dnn/cavis-dnn-nn/src/main/java/org/deeplearning4j/nn/conf/layers/wrapper/BaseWrapperLayerConfiguration.java
@ -21,8 +21,8 @@
 package org.deeplearning4j.nn.conf.layers.wrapper;
 import java.util.List;
 import lombok.Data;
 import lombok.EqualsAndHashCode;
 import lombok.Getter;
 import lombok.experimental.SuperBuilder;
 import org.deeplearning4j.nn.api.ParamInitializer;
 import org.deeplearning4j.nn.conf.InputPreProcessor;
@ -37,24 +37,12 @@ import org.nd4j.linalg.activations.IActivation;
 import org.nd4j.linalg.learning.config.IUpdater;
 import org.nd4j.linalg.learning.regularization.Regularization;
@Data
@EqualsAndHashCode(callSuper = false)
-@SuperBuilder
+@SuperBuilder(builderMethodName = "innerBuilder")
 public abstract class BaseWrapperLayerConfiguration extends LayerConfiguration {
-    /**
+  /** The configuration to of another layer to wrap */
-     * The configuration to of another layer to wrap
+  @Getter protected LayerConfiguration underlying;
     */
  protected LayerConfiguration underlying;
  protected BaseWrapperLayerConfiguration() {
  }
  public BaseWrapperLayerConfiguration(LayerConfiguration underlying) {
    this.underlying = underlying;
    this.setNetConfiguration(underlying.getNetConfiguration());
  }
  /**
   * Set the net configuration for this configuration as well as for the underlying layer (if not
@ -66,8 +54,8 @@ public abstract class BaseWrapperLayerConfiguration extends LayerConfiguration {
  public void setNetConfiguration(NeuralNetConfiguration netConfiguration) {
    super.setNetConfiguration(netConfiguration);
    if (underlying.getNetConfiguration() == null) {
-        underlying.setNetConfiguration(
+      underlying.setNetConfiguration(
-          netConfiguration); //also set netconf for underlying if not set
+          netConfiguration); // also set netconf for underlying if not set
    }
  }
@ -87,14 +75,6 @@ public abstract class BaseWrapperLayerConfiguration extends LayerConfiguration {
    return underlying.getDropOut();
  }
  /**
   * @param activationFn
   */
  @Override
  public void setActivation(IActivation activationFn) {
    underlying.setActivation(activationFn);
  }
  /**
   * @param iDropout
   */
@ -103,6 +83,14 @@ public abstract class BaseWrapperLayerConfiguration extends LayerConfiguration {
    underlying.setDropOut(iDropout);
  }
  /**
   * @param activationFn
   */
  @Override
  public void setActivation(IActivation activationFn) {
    underlying.setActivation(activationFn);
  }
  /**
   * @param weightNoise
   */
@ -131,14 +119,6 @@ public abstract class BaseWrapperLayerConfiguration extends LayerConfiguration {
    return underlying.getUpdaterByParam(paramName);
  }
  /**
   * @param iUpdater
   */
  @Override
  public void setIUpdater(IUpdater iUpdater) {
    underlying.setIUpdater(iUpdater);
  }
  /**
   * @return
   */
@ -147,6 +127,14 @@ public abstract class BaseWrapperLayerConfiguration extends LayerConfiguration {
    return underlying.getIUpdater();
  }
  /**
   * @param iUpdater
   */
  @Override
  public void setIUpdater(IUpdater iUpdater) {
    underlying.setIUpdater(iUpdater);
  }
  @Override
  public ParamInitializer initializer() {
    return WrapperLayerParamInitializer.getInstance();
@ -186,9 +174,8 @@ public abstract class BaseWrapperLayerConfiguration extends LayerConfiguration {
  public void setName(String layerName) {
    super.setName(layerName);
    if (underlying != null) {
-      //May be null at some points during JSON deserialization
+      // May be null at some points during JSON deserialization
      underlying.setName(layerName);
    }
  }
 }