Exemplos de init_kernel_regularizer em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: uncertainty_baselines.models.variational_utils

Método / Função: init_kernel_regularizer

Exemplos em hotexamples.com: 2

init_kernel_regularizer em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de uncertainty_baselines.models.variational_utils.init_kernel_regularizer em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Exemplo n.º 1

0

Exibir arquivo

def bottleneck_block(inputs, filters, stage, block, strides, prior_stddev, dataset_size, stddev_mean_init, stddev_stddev_init, tied_mean_prior=True): """Residual block with 1x1 -> 3x3 -> 1x1 convs in main path. Note that strides appear in the second conv (3x3) rather than the first (1x1). This is also known as "ResNet v1.5" as it differs from He et al. (2015) (http://torch.ch/blog/2016/02/04/resnets.html). Args: inputs: tf.Tensor. filters: list of integers, the filters of 3 conv layer at main path stage: integer, current stage label, used for generating layer names block: 'a','b'..., current block label, used for generating layer names strides: Strides for the second conv layer in the block. prior_stddev: Fixed standard deviation for weight prior. dataset_size: Dataset size to properly scale the KL. stddev_mean_init: float, initializes the mean of the TruncatedNormal from which we sample the initial posterior stddev: mean = np.log(np.expm1(stddev_mean_init)) stddev_stddev_init: float, stddev of the TruncatedNormal distribution used to initialize the stddev of the variational posterior. tied_mean_prior: bool, if True, fix the mean of the prior to that of the variational posterior, which causes the KL to only penalize the weight posterior's standard deviation, and not its mean. Returns: tf.Tensor. """ filters1, filters2, filters3 = filters conv_name_base = 'res' + str(stage) + block + '_branch' bn_name_base = 'bn' + str(stage) + block + '_branch' kernel_regularizer_class = get_kernel_regularizer_class( tied_mean_prior=tied_mean_prior) # Initialize kernel with given fixed stddev for prior, or compute the # stddev as sqrt(2 / fan_in) (as is done for the stddev in He initialization). kernel_regularizer_2a = init_kernel_regularizer( kernel_regularizer_class, dataset_size, prior_stddev, inputs, n_filters=filters1, kernel_size=1) x = Conv2DFlipout( filters1, kernel_size=1, kernel_initializer=ed.initializers.TrainableHeNormal( stddev_initializer=tf.keras.initializers.TruncatedNormal( mean=np.log(np.expm1(stddev_mean_init)), stddev=stddev_stddev_init)), kernel_regularizer=kernel_regularizer_2a, name=conv_name_base + '2a')( inputs) x = BatchNormalization(name=bn_name_base + '2a')(x) x = tf.keras.layers.Activation('relu')(x) kernel_regularizer_2b = init_kernel_regularizer( kernel_regularizer_class, dataset_size, prior_stddev, x, n_filters=filters2, kernel_size=3) x = Conv2DFlipout( filters2, kernel_size=3, strides=strides, padding='same', kernel_initializer=ed.initializers.TrainableHeNormal( stddev_initializer=tf.keras.initializers.TruncatedNormal( mean=np.log(np.expm1(stddev_mean_init)), stddev=stddev_stddev_init)), kernel_regularizer=kernel_regularizer_2b, name=conv_name_base + '2b')( x) x = BatchNormalization(name=bn_name_base + '2b')(x) x = tf.keras.layers.Activation('relu')(x) kernel_regularizer_2c = init_kernel_regularizer( kernel_regularizer_class, dataset_size, prior_stddev, x, n_filters=filters3, kernel_size=1) x = Conv2DFlipout( filters3, kernel_size=1, kernel_initializer=ed.initializers.TrainableHeNormal( stddev_initializer=tf.keras.initializers.TruncatedNormal( mean=np.log(np.expm1(stddev_mean_init)), stddev=stddev_stddev_init)), kernel_regularizer=kernel_regularizer_2c, name=conv_name_base + '2c')( x) x = BatchNormalization(name=bn_name_base + '2c')(x) shortcut = inputs if not x.shape.is_compatible_with(shortcut.shape): kernel_regularizer_1 = init_kernel_regularizer( kernel_regularizer_class, dataset_size, prior_stddev, shortcut, n_filters=filters3, kernel_size=1) shortcut = Conv2DFlipout( filters3, kernel_size=1, strides=strides, kernel_initializer=ed.initializers.TrainableHeNormal( stddev_initializer=tf.keras.initializers.TruncatedNormal( mean=np.log(np.expm1(stddev_mean_init)), stddev=stddev_stddev_init)), kernel_regularizer=kernel_regularizer_1, name=conv_name_base + '1')( shortcut) shortcut = BatchNormalization(name=bn_name_base + '1')(shortcut) x = tf.keras.layers.add([x, shortcut]) x = tf.keras.layers.Activation('relu')(x) return x

Exemplo n.º 2

0

Exibir arquivo

def resnet50_variational(input_shape, num_classes, prior_stddev, dataset_size, stddev_mean_init, stddev_stddev_init, tied_mean_prior=True, omit_last_layer=False): """Builds variational inference ResNet50. Using strided conv, pooling, four groups of residual blocks, and pooling, the network maps spatial features of size 224x224 -> 112x112 -> 56x56 -> 28x28 -> 14x14 -> 7x7 (Table 1 of He et al. (2015)). Args: input_shape: Shape tuple of input excluding batch dimension. num_classes: Number of output classes. prior_stddev: Fixed standard deviation for weight prior. dataset_size: Dataset size to properly scale the KL. stddev_mean_init: float, initializes the mean of the TruncatedNormal from which we sample the initial posterior stddev: mean = np.log(np.expm1(stddev_mean_init)) stddev_stddev_init: float, stddev of the TruncatedNormal distribution used to initialize the stddev of the variational posterior. tied_mean_prior: bool, if True, fix the mean of the prior to that of the variational posterior, which causes the KL to only penalize the weight posterior's standard deviation, and not its mean. omit_last_layer: Optional. Omits the last pooling layer if it is to True. Returns: tf.keras.Model. """ kernel_regularizer_class = get_kernel_regularizer_class( tied_mean_prior=tied_mean_prior) inputs = tf.keras.layers.Input(shape=input_shape) x = tf.keras.layers.ZeroPadding2D(padding=3, name='conv1_pad')(inputs) # Initialize kernel with given fixed stddev for prior, or compute the # stddev as sqrt(2 / fan_in) (as is done for the stddev in He initialization). kernel_regularizer_conv1 = init_kernel_regularizer( kernel_regularizer_class, dataset_size, prior_stddev, x, n_filters=64, kernel_size=7) x = Conv2DFlipout( 64, kernel_size=7, strides=2, padding='valid', kernel_initializer=ed.initializers.TrainableHeNormal( stddev_initializer=tf.keras.initializers.TruncatedNormal( mean=np.log(np.expm1(stddev_mean_init)), stddev=stddev_stddev_init)), kernel_regularizer=kernel_regularizer_conv1, name='conv1')( x) x = BatchNormalization(name='bn_conv1')(x) x = tf.keras.layers.Activation('relu')(x) x = tf.keras.layers.MaxPooling2D(3, strides=2, padding='same')(x) x = group( x, [64, 64, 256], stage=2, num_blocks=3, strides=1, prior_stddev=prior_stddev, dataset_size=dataset_size, stddev_mean_init=stddev_mean_init, stddev_stddev_init=stddev_stddev_init) x = group( x, [128, 128, 512], stage=3, num_blocks=4, strides=2, prior_stddev=prior_stddev, dataset_size=dataset_size, stddev_mean_init=stddev_mean_init, stddev_stddev_init=stddev_stddev_init) x = group( x, [256, 256, 1024], stage=4, num_blocks=6, strides=2, prior_stddev=prior_stddev, dataset_size=dataset_size, stddev_mean_init=stddev_mean_init, stddev_stddev_init=stddev_stddev_init) x = group( x, [512, 512, 2048], stage=5, num_blocks=3, strides=2, prior_stddev=prior_stddev, dataset_size=dataset_size, stddev_mean_init=stddev_mean_init, stddev_stddev_init=stddev_stddev_init) if omit_last_layer: return tf.keras.Model(inputs=inputs, outputs=x, name='resnet50_variational') x = tf.keras.layers.GlobalAveragePooling2D(name='avg_pool')(x) kernel_regularizer_fc1000 = init_kernel_regularizer( kernel_regularizer_class, dataset_size, prior_stddev, x, n_outputs=num_classes) x = ed.layers.DenseFlipout( num_classes, activation=None, kernel_initializer=ed.initializers.TrainableHeNormal( stddev_initializer=tf.keras.initializers.TruncatedNormal( mean=np.log(np.expm1(stddev_mean_init)), stddev=stddev_stddev_init)), kernel_regularizer=kernel_regularizer_fc1000, name='fc1000')(x) return tf.keras.Model(inputs=inputs, outputs=x, name='resnet50_variational')