Python Input Examples, keras.engine.Input Python Examples

Example #1

0

Show file

File: test_topology.py Project: trey-basa/keras-master

def test_load_layers():
    from keras.layers import ConvLSTM2D, TimeDistributed
    from keras.layers import Bidirectional, Conv2D, Input
    from keras.models import Model

    if K.backend() == 'tensorflow' or K.backend() == 'cntk':
        inputs = Input(shape=(10, 20, 20, 1))
    else:
        inputs = Input(shape=(10, 1, 20, 20))
    td_conv = TimeDistributed(Conv2D(15, (5, 5)))(inputs)
    bi_conv = Bidirectional(ConvLSTM2D(10, (3, 3)),
                            merge_mode='concat')(td_conv)
    model = Model(inputs=inputs, outputs=bi_conv)

    weight_value_tuples = []

    # TimeDistributed Conv2D layer
    # use 'channels_first' data format to check that
    # the function is being called correctly for Conv2D
    # old: (filters, stack_size, kernel_rows, kernel_cols)
    # new: (kernel_rows, kernel_cols, stack_size, filters)
    weight_tensor_td_conv_old = list()
    weight_tensor_td_conv_old.append(np.zeros((15, 1, 5, 5)))
    weight_tensor_td_conv_old.append(np.zeros((15, )))
    td_conv_layer = model.layers[1]
    td_conv_layer.layer.data_format = 'channels_first'
    weight_tensor_td_conv_new = saving.preprocess_weights_for_loading(
        td_conv_layer, weight_tensor_td_conv_old, original_keras_version='1')
    symbolic_weights = td_conv_layer.weights
    assert (len(symbolic_weights) == len(weight_tensor_td_conv_new))
    weight_value_tuples += zip(symbolic_weights, weight_tensor_td_conv_new)

    # Bidirectional ConvLSTM2D layer
    # old ConvLSTM2D took a list of 12 weight tensors,
    # returns a list of 3 concatenated larger tensors.
    weights_bi_conv_old = []
    for j in range(2):  # bidirectional
        for i in range(4):
            weights_bi_conv_old.append(np.zeros((3, 3, 15, 10)))  # kernel
            weights_bi_conv_old.append(np.zeros(
                (3, 3, 10, 10)))  # recurrent kernel
            weights_bi_conv_old.append(np.zeros((10, )))  # bias

    bi_convlstm_layer = model.layers[2]
    weights_bi_conv_new = saving.preprocess_weights_for_loading(
        bi_convlstm_layer, weights_bi_conv_old, original_keras_version='1')

    symbolic_weights = bi_convlstm_layer.weights
    assert (len(symbolic_weights) == len(weights_bi_conv_new))
    weight_value_tuples += zip(symbolic_weights, weights_bi_conv_new)

    K.batch_set_value(weight_value_tuples)

    assert np.all(
        K.eval(model.layers[1].weights[0]) == weight_tensor_td_conv_new[0])
    assert np.all(
        K.eval(model.layers[1].weights[1]) == weight_tensor_td_conv_new[1])
    assert np.all(K.eval(model.layers[2].weights[0]) == weights_bi_conv_new[0])
    assert np.all(K.eval(model.layers[2].weights[1]) == weights_bi_conv_new[1])
    assert np.all(K.eval(model.layers[2].weights[2]) == weights_bi_conv_new[2])
    assert np.all(K.eval(model.layers[2].weights[3]) == weights_bi_conv_new[3])
    assert np.all(K.eval(model.layers[2].weights[4]) == weights_bi_conv_new[4])
    assert np.all(K.eval(model.layers[2].weights[5]) == weights_bi_conv_new[5])

Example #2

0

Show file

def create_model(desired_sample_rate, dilation_depth, nb_stacks):

    # desired_sample_rate = 4410
    nb_output_bins = 4
    # nb_filters = 256
    nb_filters = 64
    # dilation_depth = 9  #
    # nb_stacks = 1
    use_bias = False
    res_l2 = 0
    final_l2 = 0
    fragment_length = 488 + compute_receptive_field_(
        desired_sample_rate, dilation_depth, nb_stacks)[0]
    fragment_stride = 488
    use_skip_connections = True
    learn_all_outputs = True

    def residual_block(x):
        original_x = x
        # TODO: initalization, regularization?
        # Note: The AtrousConvolution1D with the 'causal' flag is implemented in github.com/basveeling/keras#@wavenet.
        tanh_out = CausalAtrousConvolution1D(nb_filters,
                                             2,
                                             atrous_rate=2**i,
                                             border_mode='valid',
                                             causal=True,
                                             bias=use_bias,
                                             name='dilated_conv_%d_tanh_s%d' %
                                             (2**i, s),
                                             activation='tanh',
                                             W_regularizer=l2(res_l2))(x)
        x = layers.Dropout(0.2)(x)
        sigm_out = CausalAtrousConvolution1D(nb_filters,
                                             2,
                                             atrous_rate=2**i,
                                             border_mode='valid',
                                             causal=True,
                                             bias=use_bias,
                                             name='dilated_conv_%d_sigm_s%d' %
                                             (2**i, s),
                                             activation='sigmoid',
                                             W_regularizer=l2(res_l2))(x)
        x = layers.Merge(mode='mul', name='gated_activation_%d_s%d' %
                         (i, s))([tanh_out, sigm_out])

        res_x = layers.Convolution1D(nb_filters,
                                     1,
                                     border_mode='same',
                                     bias=use_bias,
                                     W_regularizer=l2(res_l2))(x)
        skip_x = layers.Convolution1D(nb_filters,
                                      1,
                                      border_mode='same',
                                      bias=use_bias,
                                      W_regularizer=l2(res_l2))(x)
        res_x = layers.Merge(mode='sum')([original_x, res_x])
        return res_x, skip_x

    input = Input(shape=(fragment_length, nb_output_bins), name='input_part')
    out = input
    skip_connections = []
    out = CausalAtrousConvolution1D(nb_filters,
                                    2,
                                    atrous_rate=1,
                                    border_mode='valid',
                                    causal=True,
                                    name='initial_causal_conv')(out)
    for s in range(nb_stacks):
        for i in range(0, dilation_depth + 1):
            out, skip_out = residual_block(out)
            skip_connections.append(skip_out)

    if use_skip_connections:
        out = layers.Merge(mode='sum')(skip_connections)
    out = layers.PReLU()(out)
    # out = layers.Convolution1D(nb_filter=256, filter_length=1, border_mode='same',
    #                            W_regularizer=l2(final_l2))(out)
    out = layers.Convolution1D(nb_filter=nb_output_bins,
                               filter_length=3,
                               border_mode='same')(out)
    out = layers.Dropout(0.5)(out)
    out = layers.PReLU()(out)
    out = layers.Convolution1D(nb_filter=nb_output_bins,
                               filter_length=3,
                               border_mode='same')(out)

    if not learn_all_outputs:
        raise DeprecationWarning(
            'Learning on just all outputs is wasteful, now learning only inside receptive field.'
        )
        out = layers.Lambda(
            lambda x: x[:, -1, :], output_shape=(out._keras_shape[-1], ))(
                out)  # Based on gif in deepmind blog: take last output?

    # out = layers.Activation('softmax', name="output_softmax")(out)
    out = layers.PReLU()(out)
    # out = layers.Activation('sigmoid', name="output_sigmoid")(out)
    out = layers.Flatten()(out)
    predictions = layers.Dense(919, activation='sigmoid', name='fc1')(out)
    model = Model(input, predictions)
    # x = model.output
    # x = layers.Flatten()(x)
    # # x = layers.Dense(output_dim=1024)(x)
    # # x = layers.PReLU()(x)
    # # x = layers.Dropout(0.5)(x)
    # # x = layers.Dense(output_dim=919)(x)
    # # x = layers.Activation('sigmoid')(x)
    # model = Model(input=model.input, output=predictions)

    receptive_field, receptive_field_ms = compute_receptive_field_(
        desired_sample_rate, dilation_depth, nb_stacks)

    _log.info('Receptive Field: %d (%dms)' %
              (receptive_field, int(receptive_field_ms)))
    return model

Example #3

0

Show file

File: model.py Project: samyumobi/food_analysis

    def InceptionResNetV2_Multitask(self, params):

        assert len(
            params['INPUTS'].keys()) == 1, 'Number of inputs must be one.'
        assert params['INPUTS'][params['INPUTS'].keys(
        )[0]]['type'] == 'raw-image', 'Input must be of type "raw-image".'

        self.ids_inputs = params['INPUTS'].keys()
        self.ids_outputs = params['OUTPUTS'].keys()

        input_shape = params['INPUTS'][params['INPUTS'].keys()
                                       [0]]['img_size_crop']
        image = Input(name=self.ids_inputs[0], shape=input_shape)

        ##################################################
        # Load Inception model pre-trained on ImageNet
        self.model = InceptionResNetV2(weights='imagenet', input_tensor=image)

        #for layer in self.model.layers:
        #    layer.trainable = False

        # Recover input layer
        #image = self.model.get_layer(self.ids_inputs[0]).output

        # Recover last layer kept from original model: 'fc2'
        x = self.model.get_layer('avg_pool').output
        ##################################################
        #x = Flatten()(x)
        # Define outputs
        outputs_list = []
        outputs_matching = {}
        num_classes_matching = {}

        if 'SORTED_OUTPUTS' in params.keys():
            sorted_keys = params['SORTED_OUTPUTS']
        else:
            sorted_keys = []
            for k in params['OUTPUTS'].keys():
                if params['OUTPUTS'][k]['type'] == 'sigma':
                    sorted_keys.append(k)
                else:
                    sorted_keys.insert(0, k)

        #for id_name, data in params['OUTPUTS'].iteritems():
        for id_name in sorted_keys:
            data = params['OUTPUTS'][id_name]

            # Special output that calculates sigmas for uncertainty loss
            if data['type'] == 'sigma':
                match_output = params['OUTPUTS'][id_name]['output_id']
                match_act = outputs_matching[match_output]

                out_sigma = ConcatenateOutputWithSigma(
                    (None, num_classes_matching[match_output] + 1),
                    name_suffix=id_name,
                    name=id_name)(match_act)
                outputs_list.append(out_sigma)

            else:
                # Count the number of output classes
                num_classes = 0
                with open(params['DATA_ROOT_PATH'] + '/' + data['classes'],
                          'r') as f:
                    for line in f:
                        num_classes += 1
                if data['type'] == 'binary' and params['EMPTY_LABEL'] == True:
                    num_classes += 1  # empty label

                # Define only a FC output layer (+ activation) per output
                out = Dense(num_classes)(x)
                out_act = Activation(data['activation'], name=id_name)(out)
                outputs_list.append(out_act)

                outputs_matching[id_name] = out_act
                num_classes_matching[id_name] = num_classes

        self.model = Model(input=image, output=outputs_list)

Example #4

0

Show file

File: test_topology.py Project: drew12341/keras-1

def test_node_construction():
    ####################################################
    # test basics

    a = Input(shape=(32, ), name='input_a')
    b = Input(shape=(32, ), name='input_b')

    assert a._keras_shape == (None, 32)
    a_layer, a_node_index, a_tensor_index = a._keras_history
    b_layer, b_node_index, b_tensor_index = b._keras_history
    assert len(a_layer.inbound_nodes) == 1
    assert a_tensor_index is 0
    node = a_layer.inbound_nodes[a_node_index]
    assert node.outbound_layer == a_layer

    assert type(node.inbound_layers) is list
    assert node.inbound_layers == []
    assert type(node.input_tensors) is list
    assert node.input_tensors == [a]
    assert type(node.input_masks) is list
    assert node.input_masks == [None]
    assert type(node.input_shapes) is list
    assert node.input_shapes == [(None, 32)]

    assert type(node.output_tensors) is list
    assert node.output_tensors == [a]
    assert type(node.output_shapes) is list
    assert node.output_shapes == [(None, 32)]
    assert type(node.output_masks) is list
    assert node.output_masks == [None]

    dense = Dense(16, name='dense_1')
    a_2 = dense(a)
    b_2 = dense(b)

    assert len(dense.inbound_nodes) == 2
    assert len(dense.outbound_nodes) == 0
    assert dense.inbound_nodes[0].inbound_layers == [a_layer]
    assert dense.inbound_nodes[0].outbound_layer == dense
    assert dense.inbound_nodes[1].inbound_layers == [b_layer]
    assert dense.inbound_nodes[1].outbound_layer == dense

    assert dense.inbound_nodes[0].input_tensors == [a]
    assert dense.inbound_nodes[1].input_tensors == [b]

    # test layer properties
    test_layer = Dense(16, name='test_layer')
    a_test = test_layer(a)
    assert test_layer.input == a
    assert test_layer.output == a_test
    assert test_layer.input_mask is None
    assert test_layer.output_mask is None
    assert test_layer.input_shape == (None, 32)
    assert test_layer.output_shape == (None, 16)

    with pytest.raises(Exception):
        dense.input
    with pytest.raises(Exception):
        dense.output
    with pytest.raises(Exception):
        dense.input_mask
    with pytest.raises(Exception):
        dense.output_mask

    assert dense.get_input_at(0) == a
    assert dense.get_input_at(1) == b
    assert dense.get_output_at(0) == a_2
    assert dense.get_output_at(1) == b_2
    assert dense.get_input_shape_at(0) == (None, 32)
    assert dense.get_input_shape_at(1) == (None, 32)
    assert dense.get_output_shape_at(0) == (None, 16)
    assert dense.get_output_shape_at(1) == (None, 16)
    assert dense.get_input_mask_at(0) is None
    assert dense.get_input_mask_at(1) is None
    assert dense.get_output_mask_at(0) is None
    assert dense.get_output_mask_at(1) is None

Example #5

0

Show file

def get_model_3d(kwargs):
    base_filters = kwargs['base_filters']
    gpus = kwargs['numgpu']
    loss = kwargs['loss']
    numchannel = int(len(kwargs['modalities']))
    inputs = Input((None, None, None, int(numchannel)))
    if kwargs['model'] == 'inception':
        conv1 = Conv3D(base_filters * 8, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(inputs)
        conv2 = Conv3D(base_filters * 8, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(conv1)
        inception1 = Inception3d(conv2, base_filters)
        inception2 = Inception3d(inception1, base_filters)
        inception3 = Inception3d(inception2, base_filters)
        convconcat1 = Conv3D(base_filters * 4, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(inception3)
        final = Conv3D(base_filters * 4, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(convconcat1)
    elif kwargs['model'] == 'unet':
        final = Unet3D(inputs, base_filters)
    elif kwargs['model'] == 'vnet':
        final = Vnet3D(inputs, base_filters)
    elif kwargs['model'] == 'fpn' or kwargs['model'] == 'panopticfpn':
        reg = 0.0001
        f1, f2, f3, f4, _ = FPN3D(inputs, base_filters, reg)
    elif kwargs['model'] == 'densenet':
        final = DenseNet3D(inputs,base_filters)
    else:
        sys.exit('Model must be inception/unet/vnet/fpn.')

    if kwargs['model'] != 'fpn' and kwargs['model'] != 'panopticfpn':
        if loss == 'bce'  or loss == 'dice' or loss == 'focal':
            final = Conv3D(1, (3, 3, 3), activation='sigmoid', padding='same', strides=(1, 1, 1))(final)
        else:
            final = Conv3D(1, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(final)
        model = Model(inputs=inputs, outputs=final,name='some_unique_name')
    else:
        if kwargs['model'] == 'panopticfpn':
            if loss == 'bce' or loss == 'dice' or loss == 'focal':
                # Generate the semantic segmentation branch of panoptic FPN on top of feature extraction backbone
                # Upsampling stages for F4
                # U1
                f4 = BatchNormalization(axis=-1)(f4)
                f4 = Activation('relu')(f4)
                f4 = UpSampling3D(size=(2, 2, 2), name='F4_U1')(f4)
                # U2
                f4 = Conv3D(base_filters*4, (3, 3, 3), padding='same', strides=(1, 1, 1), kernel_regularizer=l2(reg))(f4)
                f4 = BatchNormalization(axis=-1)(f4)
                f4 = Activation('relu')(f4)
                f4 = UpSampling3D(size=(2, 2, 2), name='F4_U2')(f4)
                # U3
                f4 = Conv3D(base_filters*4, (3, 3, 3), padding='same', strides=(1, 1, 1), kernel_regularizer=l2(reg))(f4)
                f4 = BatchNormalization(axis=-1)(f4)
                f4 = Activation('relu')(f4)
                f4 = UpSampling3D(size=(2, 2, 2), name='F4_U3')(f4)

                # Prepare
                f4 = Conv3D(base_filters*4, (3, 3, 3), padding='same', strides=(1, 1, 1), kernel_regularizer=l2(reg))(f4)
                f4 = BatchNormalization(axis=-1)(f4)
                f4 = Activation('relu')(f4)

                # Upsampling stages for F3
                # U1
                f3 = BatchNormalization(axis=-1)(f3)
                f3 = Activation('relu')(f3)
                f3 = UpSampling3D(size=(2, 2, 2), name='F3_U1')(f3)
                # U2
                f3 = Conv3D(base_filters*4, (3, 3, 3), padding='same', strides=(1, 1, 1), kernel_regularizer=l2(reg))(f3)
                f3 = BatchNormalization(axis=-1)(f3)
                f3 = Activation('relu')(f3)
                f3 = UpSampling3D(size=(2, 2, 2), name='F3_U2')(f3)
                # Prepare
                f3 = Conv3D(base_filters*4, (3, 3, 3), padding='same', strides=(1, 1, 1), kernel_regularizer=l2(reg))(f3)
                f3 = BatchNormalization(axis=-1)(f3)
                f3 = Activation('relu')(f3)

                # Upsampling stages for F2
                # U1
                f2 = BatchNormalization(axis=-1)(f2)
                f2 = Activation('relu')(f2)
                f2 = UpSampling3D(size=(2, 2, 2), name='F2_U1')(f2)
                # Prepare
                f2 = Conv3D(base_filters*4, (3, 3, 3), padding='same', strides=(1, 1, 1), kernel_regularizer=l2(reg))(f2)
                f2 = BatchNormalization(axis=-1)(f2)
                f2 = Activation('relu')(f2)

                # Prepare F1
                f1 = BatchNormalization(axis=-1)(f1)
                f1 = Activation('relu')(f1)

                f3 = Add()([f4, f3])
                f2 = Add()([f3, f2])
                f1 = Add()([f2, f1])

                f1 = Conv3D(base_filters*4, (3, 3, 3),  padding='same', strides=(1,1,1), kernel_regularizer=l2(reg))(f1)
                f1 = BatchNormalization(axis=-1)(f1)
                f1 = Activation('relu')(f1)
                final = Conv3D(1, (3, 3, 3), activation='sigmoid', padding='same', strides=(1, 1, 1), name='Level1')(f1)
            else:
                sys.exit('Loss function for Panoptic FPN must be BCE, Dice, or Focal.')

        elif kwargs['model'] == 'fpn':
            if loss == 'bce' or loss == 'dice' or loss == 'focal':
                f1 = Conv3D(1, (3, 3, 3), activation='sigmoid', padding='same', strides=(1, 1, 1), name='Level1')(f1)
                f2 = Conv3D(1, (3, 3, 3), activation='sigmoid', padding='same', strides=(1, 1, 1), name='Level2')(f2)
                f3 = Conv3D(1, (3, 3, 3), activation='sigmoid', padding='same', strides=(1, 1, 1), name='Level3')(f3)
                f4 = Conv3D(1, (3, 3, 3), activation='sigmoid', padding='same', strides=(1, 1, 1), name='Level4')(f4)
            else:
                f1 = Conv3D(1, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(f1)
                f2 = Conv3D(1, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(f2)
                f3 = Conv3D(1, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(f3)
                f4 = Conv3D(1, (3, 3, 3), activation='relu', padding='same', strides=(1, 1, 1))(f4)

        model = Model(inputs=inputs, outputs=final,name='some_unique_name')
    #print(model.summary())
    return model

Example #6

0

Show file

File: test_topology.py Project: drew12341/keras-1

def test_multi_input_layer():
    ####################################################
    # test multi-input layer
    a = Input(shape=(32, ), name='input_a')
    b = Input(shape=(32, ), name='input_b')

    dense = Dense(16, name='dense_1')
    a_2 = dense(a)
    b_2 = dense(b)

    merged = merge([a_2, b_2], mode='concat', name='merge')
    assert merged._keras_shape == (None, 16 * 2)
    merge_layer, merge_node_index, merge_tensor_index = merged._keras_history

    assert merge_node_index == 0
    assert merge_tensor_index == 0

    assert len(merge_layer.inbound_nodes) == 1
    assert len(merge_layer.outbound_nodes) == 0

    assert len(merge_layer.inbound_nodes[0].input_tensors) == 2
    assert len(merge_layer.inbound_nodes[0].inbound_layers) == 2

    c = Dense(64, name='dense_2')(merged)
    d = Dense(5, name='dense_3')(c)

    model = Model(input=[a, b], output=[c, d], name='model')
    assert len(model.layers) == 6
    print('model.input_layers:', model.input_layers)
    print('model.input_layers_node_indices:', model.input_layers_node_indices)
    print('model.input_layers_tensor_indices:',
          model.input_layers_tensor_indices)
    print('model.output_layers', model.output_layers)

    print('output_shape:', model.get_output_shape_for([(None, 32),
                                                       (None, 32)]))
    assert model.get_output_shape_for([(None, 32), (None, 32)]) == [(None, 64),
                                                                    (None, 5)]

    assert model.compute_mask([a, b], [None, None]) == [None, None]

    print('output_shape:', model.get_output_shape_for([(None, 32),
                                                       (None, 32)]))
    assert model.get_output_shape_for([(None, 32), (None, 32)]) == [(None, 64),
                                                                    (None, 5)]

    # we don't check names of first 2 layers (inputs) because
    # ordering of same-level layers is not fixed
    print('layers:', [layer.name for layer in model.layers])
    assert [l.name for l in model.layers
            ][2:] == ['dense_1', 'merge', 'dense_2', 'dense_3']
    print('input_layers:', [l.name for l in model.input_layers])
    assert [l.name for l in model.input_layers] == ['input_a', 'input_b']
    print('output_layers:', [l.name for l in model.output_layers])
    assert [l.name for l in model.output_layers] == ['dense_2', 'dense_3']

    # actually run model
    fn = K.function(model.inputs, model.outputs)
    input_a_np = np.random.random((10, 32))
    input_b_np = np.random.random((10, 32))
    fn_outputs = fn([input_a_np, input_b_np])
    assert [x.shape for x in fn_outputs] == [(10, 64), (10, 5)]

    # test get_source_inputs
    print(get_source_inputs(c))
    assert get_source_inputs(c) == [a, b]

    # serialization / deserialization
    json_config = model.to_json()
    recreated_model = model_from_json(json_config)
    recreated_model.compile('rmsprop', 'mse')

    print('recreated:')
    print([layer.name for layer in recreated_model.layers])
    print([layer.name for layer in recreated_model.input_layers])
    print([layer.name for layer in recreated_model.output_layers])
    assert [l.name for l in recreated_model.layers
            ][2:] == ['dense_1', 'merge', 'dense_2', 'dense_3']
    assert [l.name
            for l in recreated_model.input_layers] == ['input_a', 'input_b']
    assert [l.name
            for l in recreated_model.output_layers] == ['dense_2', 'dense_3']

    fn = K.function(recreated_model.inputs, recreated_model.outputs)
    input_a_np = np.random.random((10, 32))
    input_b_np = np.random.random((10, 32))
    fn_outputs = fn([input_a_np, input_b_np])
    assert [x.shape for x in fn_outputs] == [(10, 64), (10, 5)]

Example #7

0

Show file

File: test_topology.py Project: drew12341/keras-1

def test_functional_guide():
    # MNIST
    from keras.layers import Input, Dense, LSTM
    from keras.models import Model
    from keras.utils import np_utils

    # this returns a tensor
    inputs = Input(shape=(784, ))

    # a layer instance is callable on a tensor, and returns a tensor
    x = Dense(64, activation='relu')(inputs)
    x = Dense(64, activation='relu')(x)
    predictions = Dense(10, activation='softmax')(x)

    # this creates a model that includes
    # the Input layer and three Dense layers
    model = Model(input=inputs, output=predictions)
    model.compile(optimizer='rmsprop',
                  loss='categorical_crossentropy',
                  metrics=['accuracy'])

    # the data, shuffled and split between tran and test sets
    X_train = np.random.random((100, 784))
    Y_train = np.random.random((100, 10))

    model.fit(X_train, Y_train, nb_epoch=2, batch_size=128)

    assert model.inputs == [inputs]
    assert model.outputs == [predictions]
    assert model.input == inputs
    assert model.output == predictions
    assert model.input_shape == (None, 784)
    assert model.output_shape == (None, 10)

    # try calling the sequential model
    inputs = Input(shape=(784, ))
    new_outputs = model(inputs)
    new_model = Model(input=inputs, output=new_outputs)
    new_model.compile(optimizer='rmsprop',
                      loss='categorical_crossentropy',
                      metrics=['accuracy'])

    ##################################################
    # multi-io
    ##################################################
    tweet_a = Input(shape=(4, 25))
    tweet_b = Input(shape=(4, 25))
    # this layer can take as input a matrix
    # and will return a vector of size 64
    shared_lstm = LSTM(64)

    # when we reuse the same layer instance
    # multiple times, the weights of the layer
    # are also being reused
    # (it is effectively *the same* layer)
    encoded_a = shared_lstm(tweet_a)
    encoded_b = shared_lstm(tweet_b)

    # we can then concatenate the two vectors:
    merged_vector = merge([encoded_a, encoded_b],
                          mode='concat',
                          concat_axis=-1)

    # and add a logistic regression on top
    predictions = Dense(1, activation='sigmoid')(merged_vector)

    # we define a trainable model linking the
    # tweet inputs to the predictions
    model = Model(input=[tweet_a, tweet_b], output=predictions)

    model.compile(optimizer='rmsprop',
                  loss='binary_crossentropy',
                  metrics=['accuracy'])
    data_a = np.random.random((1000, 4, 25))
    data_b = np.random.random((1000, 4, 25))
    labels = np.random.random((1000, ))
    model.fit([data_a, data_b], labels, nb_epoch=1)

    model.summary()
    assert model.inputs == [tweet_a, tweet_b]
    assert model.outputs == [predictions]
    assert model.input == [tweet_a, tweet_b]
    assert model.output == predictions

    assert model.output == predictions
    assert model.input_shape == [(None, 4, 25), (None, 4, 25)]
    assert model.output_shape == (None, 1)

    assert shared_lstm.get_output_at(0) == encoded_a
    assert shared_lstm.get_output_at(1) == encoded_b
    assert shared_lstm.input_shape == (None, 4, 25)

Example #8

0

Show file