Python Character_Map.gen_train_valid_test 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: character_mapping

클래스/타입: Character_Map

메소드/함수: gen_train_valid_test

hotexamples.com에서의 예제들: 3

Python Character_Map.gen_train_valid_test - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 character_mapping.Character_Map.gen_train_valid_test에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

k_map(6)

gen_train_valid_test(3)

gen_x_and_y(3)

예제 #1

파일 보기

파일: RNN.py 프로젝트: dean-shaff/RNN2

def main_test():
    rng = np.random.RandomState(1234)
    filename = './../texts/melville.txt'
    foo = Character_Map(filename,'mapping.dat',overwrite=True)
    # print(len(foo.mapping))
    map_matrix = foo.k_map()
    train, valid, test = foo.gen_train_valid_test(filename=None)
    # print(train[1].get_value().dtype)
    # print(train[1].get_value()[:10].shape)
    x = T.tensor3('x')
    y = T.imatrix('y')
    # x = T.matrix('x')
    # rnnlayer = RNNlayer(x,77,77)
    # f = theano.function(inputs=[x], outputs=rnnlayer.output)
    # foo = f(train[0].get_value()[:10])
    # print(foo.shape)
    rnn = RNN(x,[77],rng=rng) #the number of unique characters in Moby Dick 
    ftest = theano.function(inputs=[x], outputs=rnn.p_y_given_x)
    # print(ftest(train[0].get_value()[:10]).shape)
    print("Compiling training and testing functions...")
    t0 = time.time()
    ftrain = theano.function(inputs=[x,y],outputs=rnn.neg_log_likelihood(y))
    # ftest = theano.function(inputs=[x,y], outputs=rnn.error(y))
    # ftest1 = theano.function(inputs=[x,y],outputs=[rnn.y_pred, y])
    print("Completed compiling functions. Took {:.2f} seconds".format(time.time() - t0))
    for i in xrange(2):
        print(ftrain(train[0].get_value()[i*10:(i+1)*10], train[1].get_value()[i*10:(i+1)*10]))

예제 #2

파일 보기

파일: RNN.py 프로젝트: dean-shaff/RNN2

def test_train_RNN(**kwargs):
    """
    kwargs
    """
    filename = kwargs.get('filename','./../texts/melville.txt')
    n_hidden = kwargs.get('n_hidden',77)
    n_epochs = kwargs.get('n_epochs',100)
    minibatch_size = kwargs.get('minibatch_size',100)
    lr = kwargs.get('lr',0.01)

    charmap = Character_Map(filename,'mapping.dat',overwrite=True)
    charmap.k_map()
    train, valid, test = charmap.gen_train_valid_test(filename=None)

    train_set_x, train_set_y = train
    valid_set_x, valid_set_y = valid 
    test_set_x, test_set_y = test

    n_train_batches = train_set_x.get_value(borrow=True).shape[0] // minibatch_size
    n_valid_batches = valid_set_x.get_value(borrow=True).shape[0] // minibatch_size
    n_test_batches = test_set_x.get_value(borrow=True).shape[0] // minibatch_size
    # print(n_train_batches, n_valid_batches, n_test_batches)
    print("Train size: {}, valid size {}, test size {}".format(train_set_x.get_value(borrow=True).shape[0],
                                                                valid_set_x.get_value(borrow=True).shape[0],
                                                                test_set_x.get_value(borrow=True).shape[0]))

    index = T.lscalar()
    x = T.tensor3('x')
    y = T.imatrix('y')

    rng = np.random.RandomState(1234)

    rnn = RNN(x,[n_hidden]) #i need to change this to take into account different in and out sizes. 

    cost = rnn.neg_log_likelihood(y)
    print("Compiling training, testing and validating functions...")
    t0 = time.time()
    test_model = theano.function(
            inputs=[index],
            outputs=rnn.error(y),
            givens={
                x: test_set_x[index * minibatch_size:(index + 1) * minibatch_size],
                y: test_set_y[index * minibatch_size:(index + 1) * minibatch_size]
            }

        )

    valid_model = theano.function(
            inputs=[index],
            outputs=rnn.error(y),
            givens={
                x: valid_set_x[index * minibatch_size:(index + 1) * minibatch_size],
                y: valid_set_y[index * minibatch_size:(index + 1) * minibatch_size]
            }
        )

    gparams = [T.grad(cost, param) for param in rnn.params]

    updates = [
        (param, param-lr*gparam) for param, gparam in zip(rnn.params,gparams)
    ]

    train_model = theano.function(
            inputs = [index],
            outputs = cost,
            updates = updates,
            givens = {
                x: train_set_x[index * minibatch_size:(index + 1) * minibatch_size],
                y: train_set_y[index * minibatch_size:(index + 1) * minibatch_size]
            }
        )
    print("Completed compiling functions. Took {:.2f} seconds".format(time.time() - t0))
    print("Starting training...")
    valid_freq = 4
    best_valid = np.inf 
    for epoch in xrange(n_epochs):
        for minibatch_index in xrange(n_train_batches-1):
            mean_cost = train_model(minibatch_index)
            iteration_number = epoch*n_train_batches + minibatch_index
            if iteration_number % valid_freq == 0:
                valid_losses = np.array([valid_model(i) for i in xrange(n_valid_batches)])
                # print(valid_losses)
                mean_valid = np.mean(valid_losses)
                print("Minibatch number: {}\nEpoch number: {}\nValidation Error {}".format(minibatch_index,epoch,mean_valid))
                if mean_valid < best_valid:
                    best_valid = mean_valid
                    print("Best Validation so far: {}".format(best_valid))
            else:
                print("Number of iterations: {}, cost {}".format(iteration_number,mean_cost))

    print("Done optimizing")

예제 #3

파일 보기

파일: RNN.py 프로젝트: dean-shaff/RNN2

def load_dataset(filename):
    foo = Character_Map(filename,'mapping.dat',overwrite=True)
    # print(len(foo.mapping))
    map_matrix = foo.k_map()
    return foo.gen_train_valid_test(filename=None)