Python NgramReader.testing_block 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ngrams

클래스/타입: NgramReader

메소드/함수: testing_block

hotexamples.com에서의 예제들: 2

Python NgramReader.testing_block - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ngrams.NgramReader.testing_block에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

NgramReader(3)

contrastive_symbols_from_row(1)

testing_block(1)

training_block(1)

예제 #1

파일 보기

파일: relational_admm_trainer.py 프로젝트: dpfried/neural_language_model

            json.dump(args, f)

    pprint(args)

    # N_relationships = len(relationships.relationships)
    replacement_column_index = args['sequence_length'] / 2

    rng = np.random.RandomState(args['random_seed'])
    data_rng = np.random.RandomState(args['random_seed'])
    validation_rng = np.random.RandomState(args['random_seed'] + 1)
    random.seed(args['random_seed'])


    # set up syntactic
    ngram_reader = NgramReader(args['ngram_filename'], vocab_size=args['ngram_vocab_size'], train_proportion=args['train_proportion'], test_proportion=args['test_proportion'])
    testing_block = ngram_reader.testing_block()
    print 'corpus contains %i ngrams' % (ngram_reader.number_of_ngrams)

    # set up semantic
    # num_semantic_training = int(relationships.N * 0.98)
    # semantic_training = relationships.data[:num_semantic_training]
    # semantic_testing = relationships.data[num_semantic_training:]

    relationship_path = join(base_dir, 'relationships.pkl.gz')
    vocabulary_path = join(base_dir, 'vocabulary.pkl.gz')
    try:
        with gzip.open(relationship_path) as f:
            relationships = cPickle.load(f)
        print 'loaded relationships from %s' % relationship_path
    except:
        # relationships = Relationships()

예제 #2

파일 보기

        args['base_dir'] = base_dir
    else:
        model_loaded = False
        # dump the params
        with open(os.path.join(args['base_dir'], 'params.json'), 'w') as f:
            json.dump(args, f)

    pprint(args)

    replacement_column_index = args['sequence_length'] / 2

    ngram_reader = NgramReader(args['ngram_filename'],
                               vocab_size=args['vocab_size'],
                               train_proportion=args['train_proportion'],
                               test_proportion=args['test_proportion'])
    testing_block = ngram_reader.testing_block()
    vocabulary = ngram_reader.word_array
    print 'corpus contains %i ngrams' % (ngram_reader.number_of_ngrams)

    rng = np.random.RandomState(args['random_seed'])
    data_rng = np.random.RandomState(args['random_seed'])
    validation_rng = np.random.RandomState(args['random_seed'] + 1)
    random.seed(args['random_seed'])

    if not args['dont_run_semantic']:
        print 'loading semantic similarities'
        word_similarity = semantic_module.WordSimilarity(
            vocabulary,
            args['word_similarity_file'],
            memmap_filename=args['word_similarity_memmap'])
        print 'computing terms with semantic distance'