Python Corpus.fit_matrix 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: corpus

클래스/타입: Corpus

메소드/함수: fit_matrix

hotexamples.com에서의 예제들: 1

Python Corpus.fit_matrix - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 corpus.Corpus.fit_matrix에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Corpus(30)

emails(15)

__init__(13)

save_to_file(4)

add_extra_info(4)

buildCorpusOnDB(3)

concetenate_corpus(3)

connect_to(3)

add_instance(3)

accuracy_corpus(3)

pop_instance(3)

emails_as_string(2)

convert_dictionary_to_words2vec(2)

construir_corpus(2)

construct_SentencesAndSPerItem(2)

construct_QAnswersAndQPerItem(2)

fit_features(2)

epoch_flag(2)

generate_batch_from_file(2)

export(2)

calculate_primary_targets(2)

Calculate_PairWiseFeature(2)

getTweets(2)

add_file(2)

add(2)

get_sentences(2)

add_document(2)

fit(2)

fill(1)

negativeWordDict(1)

representations(1)

read(1)

fit_dictionary(1)

query_by_id(1)

fit_matrix(1)

freeze(1)

positiveWordDict(1)

parse_xml(1)

getNumericDictionary(1)

from_config(1)

from_dict(1)

loadVocabulary(1)

generate_corpus_from_graph_using_random_walk(1)

instances(1)

getNumOfSampleDocs(1)

getRanges(1)

full_targets(1)

gaussian_model(1)

getAttributeVal(1)

gen_batch(1)

예제 #1

파일 보기

파일: example.py 프로젝트: ejlb/glove-python

    args = parser.parse_args()


    if args.create:
        # Build the corpus dictionary and the cooccurrence matrix.
        print 'Pre-processing corpus'

        if args.wiki:
            print 'Using wikipedia corpus'
            get_data = read_wikipedia_corpus
        else:
            get_data = read_corpus

        corpus_model = Corpus()
        corpus_model.fit_dictionary(get_data(args.create))
        corpus_model.fit_matrix(get_data(args.create), window=10)
        corpus_model.save('corpus.model')
        
        print 'Dict size: %s' % len(corpus_model.dictionary)
        print 'Collocations: %s' % corpus_model.matrix.nnz

    if args.train:
        # Train the GloVe model and save it to disk.

        if not args.create:
            # Try to load a corpus from disk.
            print 'Reading corpus statistics'
            corpus_model = Corpus.load('corpus.model')

            print 'Dict size: %s' % len(corpus_model.dictionary)
            print 'Collocations: %s' % corpus_model.matrix.nnz