Exemplos de TextCorpus.save em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: gensim.corpora

Classe / Tipo: TextCorpus

Método / Função: save

Exemplos em hotexamples.com: 1

TextCorpus.save em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de gensim.corpora.TextCorpus.save em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

TextCorpus(10)

get_texts(3)

load(2)

__init__(1)

save(1)

Métodos Frequentes

TextCorpus (10)

get_texts (3)

load (2)

__init__ (1)

save (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: make_corpus_lda1.py Projeto: MikeLepekhin/Non-thematic-Text-Classification

else: keep_words = DEFAULT_DICT_SIZE if os.path.exists(outp + '_wordids.txt.bz2') and os.path.exists(outp + '_corpus.pkl.bz2'): dictionary = Dictionary.load_from_text(outp + '_wordids.txt.bz2') wiki = TextCorpus.load(outp + '_corpus.pkl.bz2') else: wiki = TextCorpus(inp) # only keep the most frequent words wiki.dictionary.filter_extremes(no_below=20, no_above=0.1, keep_n=keep_words) wiki.dictionary.save_as_text(outp + '_wordids.txt.bz2') wiki.save(outp + '_corpus.pkl.bz2') # load back the id->word mapping directly from file # this seems to save more memory, compared to keeping the wiki.dictionary object from above dictionary = Dictionary.load_from_text(outp + '_wordids.txt.bz2') # build tfidf if os.path.exists(outp + '_tfidf.mm'): mm = gensim.corpora.MmCorpus(outp + '_tfidf.mm') else: tfidf = TfidfModel(wiki, id2word=dictionary, normalize=True) #tfidf.save(outp + '.tfidf_model') # save tfidf vectors in matrix market format mm = tfidf[wiki] MmCorpus.serialize(outp + '_tfidf.mm', mm, progress_cnt=10000)