Python Word2Vec.intersect_word2vec_formatの例

プログラミング言語: Python

名前空間/パッケージ名: gensim.models.word2vec

クラス/型: Word2Vec

メソッド/関数: intersect_word2vec_format

hotexamples.comのコード掲載数: 6

Python Word2Vec.intersect_word2vec_format - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのgensim.models.word2vec.Word2Vec.intersect_word2vec_formatの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Word2Vec(30)

load(30)

load_word2vec_format(30)

intersect_word2vec_format(3)

__init__(2)

train(2)

loadata_vectorsword2vec_format(1)

most_similar(1)

seeded_vector(1)

similar_by_word(1)

train_batch_sg(1)

コード例 #1

ファイルを表示

ファイル: tegendetail.py プロジェクト: shishih/testgensim

def intersect(vectorsize):
    model=Word2Vec.load('corpus/fieldtrained'+str(vectorsize)+'.model')
    # setwordwindow(vectorsize)
    print 'finish load'
    Word2Vec.intersect_word2vec_format(model,'corpus/initindex'+str(vectorsize),binary=False)
    print 'finish intersect'
    model.save('corpus/merged'+str(vectorsize)+'.model')
    model.save_word2vec_format('corpus/merged'+str(vectorsize), binary=False)
    print 'finish save'

コード例 #2

ファイルを表示

def intersect(vectorsize):
    model = Word2Vec.load('corpus/fieldtrained' + str(vectorsize) + '.model')
    # setwordwindow(vectorsize)
    print 'finish load'
    Word2Vec.intersect_word2vec_format(model,
                                       'corpus/initindex' + str(vectorsize),
                                       binary=False)
    print 'finish intersect'
    model.save('corpus/merged' + str(vectorsize) + '.model')
    model.save_word2vec_format('corpus/merged' + str(vectorsize), binary=False)
    print 'finish save'

コード例 #3

ファイルを表示

ファイル: tegen.py プロジェクト: shishih/testgensim

def teword():
    # model=Word2Vec.load_word2vec_format('vectorseg.bin',binary=False)
    # sim=model.most_similar(positive=[u'好',u'开心'],negative=[u'下雨'],topn=2)
    # print sim
    documents = [u"今天 天气 真是 好 啊", u"明天 就要 下雨 了，伐 开心"]
    model = Word2Vec(documents, size=20, window=5, min_count=1)
    sim = model.most_similar(positive=[u"好"], topn=2)
    # model.save('./tmp/tevec')
    print sim

    model = Word2Vec.load_word2vec_format('vectorseg.bin', binary=False)
    Word2Vec.intersect_word2vec_format(model, 'fieldvec.bin', binary=False)
    Word2Vec.train_batch_sg(model, sentences, alpha, work=None)

コード例 #4

ファイルを表示

ファイル: tegen.py プロジェクト: shishih/testgensim

def teword():
    # model=Word2Vec.load_word2vec_format('vectorseg.bin',binary=False)
    # sim=model.most_similar(positive=[u'好',u'开心'],negative=[u'下雨'],topn=2)
    # print sim
    documents=[u"今天 天气 真是 好 啊",u"明天 就要 下雨 了，伐 开心"]
    model=Word2Vec(documents,size=20,window=5,min_count=1)
    sim=model.most_similar(positive=[u"好"],topn=2)
    # model.save('./tmp/tevec')
    print sim

    model=Word2Vec.load_word2vec_format('vectorseg.bin',binary=False)
    Word2Vec.intersect_word2vec_format(model,'fieldvec.bin',binary=False)
    Word2Vec.train_batch_sg(model, sentences, alpha, work=None)

コード例 #5

ファイルを表示

ファイル: tegen.py プロジェクト: shishih/testgensim

def intersect(vectorsize):
    # merged OK!
    # vectorsize=40
    model = Word2Vec(size=vectorsize, min_count=2, sg=1)

    sentences = LineSentence('corpus/precorpus')
    model.build_vocab(sentences)
    model.train(sentences)
    print 'finish pre-train'
    model.save('corpus/pretrain' + str(vectorsize) + '.model')
    model.save_word2vec_format('corpus/pretrain' + str(vectorsize))

    # intersect does not delete the bibary tree, but load does
    # model=Word2Vec.load('corpus/pretrain'+str(vectorsize)+'.model')
    setwordwindow(vectorsize)
    Word2Vec.intersect_word2vec_format(model,
                                       'corpus/initindex' + str(vectorsize),
                                       binary=False)
    print 'finish intersect'
    model.save('corpus/merged' + str(vectorsize) + '.model')
    model.save_word2vec_format('corpus/merged' + str(vectorsize), binary=False)

    # model.build_vocab(sentences)

    # sensum=0
    # for i in sentences:
    #     sensum+=1
    # model.corpus_count=sensum

    # Word2Vec.reset_weights(model)
    # model=Word2Vec.load('corpus/merged40.model')
    print "finish load"
    sentences = LineSentence('corpus/fieldcorpus')
    print "finish sentence building"

    model.iter = 1
    model.train(sentences)
    print "finish training"

    # in class Word2Vec
    # self.build_vocab(sentences, trim_rule=trim_rule)
    # self.train(sentences)
    #

    # train_batch_sg(model, sentences, alpha=0.1,work=None)
    # simply use train and set iter=1?
    model.save('corpus/mergedtrained' + str(vectorsize) + 'iter' +
               str(model.iter) + '.model')
    model.save_word2vec_format('corpus/mergedtrained' + str(vectorsize) +
                               'iter' + str(model.iter),
                               binary=False)

コード例 #6

ファイルを表示

ファイル: tegen.py プロジェクト: shishih/testgensim

def intersect(vectorsize): 
    # merged OK!   
    # vectorsize=40
    model=Word2Vec(size=vectorsize,min_count=2,sg=1)

    sentences=LineSentence('corpus/precorpus')
    model.build_vocab(sentences)
    model.train(sentences)
    print 'finish pre-train'
    model.save('corpus/pretrain'+str(vectorsize)+'.model')
    model.save_word2vec_format('corpus/pretrain'+str(vectorsize))
    
    # intersect does not delete the bibary tree, but load does
    # model=Word2Vec.load('corpus/pretrain'+str(vectorsize)+'.model')
    setwordwindow(vectorsize)
    Word2Vec.intersect_word2vec_format(model,'corpus/initindex'+str(vectorsize),binary=False)
    print 'finish intersect'
    model.save('corpus/merged'+str(vectorsize)+'.model')
    model.save_word2vec_format('corpus/merged'+str(vectorsize), binary=False)


    # model.build_vocab(sentences)

    # sensum=0
    # for i in sentences:
    #     sensum+=1
    # model.corpus_count=sensum

    # Word2Vec.reset_weights(model)
    # model=Word2Vec.load('corpus/merged40.model')
    print "finish load"
    sentences=LineSentence('corpus/fieldcorpus')
    print "finish sentence building"
    
    model.iter=1
    model.train(sentences)
    print "finish training"

    # in class Word2Vec
    # self.build_vocab(sentences, trim_rule=trim_rule)
    # self.train(sentences)
    #

    # train_batch_sg(model, sentences, alpha=0.1,work=None)
    # simply use train and set iter=1?
    model.save('corpus/mergedtrained'+str(vectorsize)+'iter'+str(model.iter)+'.model')
    model.save_word2vec_format('corpus/mergedtrained'+str(vectorsize)+'iter'+str(model.iter), binary=False)