Python get_d_word_count_train_choice 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: util

메소드/함수: get_d_word_count_train_choice

hotexamples.com에서의 예제들: 4

Python get_d_word_count_train_choice - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 util.get_d_word_count_train_choice에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def get_word_count_train_validation():
    d_word_count_t_q = util.get_d_word_count_train_question()
    d_word_count_t_c = util.get_d_word_count_train_choice()
    d_word_count_v_q = util.get_d_word_count_validation_question()
    d_word_count_v_c = util.get_d_word_count_validation_choice()
    d_word_count = {}
    for word in d_word_count_t_q.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_t_q[word]
    for word in d_word_count_t_c.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_t_c[word]
    for word in d_word_count_v_q.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_v_q[word]
    for word in d_word_count_v_c.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_v_c[word]
    return d_word_count
    '''

예제 #2

파일 보기

파일: statis.py 프로젝트: BinbinBian/Allen_AI_Science_Challenge_JunweiPan

def statis_word2vec_coverage():
    '''
    How many words can be searched in the word2vec model ? 
    And which ones can or can not be found ?  
    This can guide us to use more and more data.
    '''
    path_model = 'model/word2vec_4.model'
    model = gensim.models.Word2Vec.load(path_model)
    d_word_count = util.get_d_word_count_train_choice()
    n_found = 0
    n_miss = 0
    for word in d_word_count.keys():
        try:
            res = model[word]
            n_found += 1
            print "%s\t%d\tFound" % (word, d_word_count[word])
        except:
            n_miss += 1
            print "%s\t%d\tMiss" % (word, d_word_count[word])
    print "Found\t%d\tMiss\t%d" % (n_found, n_miss)

예제 #3

파일 보기

파일: get_wikipedia_data.py 프로젝트: BinbinBian/Allen_AI_Science_Challenge_JunweiPan

def get_word_count_train_validation():
    d_word_count_t_q = util.get_d_word_count_train_question()
    d_word_count_t_c = util.get_d_word_count_train_choice()
    d_word_count_v_q = util.get_d_word_count_validation_question()
    d_word_count_v_c = util.get_d_word_count_validation_choice()
    d_word_count = {}
    for word in d_word_count_t_q.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_t_q[word]
    for word in d_word_count_t_c.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_t_c[word]
    for word in d_word_count_v_q.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_v_q[word]
    for word in d_word_count_v_c.keys():
        d_word_count.setdefault(word, 0)
        d_word_count[word] += d_word_count_v_c[word]
    return d_word_count
    '''

예제 #4

파일 보기

파일: statis.py 프로젝트: pankajk/Allen_AI_Science_Challenge_JunweiPan

def statis_word2vec_coverage():
    '''
    How many words can be searched in the word2vec model ? 
    And which ones can or can not be found ?  
    This can guide us to use more and more data.
    '''
    path_model = 'model/word2vec_4.model'
    model = gensim.models.Word2Vec.load(path_model)
    d_word_count = util.get_d_word_count_train_choice()
    n_found = 0
    n_miss = 0
    for word in d_word_count.keys():
        try:
            res = model[word]
            n_found += 1
            print "%s\t%d\tFound" % (word, d_word_count[word])
        except:
            n_miss += 1
            print "%s\t%d\tMiss" % (word, d_word_count[word])
    print "Found\t%d\tMiss\t%d" % (n_found, n_miss)