Python cal_hist 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: preprocess

메소드/함수: cal_hist

hotexamples.com에서의 예제들: 2

Python cal_hist - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 preprocess.cal_hist에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

        srcdir + 'relation_train.hist-%d.txt' % hist_size,
        srcdir + 'relation_valid.hist-%d.txt' % hist_size,
        srcdir + 'relation_test.hist-%d.txt' % hist_size
    ]
    embed_dict = read_embedding(filename=embedfile)
    print('read embedding finished ...')
    _PAD_ = len(embed_dict)
    embed_size = len(list(embed_dict.values())[0])
    embed_dict[_PAD_] = np.zeros((embed_size, ), dtype=np.float32)
    embed = np.float32(np.random.uniform(-0.2, 0.2, [_PAD_ + 1, embed_size]))
    embed = convert_embed_2_numpy(embed_dict, embed=embed)

    corpus, _ = read_data(corpusfile)
    print('read corpus finished....')
    for idx, relfile in enumerate(relfiles):
        histfile = histfiles[idx]
        rel = read_relation(relfile)
        fout = open(histfile, 'w')
        for label, d1, d2 in rel:
            assert d1 in corpus
            assert d2 in corpus
            qnum = len(corpus[d1])
            d1_embed = embed[corpus[d1]]
            d2_embed = embed[corpus[d2]]
            curr_hist = cal_hist(d1_embed, d2_embed, qnum, hist_size)
            curr_hist = curr_hist.tolist()
            fout.write(' '.join(map(str, curr_hist)))
            fout.write('\n')
        fout.close()
    print('generate histogram finished ...')

예제 #2

파일 보기

파일: gen_hist4drmm.py 프로젝트: RuijieRa/MatchZoo

            srcdir + 'relation_train.hist-%d.txt' % hist_size,
            srcdir + 'relation_valid.hist-%d.txt' % hist_size,
            srcdir + 'relation_test.hist-%d.txt' % hist_size
            ]
    embed_dict = read_embedding(filename = embedfile)
    print('read embedding finished ...')
    _PAD_ = len(embed_dict)
    embed_size = len(list(embed_dict.values())[0])
    embed_dict[_PAD_] = np.zeros((embed_size, ), dtype=np.float32)
    embed = np.float32(np.random.uniform(-0.2, 0.2, [_PAD_+1, embed_size]))
    embed = convert_embed_2_numpy(embed_dict, embed = embed)

    corpus, _ = read_data(corpusfile)
    print('read corpus finished....')
    for idx, relfile in enumerate(relfiles):
        histfile = histfiles[idx]
        rel = read_relation(relfile)
        fout = open(histfile, 'w')
        for label, d1, d2 in rel:
            assert d1 in corpus
            assert d2 in corpus
            qnum = len(corpus[d1])
            d1_embed = embed[corpus[d1]]
            d2_embed = embed[corpus[d2]]
            curr_hist = cal_hist(d1_embed, d2_embed, qnum, hist_size)
            curr_hist = curr_hist.tolist()
            fout.write(' '.join(map(str, curr_hist)))
            fout.write('\n')
        fout.close()
    print('generate histogram finished ...')