Python maketextdoc 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: IIalgorithm_model

메소드/함수: maketextdoc

hotexamples.com에서의 예제들: 2

Python maketextdoc - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 IIalgorithm_model.maketextdoc에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: CategoryvecNN.py 프로젝트: ItoTomoki/ruiternews

def makedocvec(Folda = "businesstexts",clusternumber = DimentionN,word2vecdic = word2vecdic):
    businesspreprocessed_docs = maketextdoc(Folda)
    docvec = {}
    for k in businesspreprocessed_docs.keys():
        sentence = businesspreprocessed_docs[k]
        if len(sentence) < 2:
            continue
        docvec[k] = np.zeros(clusternumber)
        for m in sentence:
            try:
                labelnum = word2vecdic[m]
                docvec[k][labelnum] = (docvec[k][labelnum] + 1)
            except:
                #print k
                continue
    for key in docvec.keys():
        if all(docvec[key] == np.zeros(clusternumber)):
            print Folda,key
            #print docvec[key]
        else:
            docvec[key] = (docvec[key]/np.linalg.norm(docvec[key]))
    return docvec

예제 #2

파일 보기

파일: IIalgorithm_predictmanysituation.py 프로젝트: ItoTomoki/ruiternews

    for mod_value in range(mod_number):
        if mod_value == 0:
            all_target_pred_list_dic, all_target_test_list_dic = evaluate_with_SVM_3(topdocvec,toptarget_dic, newl_dic,func2,func4,func1, date = '07302015',mod_number = mod_number, mod_value = mod_value)
        else:
            target_pred_list_dic, target_test_list_dic = evaluate_with_SVM_3(topdocvec,toptarget_dic, newl_dic,func2,func4,func1, date = '07302015',mod_number = mod_number, mod_value = mod_value) 
            for dic_key in all_target_test_list_dic:
                all_target_test_list_dic[dic_key] += target_test_list_dic[dic_key]
                all_target_pred_list_dic[dic_key] += target_pred_list_dic[dic_key]
    for dic_key in all_target_test_list_dic:
        print dic_key
        print classification_report(all_target_test_list_dic[dic_key],all_target_pred_list_dic[dic_key],digits=4)
    return all_target_test_list_dic, all_target_pred_list_dic

#all_target_test_list_dic, all_target_pred_list_dic = evaluate_with_SVM_3_k_fold(topdocvec,toptarget_dic, newl_dic)
#BOW
topdoc2014 = maketextdoc(Folda = "toptexts_kaigyou_kihon2")
topdoc2015 = maketextdoc(Folda = "toptexts_kaigyou_kihon2_2015")
topdoc2013 = maketextdoc(Folda = "toptexts_kaigyou_kihon2_2013")
topdoc = copy.copy(topdoc2013)
topdoc.update(topdoc2014)
topdoc.update(topdoc2015)

#preprocessed_docs = doc
preprocessed_docs = topdoc
dct = gensim.corpora.Dictionary(preprocessed_docs.values())
unfiltered = dct.token2id.keys()
dct.filter_extremes(no_below=5)
filtered = dct.token2id.keys()
#filtered_out = set(unfiltered) - set(filtered)
bow_docs = {}
bow_docs_all_zeros = {}