コード例 #1
0
ファイル: Praproses_data.py プロジェクト: lufias69/Koding
def praposes(a):
    #a = teks
    a = pps.preprocessing(a)
    a = pps.removePunc(a)
    a = ct.norm_typo(a)
    a = nkbi.norm_kbbi(a)
    a = stm.stemmer_kata(a)
    a = stm.stop_word(a)
    return a
コード例 #2
0
ファイル: Praproses_data.py プロジェクト: lufias69/mycode
def praposes(a, normalisasi=True):
    #a = teks
    if normalisasi == True:
        a = pps.gantiKarakter(a)
    a = pps.preprocessing(a)
    a = pps.removePunc(a)

    if normalisasi == True:
        a = ct.cek_typo(a)
        a = nkbi.norm_kbbi(a)
    a = stm.stemmer_kata(a)
    a = stm.stop_word(a)
    return a
コード例 #3
0
def praproses(teks):
    a = tknzr.tokenize(teks)
    a = " ".join(a)
    a = pps.preprocessing(teks)
    a = pps.removePunc(a)
    a = ct.norm_typo(a)
    a = nkbi.norm_kbbi(a)
    a = stm.stemmer_kata(a)
    a = re.sub(' +', ' ',a)
    a = a.lstrip()
    return a
コード例 #4
0
ファイル: Praproses_data.py プロジェクト: lufias69/mycode
def saves():
    stm.save_kta()
コード例 #5
0
ファイル: Praproses_data.py プロジェクト: lufias69/mycode
def savek():
    nkbi.save_gdiganti()
    ct.save_gdiganti()
    stm.save_kta()
コード例 #6
0
def stem_dulu(list_kata):
    n_list = list()
    for i in list_kata:
        i = stm.stemmer_kata(i)
        n_list.append(i)
    return list(set(n_list))