Python split_wordsの例

プログラミング言語: Python

名前空間/パッケージ名: data_processed

メソッド/関数: split_words

hotexamples.comのコード掲載数: 5

Python split_words - 5件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのdata_processed.split_wordsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

0

ファイルを表示

ファイル: chatbot.py プロジェクト: ngocbien/chatbot

def score_by_new_doc_(new_doc, doc, DICT):
    
    list_word_in_doc = data_processed.split_words(new_doc)
    score = 0
    for word in list_word_in_doc:
            if word in DICT[doc]:
                 score += DICT[doc][word]
    return score

コード例 #2

0

ファイルを表示

ファイル: chatbot.py プロジェクト: ngocbien/chatbot

def dict_for_all_doc(data): 
    """
    return hold data's dictionary"""
    dict_ = {}
    for doc in data:
        list_word_ = data_processed.split_words(doc)    
        dict_[doc] = {word: tf_idf_modified(word, doc, K) for word in list_word_}
    return dict_

コード例 #3

0

ファイルを表示

ファイル: chatbot.py プロジェクト: ngocbien/chatbot

def tf_idf_standard(word, doc):
    
    df = 0
    doc_split = data_processed.split_words(doc)
    if word in doc_split:
        tf = 1
    else:
        tf = 0
    for doc_ in DATA:
        if word in doc_:
            df+=1
    if df >0:
        return tf*math.log(len(DATA)/df, 10)
    else:
        return 0

コード例 #4

0

ファイルを表示

ファイル: chatbot.py プロジェクト: ngocbien/chatbot

def tf_idf(word, doc):
    """
    Nous avons utilisé une normalisation pour TF-IDF"""
    tf, df = 0, 0
    len_doc = len(data_processed.split_words(doc))
    value_word = 1/math.sqrt(len_doc)
    value_word = math.sqrt(value_word)
    if word in str(doc):
        tf = value_word
    for doc_ in DATA:
        if word in str(doc_):
            df+=1
    if df>0:
        return tf*math.log(len(DATA)/(df), 10)
    else:
        return 0

コード例 #5

0

ファイルを表示

ファイル: chatbot.py プロジェクト: ngocbien/chatbot

def dict_doc_score_(doc, KEY_LIST, sujet): 
    """
    We return score of all one words and all two consequent words"""

    list_word_ = data_processed.split_words(doc)    
    return {word: tf_idf_(word, doc, KEY_LIST, sujet) for word in list_word_}