Python number_freqの例

プログラミング言語: Python

名前空間/パッケージ名: plugins

メソッド/関数: number_freq

hotexamples.comのコード掲載数: 2

Python number_freq - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのplugins.number_freqの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: classifier.py プロジェクト: slyngbaek/wikiometer

def paragraph_features(wiki_title):
    features = {}
    
    page = get_page(wiki_title)
    if not page:
       return None
    text = extract_text(page)
    
    global text_time
    text_time = text#used for time_estimation()

    word_tokens = nltk.word_tokenize(text)
    sent_tokens = nltk.sent_tokenize(text)

    
    features["ave syllables/word"] = num_syllables(word_tokens)/len(word_tokens)
    features["ave sentence length"] = len(word_tokens)/len(sent_tokens)
    features["ave word length"] = character_count(word_tokens)/len(word_tokens)
    features["percent common words"] = \
                        common_count(word_tokens)/len(word_tokens)
    features["percent stop words"] = \
                        stopword_count(word_tokens)/len(word_tokens)
    features["hapax legomenon"] = \
                        plugins.hapax_find(word_tokens)/len(word_tokens)
    features["acronym count"] = \
                        plugins.avg_acronym_count(word_tokens)/len(word_tokens)
    features["percent numbers"]= \
                        plugins.number_freq(word_tokens)/len(word_tokens)
                        
    return features

コード例 #2

ファイルを表示

ファイル: classifier.py プロジェクト: slyngbaek/wikiometer

def paragraph_features_page(page):
    features = {}

    text = extract_text(page)
    word_tokens = nltk.word_tokenize(text)
    sent_tokens = nltk.sent_tokenize(text)
    
    features["ave syllables/word"] = num_syllables(word_tokens)/len(word_tokens)
    features["ave sentence length"] = len(word_tokens)/len(sent_tokens)
    features["ave word length"] = character_count(word_tokens)/len(word_tokens)
    features["percent common words"] = \
                        common_count(word_tokens)/len(word_tokens)
    features["percent stop words"] = \
                        stopword_count(word_tokens)/len(word_tokens)
    features["hapax legomenon"] = \
                        plugins.hapax_find(word_tokens)/len(word_tokens)
    features["acronym count"] = \
                        plugins.avg_acronym_count(word_tokens)/len(word_tokens)
    features["percent numbers"]= \
                        plugins.number_freq(word_tokens)/len(word_tokens)
    
    return features