Python BOW.convert_to_lowcaseの例

プログラミング言語: Python

クラス/型: BOW

メソッド/関数: convert_to_lowcase

hotexamples.comのコード掲載数: 2

Python BOW.convert_to_lowcase - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのBOW.convert_to_lowcase パッケージから namaの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

calc_bow_representation(2)

compute_histogram(2)

convert_to_lowcase(2)

lemma(2)

load_kmeans(2)

rem_special_chars(2)

rem_stopwords(2)

read_BOWed_labeled_features(1)

read_list_sift_features(1)

vq(1)

コード例 #1

ファイルを表示

ファイル: TokenizingClass.py プロジェクト: vedantdesai13/NLP

    def bag_of_words(self, words, vocab):
        words = b.rem_special_chars(words)
        words = b.convert_to_lowcase(words)
        words = b.rem_stopwords(words)
        words = b.lemma(words)
        words = self.text_to_word(words)

        bag = np.zeros(len(vocab))
        for w in words:
            for i, x in enumerate(vocab):
                if x == w:
                    bag[i] += 1
        return np.array(bag)

コード例 #2

ファイルを表示

ファイル: TokenizingClass.py プロジェクト: vedantdesai13/NLP

        words = b.convert_to_lowcase(words)
        words = b.rem_stopwords(words)
        words = b.lemma(words)
        words = self.text_to_word(words)

        bag = np.zeros(len(vocab))
        for w in words:
            for i, x in enumerate(vocab):
                if x == w:
                    bag[i] += 1
        return np.array(bag)


# Read data from a file
f = open('text2.txt', 'r')
corpus = f.read()

corpus = b.rem_special_chars(corpus)
corpus = b.convert_to_lowcase(corpus)
corpus = b.rem_stopwords(corpus)
corpus = b.lemma(corpus)

t = Tokenizer()
s = t.text_to_word(corpus)
print("word count=", t.word_count(s))
print("number of unique words", t.number_of_unique_words(s))

inp = "autonomous individuals mutual aid self governance"
print("input = ", inp)
print("bag of words = ", t.bag_of_words(inp, s))