Esempi in Python per BOW.rem_special_chars

Linguaggio di programmazione: Python

Classe/tipologia: BOW

Metodo/funzione: rem_special_chars

Esempi su hotexamples.com: 2

BOW.rem_special_chars in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per BOW.rem_special_chars da pachetto nama, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

calc_bow_representation(2)

compute_histogram(2)

convert_to_lowcase(2)

lemma(2)

load_kmeans(2)

rem_special_chars(2)

rem_stopwords(2)

read_BOWed_labeled_features(1)

read_list_sift_features(1)

vq(1)

Esempio n. 1

Mostra file

File: TokenizingClass.py Progetto: vedantdesai13/NLP

    def bag_of_words(self, words, vocab):
        words = b.rem_special_chars(words)
        words = b.convert_to_lowcase(words)
        words = b.rem_stopwords(words)
        words = b.lemma(words)
        words = self.text_to_word(words)

        bag = np.zeros(len(vocab))
        for w in words:
            for i, x in enumerate(vocab):
                if x == w:
                    bag[i] += 1
        return np.array(bag)

Esempio n. 2

Mostra file

File: TokenizingClass.py Progetto: vedantdesai13/NLP

        words = b.convert_to_lowcase(words)
        words = b.rem_stopwords(words)
        words = b.lemma(words)
        words = self.text_to_word(words)

        bag = np.zeros(len(vocab))
        for w in words:
            for i, x in enumerate(vocab):
                if x == w:
                    bag[i] += 1
        return np.array(bag)


# Read data from a file
f = open('text2.txt', 'r')
corpus = f.read()

corpus = b.rem_special_chars(corpus)
corpus = b.convert_to_lowcase(corpus)
corpus = b.rem_stopwords(corpus)
corpus = b.lemma(corpus)

t = Tokenizer()
s = t.text_to_word(corpus)
print("word count=", t.word_count(s))
print("number of unique words", t.number_of_unique_words(s))

inp = "autonomous individuals mutual aid self governance"
print("input = ", inp)
print("bag of words = ", t.bag_of_words(inp, s))