Ejemplos de process_word en Python

Lenguaje de programación: Python

Namespace/Package Name: functions.base

Método / Función: process_word

Ejemplos en hotexamples.com: 3

Python process_word - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de functions.base.process_word extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

    def spacy_tokenizer(self, review):
        tokens = []
        tags = []

        processed = self.nlp(self.data[review]['Content'])

        for word in processed:
            if self.features in [1, 2]:
                tokens.append(process_word(word.lower_))
                tags.append((process_word(word.lower_), word.tag_))
            else:
                tokens.append(word.lower_)
                tags.append((word.lower_, word.tag_))

        if self.features in [2, 3]:
            tags = self.ngrams(tokens, tags)

        return tokens, tags

Ejemplo n.º 2

Mostrar archivo

    def whitespace_tokenizer(self, review):
        tokenizer = WhitespaceTokenizer()
        if self.features in [1, 2]:
            tokens = [
                process_word(word.lower())
                for word in tokenizer.tokenize(self.data[review]['Content'])
            ]
        else:
            tokens = [
                word.lower()
                for word in tokenizer.tokenize(self.data[review]['Content'])
            ]

        tags = nltk.pos_tag(tokens)

        return tokens, tags

Ejemplo n.º 3

Mostrar archivo

    def word_tokenizer(self, review):
        if self.features in [1, 2]:
            tokens = [
                process_word(word.lower())
                for word in word_tokenize(self.data[review]['Content'])
            ]
        else:
            tokens = [
                word.lower()
                for word in word_tokenize(self.data[review]['Content'])
            ]

        tags = nltk.pos_tag(tokens)

        if self.features in [2, 3]:
            tags = self.ngrams(tokens, tags)
        return tokens, tags