Python FilterWords 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: langtools.classify.FilterWords

클래스/타입: FilterWords

hotexamples.com에서의 예제들: 2

Python FilterWords - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 langtools.classify.FilterWords.FilterWords에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

filtered_words(1)

예제 #1

파일 보기

파일: TextTranslation.py 프로젝트: peterFran/LanguageListCreator

    def __init__(self, chapter):
        """

        :param chapter:
        """
        self.text = chapter

        # Tokenize the text
        tokenizer = RegexpTokenizer(r'\w+')
        self.token_words = tokenizer.tokenize(self.text)

        # Get verbs nouns etc
        self.tagger = FilterWords(self.token_words)

        # Get translator object
        self.translator = SpanishTranslator()

예제 #2

파일 보기

파일: TextTranslation.py 프로젝트: peterFran/LanguageListCreator

class TextTranslation(object):
    """docstring for ClassName"""

    def __init__(self, chapter):
        """

        :param chapter:
        """
        self.text = chapter

        # Tokenize the text
        tokenizer = RegexpTokenizer(r'\w+')
        self.token_words = tokenizer.tokenize(self.text)

        # Get verbs nouns etc
        self.tagger = FilterWords(self.token_words)

        # Get translator object
        self.translator = SpanishTranslator()

    def translate_n_words(self, number_words, ordered_tokens):
        """

        :param number_words:
        :param ordered_tokens:
        :return:
        """
        index = 0
        word_list = []
        # Loop over the words in sorted dict
        for word in ordered_tokens:
            # If we haven't got enough words yet
            if index < number_words:
                # try to get a translation
                attempted = self.translator.translate_word(word[0])
                # if it works, add it to the list to be returned
                if attempted is not None:
                    attempted['Count'] = word[1]
                    word_list.append(attempted)
                    index += 1
            else:
                break
        return word_list

    def get(self, number_words=-1, start=0, types=[], ordered=False, translate=False, reverse=False):
        """

        :param number_words:
        :param types:
        :param translate:
        :param reverse:
        :return:
        """

        words = self.tagger.filtered_words(types)
        if number_words == -1:
            number_words = len(words)

        if ordered is True:
            tagged_words = Counter(words).most_common()
        else:
            tagged_words = OrderedDict.fromkeys(words, 1).items()

        if reverse is True:
            tagged_words.reverse()

        if translate is True:
            tagged_words_list = list(islice(tagged_words, start, number_words + start))
            return self.translate_n_words(number_words, tagged_words_list)
        else:
            try:
                return [{'Word': word[0], 'Count': word[1]} for word in tagged_words][start:number_words + start]
            except IndexError as i:
                #
                return [{'Word': word[0], 'Count': word[1]} for word in tagged_words][start:]