Python PorterStemmer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: orangecontrib.text.preprocess

메소드/함수: PorterStemmer

hotexamples.com에서의 예제들: 6

Python PorterStemmer - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 orangecontrib.text.preprocess.PorterStemmer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_preprocess.py 프로젝트: zhoubo3666/orange3-text

 def test_call(self):
     word = "Testing"
     tokens = ["Testing", "tokenized", "Sentence"]
     stemmer = preprocess.PorterStemmer()
     self.assertEqual(stemmer(word), self.stemmer(word))
     self.assertEqual(stemmer(tokens),
                      [self.stemmer(token) for token in tokens])

예제 #2

파일 보기

def pre_process(path):
    corpus = orangecontrib.text.Corpus.from_file(path)

    p = preprocess.Preprocessor(
        transformers=[
            preprocess.LowercaseTransformer(),
            preprocess.UrlRemover(),
            preprocess.HtmlTransformer()
        ],
        tokenizer=preprocess.RegexpTokenizer('\w+'),
        normalizer=preprocess.PorterStemmer(),
        filters=[
            preprocess.StopwordsFilter('english'),
            preprocess.RegexpFilter(
                '\.|,|:|;|!|\?|\(|\)|\||\+|\'|\"|‘|’|“|”|\'|\’|…|\-|–|—|\$|&|\*|>|<'
            )
        ])
    return p(corpus)

예제 #3

파일 보기

파일: test_preprocess.py 프로젝트: larazupan/orange3-text

 def test_call_porter(self):
     pp = preprocess.PorterStemmer()
     self.assertFalse(self.corpus.has_tokens())
     corpus = pp(self.corpus)
     self.assertTrue(corpus.has_tokens())
     self.assertEqual(len(corpus.used_preprocessor.preprocessors), 2)

예제 #4

파일 보기

파일: test_preprocess.py 프로젝트: larazupan/orange3-text

 def test_str(self):
     stemmer = preprocess.PorterStemmer()
     self.assertEqual('Porter Stemmer', str(stemmer))

예제 #5

파일 보기

파일: test_preprocess.py 프로젝트: zhoubo3666/orange3-text

 def test_porter_with_bad_input(self):
     stemmer = preprocess.PorterStemmer()
     self.assertRaises(TypeError, stemmer, 10)

예제 #6

파일 보기

파일: test_preprocess.py 프로젝트: zhoubo3666/orange3-text

    def test_str(self):
        stemmer = preprocess.PorterStemmer()
        self.assertIn('porter', str(stemmer).lower())

        stemmer = preprocess.SnowballStemmer('french')
        self.assertIn('french', str(stemmer).lower())