Python AveragedPerceptronTagger 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: orangecontrib.text.tag

메소드/함수: AveragedPerceptronTagger

hotexamples.com에서의 예제들: 7

Python AveragedPerceptronTagger - 7개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 orangecontrib.text.tag.AveragedPerceptronTagger에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def setUp(self):
     self.corpus = Corpus.from_file("deerwester")
     self.pp_list = [preprocess.LowercaseTransformer(),
                     preprocess.WordPunctTokenizer(),
                     preprocess.SnowballStemmer(),
                     preprocess.NGrams(),
                     tag.AveragedPerceptronTagger()]

예제 #2

파일 보기

 def test_preprocess(self):
     pr = preprocess.Preprocessor(
         tokenizer=preprocess.RegexpTokenizer('\w+'),
         pos_tagger=tag.AveragedPerceptronTagger())
     corpus = Corpus.from_file('deerwester')
     pr(corpus, inplace=True)
     self.assertIsNotNone(corpus.pos_tags)

예제 #3

파일 보기

파일: test_preprocess.py 프로젝트: larazupan/orange3-text

 def test_reset_pos_tags(self):
     corpus = Corpus.from_file('deerwester')
     tagger = tag.AveragedPerceptronTagger()
     tagged_corpus = tagger(corpus)
     self.assertTrue(len(tagged_corpus.pos_tags))
     tokenizer = preprocess.RegexpTokenizer(pattern=r'\w')
     tokenized_corpus = tokenizer(corpus)
     self.assertFalse(tokenized_corpus.pos_tags)

예제 #4

파일 보기

 def test_POSTagger(self):
     corpus = Corpus.from_file('deerwester')
     tagger = tag.AveragedPerceptronTagger()
     result = tagger.tag_corpus(corpus)
     self.assertTrue(hasattr(result, 'pos_tags'))
     # for token in itertools.chain(*result.tokens):
     #     self.assertRegexpMatches(token, '[a-z]+_[A-Z]+')
     for tokens, tags in zip(result.tokens, result.pos_tags):
         self.assertEqual(len(tokens), len(tags))

예제 #5

파일 보기

파일: test_preprocess.py 프로젝트: larazupan/orange3-text

 def test_pos_filter(self):
     pos_filter = preprocess.PosTagFilter("NN")
     pp_list = [
         preprocess.WordPunctTokenizer(),
         tag.AveragedPerceptronTagger()
     ]
     corpus = self.corpus
     for pp in pp_list:
         corpus = pp(corpus)
     filtered = pos_filter(corpus)
     self.assertTrue(len(filtered.pos_tags))
     self.assertEqual(len(filtered.pos_tags[0]), 5)
     self.assertEqual(len(filtered.tokens[0]), 5)

예제 #6

파일 보기

파일: test_preprocess.py 프로젝트: larazupan/orange3-text

 def test_filter_pos_tags(self):
     pp_list = [
         preprocess.LowercaseTransformer(),
         preprocess.WordPunctTokenizer(),
         tag.AveragedPerceptronTagger(),
         preprocess.StopwordsFilter()
     ]
     corpus = self.corpus
     with corpus.unlocked():
         corpus.metas[0, 0] = "This is the most beautiful day in the world"
     for pp in pp_list:
         corpus = pp(corpus)
     self.assertEqual(len(corpus.tokens), len(corpus.pos_tags))
     self.assertEqual(len(corpus.tokens[0]), len(corpus.pos_tags[0]))
     self.assertEqual(corpus.tokens[0], ["beautiful", "day", "world"])
     self.assertEqual(corpus.pos_tags[0], ["JJ", "NN", "NN"])

예제 #7

파일 보기

파일: test_tags.py 프로젝트: szzyiit/orange3-text

 def setUp(self):
     self.tagger = tag.AveragedPerceptronTagger()
     self.corpus = Corpus.from_file('deerwester')