Python RichStringTokenizer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nazca.utils.tokenizer

클래스/타입: RichStringTokenizer

hotexamples.com에서의 예제들: 3

Python RichStringTokenizer - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nazca.utils.tokenizer.RichStringTokenizer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

find_sentences(2)

load_text(1)

예제 #1

파일 보기

파일: test_tokenizer.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_richstringtokenizer_loadtext(self):
     text = "Hello everyone, this is   me speaking. And me."
     tokenizer = RichStringTokenizer(text, token_min_size=1, token_max_size=3)
     tokens = list(tokenizer)
     self.assertEqual(len(tokens), 18)
     tokenizer.load_text("Hello everyone")
     tokens = list(tokenizer)
     self.assertEqual(len(tokens), 3)

예제 #2

파일 보기

파일: test_tokenizer.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_richstringtokenizer_sentences(self):
     text = "Hello everyone, this is   me speaking. And me ! Why not me ? Blup"
     tokenizer = RichStringTokenizer(text, token_min_size=1, token_max_size=4)
     sentences = tokenizer.find_sentences(text)
     self.assertEqual(len(sentences), 4)
     self.assertEqual(text[sentences[0].start : sentences[0].end], "Hello everyone, this is   me speaking.")
     self.assertEqual(text[sentences[1].start : sentences[1].end], "And me !")
     self.assertEqual(text[sentences[2].start : sentences[2].end], "Why not me ?")
     self.assertEqual(text[sentences[3].start : sentences[3].end], "Blup")

예제 #3

파일 보기

파일: test_tokenizer.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_find_sentences(self):
     text = "Hello everyone, this is   me speaking. And me."
     sentences = RichStringTokenizer.find_sentences(text)
     self.assertEqual(sentences[0], Sentence(indice=0, start=0, end=38))
     self.assertEqual(sentences[1], Sentence(indice=1, start=39, end=46))