Python RichStringTokenizer.find_sentences 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nazca.utils.tokenizer

클래스/타입: RichStringTokenizer

메소드/함수: find_sentences

hotexamples.com에서의 예제들: 2

Python RichStringTokenizer.find_sentences - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nazca.utils.tokenizer.RichStringTokenizer.find_sentences에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

find_sentences(2)

load_text(1)

자주 사용되는 메소드들

find_sentences (2)

load_text (1)

예제 #1

파일 보기

파일: test_tokenizer.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_richstringtokenizer_sentences(self):
     text = "Hello everyone, this is   me speaking. And me ! Why not me ? Blup"
     tokenizer = RichStringTokenizer(text, token_min_size=1, token_max_size=4)
     sentences = tokenizer.find_sentences(text)
     self.assertEqual(len(sentences), 4)
     self.assertEqual(text[sentences[0].start : sentences[0].end], "Hello everyone, this is   me speaking.")
     self.assertEqual(text[sentences[1].start : sentences[1].end], "And me !")
     self.assertEqual(text[sentences[2].start : sentences[2].end], "Why not me ?")
     self.assertEqual(text[sentences[3].start : sentences[3].end], "Blup")

예제 #2

파일 보기

파일: test_tokenizer.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_find_sentences(self):
     text = "Hello everyone, this is   me speaking. And me."
     sentences = RichStringTokenizer.find_sentences(text)
     self.assertEqual(sentences[0], Sentence(indice=0, start=0, end=38))
     self.assertEqual(sentences[1], Sentence(indice=1, start=39, end=46))