Python SentenceReader 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: corpusreader.tokenreaders

클래스/타입: SentenceReader

hotexamples.com에서의 예제들: 4

Python SentenceReader - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 corpusreader.tokenreaders.SentenceReader에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

SentenceReader(2)

read(2)

예제 #1

파일 보기

class CorpusReader(BaseReader):
    def __init__(self, token_reader: BaseReader, linesep: str=os.linesep):
        super().__init__(linesep=linesep)
        self.token_reader = token_reader
        self.sentence_parser = SentenceReader(self.token_reader)

    def read(self, text: str):
        # it parses the whole(!) analysed corpus
        sentences = list()
        for line in text.split(self.linesep):
            if len(line) > 0:
                sentences.append(self.sentence_parser.read(line))
        paragraph = Paragraph(sentences)
        document = Document()
        document.append(paragraph)
        return document

예제 #2

파일 보기

class HunPosCorpusReader(BaseReader):
    # Ugyan olyan reader, mint a CorpusReader, csak más a kódolás és a szeparátor.
    # Célszerű lenne úgy refaktorálni, hogy egy paraméterezhető Corpusreader legyen.
    def __init__(self):
        super().__init__(encoding="ISO-8859-2")
        self.word_parser = TaggedTokenReader("\t")
        self.sentence_parser = SentenceReader(self.word_parser, self.linesep)

    def read(self, text: str):
        sentences = list()
        for sent in text.split(self.linesep + self.linesep):
            if len(sent)-1 > 0:
                sentences.append(self.sentence_parser.read(sent))
        paragraph = Paragraph(sentences)
        document = Document()
        document.append(paragraph)
        return document

예제 #3

파일 보기

 def __init__(self):
     super().__init__(encoding="ISO-8859-2")
     self.word_parser = TaggedTokenReader("\t")
     self.sentence_parser = SentenceReader(self.word_parser, self.linesep)

예제 #4

파일 보기

 def __init__(self, token_reader: BaseReader, linesep: str=os.linesep):
     super().__init__(linesep=linesep)
     self.token_reader = token_reader
     self.sentence_parser = SentenceReader(self.token_reader)