Python splitter 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nltk

메소드/함수: splitter

hotexamples.com에서의 예제들: 4

Python splitter - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nltk.splitter에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: TransformerDocumentEncoders.py 프로젝트: JordiCarreraVentura/assignment

 def transform(self, X, Y=None):
     success, _X = self.from_cache(X)
     if not success:
         _X = []
         for document in X:
             sents = splitter(document)
             blocks, block = [], []
             while sents:
                 sent = sents.pop(0)
                 block.append(sent)
                 if len(block) == self.block_size:
                     blocks.append(' '.join(block))
                     block = []
             blocks.append(' '.join(block))
             encoded_blocks = self.model.encode(blocks)
             doc_vecs = pooling(
                 encoded_blocks,
                 (encoded_blocks.shape[0], 1),
                 method='avg'
             )
             _X.append(list(doc_vecs)[0])
         self.to_cache(X, _X)
     if Y:
         return np.array(_X), Y
     else:
         return np.array(_X)

예제 #2

파일 보기

파일: FeatureExtraction.py 프로젝트: JordiCarreraVentura/assignment

    def __call__(self, x):
        bow = []
        for sent in splitter(x):
            for i, token in enumerate(tokenizer(sent)):

                if self.remove_nonalpha and not token.isalpha():
                    continue

                if (self.remove_entities and i
                        and token[0] != token[0].lower()):
                    continue

                if (self.remove_stopwords and token.lower() in STOPWORDS):
                    continue

                bow.append(token if not self.lowercase else token.lower())

        _bow = []
        prev = None
        while bow:
            token = bow.pop(0)
            if token == prev:
                continue
            _bow.append(token)
            prev = token

        return ' '.join(_bow)

예제 #3

파일 보기

파일: TransformerDocumentEncoders.py 프로젝트: JordiCarreraVentura/assignment

 def transform(self, X, Y=None):
     success, _X = self.from_cache(X)
     if not success:
         _X = []
         for document in X:
             sents = splitter(document)
             encoded_sents = self.model.encode(sents)
             doc_vecs = pooling(
                 encoded_sents,
                 (encoded_sents.shape[0], 1),
                 method='mdn'
             )
             _X.append(list(doc_vecs)[0])
         self.to_cache(X, _X)
     if Y:
         return np.array(_X), Y
     else:
         return np.array(_X)

예제 #4

파일 보기

def title(X, docid):
    return splitter(X[docid])[0]
    return '%s...' % X[docid][:90]