Python is_punctuation 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: gigacluster

메소드/함수: is_punctuation

hotexamples.com에서의 예제들: 2

Python is_punctuation - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 gigacluster.is_punctuation에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: find_subsequences.py 프로젝트: pombredanne/gigacluster

def get_block_lines(s, t):
    lines = []
    s_tokens = [(index, i) for index, i in enumerate(s) if not is_punctuation(i)]
    t_tokens = [(index, i) for index, i in enumerate(t) if not is_punctuation(i)]
    if len(s_tokens) < 5 and len(t_tokens) < 5:
        return lines
    # Try matching.
    s_lemmas = lemma_sequence(i[1] for i in s_tokens)
    t_lemmas = lemma_sequence(i[1] for i in t_tokens)
    matcher.set_seqs(s_lemmas, t_lemmas)
    s_tokens_start = s_tokens_stop = t_tokens_start = t_tokens_stop = 0
    for block_type, s_start, s_stop, t_start, t_stop in iter_blocks(s_lemmas, t_lemmas, matcher.get_matching_blocks()):
        s_slice = s_tokens[s_start:s_stop]
        t_slice = t_tokens[t_start:t_stop]
        s_text = " ".join(i[1] for i in s_slice)
        t_text = " ".join(i[1] for i in t_slice)
        if block_type == NON_MATCH:
            s_text = green(s_text)
            t_text = red(t_text)
            text = "{}\t{}".format(s_text, t_text)
        else:
            text = s_text
        # Calculate real offsets, including punctuation.
        if s_slice:
            s_tokens_start = s_slice[0][0]
            s_tokens_stop = s_slice[-1][0] + 1
        if t_slice:
            t_tokens_start = t_slice[0][0]
            t_tokens_stop = t_slice[-1][0] + 1
        lines.append(
            "{}\t{}\t{}\t{}\t{}\t{}".format(
                block_type, s_tokens_start, s_tokens_stop, t_tokens_start, t_tokens_stop, text
            )
        )
        s_tokens_start = s_tokens_stop
        t_tokens_start = t_tokens_stop
    return lines

예제 #2

파일 보기

파일: find_stem_subsets.py 프로젝트: schwa-lab/gigacluster

def first_norm(s):
    return [tok.lower() for tok in s if not is_punctuation(tok)]