Python CoreNLPTokenizer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: hotpot.tokenizers

클래스/타입: CoreNLPTokenizer

hotexamples.com에서의 예제들: 4

Python CoreNLPTokenizer - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 hotpot.tokenizers.CoreNLPTokenizer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

CoreNLPTokenizer(4)

자주 사용되는 메소드들

CoreNLPTokenizer (4)

예제 #1

파일 보기

def main(evaluate=False):
    corpus = HotpotQuestions()
    dev_qs = corpus.get_dev()
    train_qs = corpus.get_train()
    tokenizer = CoreNLPTokenizer()

    def tokenize(text):
        return tokenizer.tokenize(text).words()

    if evaluate:
        print("Train:")
        evaluate_question_detector(train_qs, tokenize, FastNormalizedAnswerDetector(), compute_f1s=True)
        print("Dev:")
        evaluate_question_detector(dev_qs, tokenize, FastNormalizedAnswerDetector(), compute_f1s=True)
    else:
        train = compute_answer_spans(train_qs, FastNormalizedAnswerDetector(), tokenize)
        dev = compute_answer_spans(dev_qs, FastNormalizedAnswerDetector(), tokenize)
        HotpotQuestions.make_corpus(train, dev)

예제 #2

파일 보기

파일: build_drqa_doc.py 프로젝트: sjliu0920/MUPPET

def init():
    global PROCESS_TOK
    PROCESS_TOK = CoreNLPTokenizer()
    Finalize(PROCESS_TOK, PROCESS_TOK.shutdown, exitpriority=100)

예제 #3

파일 보기

def init():
    global PROCESS_TOK, PROCESS_DB
    PROCESS_TOK = CoreNLPTokenizer()
    Finalize(PROCESS_TOK, PROCESS_TOK.shutdown, exitpriority=100)
    PROCESS_DB = DocDB()
    Finalize(PROCESS_DB, PROCESS_DB.close, exitpriority=100)

예제 #4

파일 보기

def init_encoding_handler(encoding_dir):
    global DOC_ENCS_HANDLER, PROCESS_TOK
    DOC_ENCS_HANDLER = DocumentEncodingHandler(encoding_dir)
    PROCESS_TOK = CoreNLPTokenizer()
    Finalize(PROCESS_TOK, PROCESS_TOK.shutdown, exitpriority=100)