Python convert_to_unicode 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: raw_bert.tokenization

메소드/함수: convert_to_unicode

hotexamples.com에서의 예제들: 2

Python convert_to_unicode - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 raw_bert.tokenization.convert_to_unicode에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

    def _create_examples(self, f, k):
        """Creates examples for the training and dev sets."""
        (train_x, test_x), (train_y, test_y) = f(k)
        examples_train = []
        for (i, line) in enumerate(train_x):
            guid = "0-0"
            text_a = tokenization.convert_to_unicode(line)
            label = tokenization.convert_to_unicode(str(train_y[i]))
            examples_train.append(
                InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
        examples_dev = []
        # for (i, line) in enumerate(dev_x):

        #   guid = "0-0"
        #   text_a = tokenization.convert_to_unicode(line)
        #   label = tokenization.convert_to_unicode(str(dev_y[i]))
        #   examples_dev.append(
        #       InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
        examples_test = []
        for (i, line) in enumerate(test_x):
            guid = "0-0"
            text_a = tokenization.convert_to_unicode(line)
            label = tokenization.convert_to_unicode(str(test_y[i]))
            examples_test.append(
                InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
        return examples_train, examples_test

예제 #2

파일 보기

파일: extract_features.py 프로젝트: Little-girl-1992/BERT-KGAttributesExtraction

def read_examples(input_file):
    """Read a list of `InputExample`s from an input file."""
    examples = []
    unique_id = 0
    with tf.gfile.GFile(input_file, "r") as reader:
        while True:
            line = tokenization.convert_to_unicode(reader.readline())
            if not line:
                break
            line = line.strip()
            text_a = None
            text_b = None
            m = re.match(r"^(.*) \|\|\| (.*)$", line)
            if m is None:
                text_a = line
            else:
                text_a = m.group(1)
                text_b = m.group(2)
            examples.append(
                InputExample(unique_id=unique_id, text_a=text_a, text_b=text_b))
            unique_id += 1
    return examples