Python _find_match示例

编程语言: Python

命名空间/包名称: torchtext.data.datasets_utils

方法/功能: _find_match

hotexamples.com的示例: 5

Python _find_match - 已找到5个示例。这些是从开源项目中提取的最受好评的torchtext.data.datasets_utils._find_match现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def UDPOS(root, split):
    dataset_tar = download_from_url(URL, root=root, hash_value=MD5, hash_type='md5')
    extracted_files = extract_archive(dataset_tar)
    if split == 'valid':
        path = _find_match("dev.txt", extracted_files)
    else:
        path = _find_match(split + ".txt", extracted_files)
    return _RawTextIterableDataset(DATASET_NAME, NUM_LINES[split],
                                   _create_data_from_iob(path))

示例#2

显示文件

def WikiText103(root, split):
    dataset_tar = download_from_url(URL, root=root, hash_value=MD5, hash_type='md5')
    extracted_files = extract_archive(dataset_tar)

    path = _find_match(split, extracted_files)
    logging.info('Creating {} data'.format(split))
    return _RawTextIterableDataset('WikiText103',
                                   NUM_LINES[split], iter(io.open(path, encoding="utf8")))

示例#3

显示文件

def WikiText2(root, split):
    dataset_tar = download_from_url(URL,
                                    root=root,
                                    hash_value=MD5,
                                    hash_type='md5')
    extracted_files = extract_archive(dataset_tar)
    path = _find_match(split, extracted_files)
    logging.info('Creating {} data'.format(split))
    return _RawTextIterableDataset(DATASET_NAME, NUM_LINES[split],
                                   _read_text_iterator(path))

示例#4

显示文件

文件： dbpedia.py 项目： isabella232/text-3

def DBpedia(root, split):
    dataset_tar = download_from_url(URL,
                                    root=root,
                                    path=os.path.join(root, _PATH),
                                    hash_value=MD5,
                                    hash_type='md5')
    extracted_files = extract_archive(dataset_tar)

    path = _find_match(split + '.csv', extracted_files)
    return _RawTextIterableDataset(DATASET_NAME, NUM_LINES[split],
                                   _create_data_from_csv(path))

示例#5

显示文件

def DBpedia(root, split):
    def _create_data_from_csv(data_path):
        with io.open(data_path, encoding="utf8") as f:
            reader = unicode_csv_reader(f)
            for row in reader:
                yield int(row[0]), ' '.join(row[1:])

    dataset_tar = download_from_url(URL,
                                    root=root,
                                    path=os.path.join(root, _PATH),
                                    hash_value=MD5,
                                    hash_type='md5')
    extracted_files = extract_archive(dataset_tar)

    path = _find_match(split + '.csv', extracted_files)
    return _RawTextIterableDataset("DBpedia", NUM_LINES[split],
                                   _create_data_from_csv(path))