Python Dataset.create_dataset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: data

클래스/타입: Dataset

메소드/함수: create_dataset

hotexamples.com에서의 예제들: 3

Python Dataset.create_dataset - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 data.Dataset.create_dataset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Dataset(30)

load(11)

load_dataset(5)

batcher(5)

initialize(4)

from_csv(3)

__init__(3)

GetDatafromDict(3)

create_dataset(3)

get_batch(2)

from_openml(2)

generator(2)

get_all_sequences_in_memory(2)

get_train_validation_batch(2)

get_buffer_size(2)

get_dataset(2)

get_vocab(2)

inverse_transform(2)

load_all_images(2)

load_data(2)

create_peptide(2)

get(2)

change_to_Doc2Vec(2)

calculate_observable_rate_bounds(2)

calculate_observable_protection_factors(2)

clean(1)

get_iterator(1)

get_next_batch(1)

get_test_and_valid_data_loaders_map(1)

get_test_batch(1)

get_test_data(1)

get_test_dataloader(1)

get_tokenizer(1)

get_train_batch(1)

get_train_dataloader(1)

batch_num(1)

get_validation_batch(1)

get_image_matrix_rgb(1)

batch(1)

imagefiles2arrs(1)

init_dataset(1)

add_cmd_arguments(1)

add_child(1)

label_vocab(1)

_loadorg_images(1)

__len__(1)

__getitem__(1)

KittiData(1)

get_images_list(1)

get_dev_dataloader(1)

예제 #1

파일 보기

파일: train.py 프로젝트: domcharrier/tensorflow_benchmark

def main(epochs, buffer_size, batch_size, train_mode, 
        distribution_strategy, num_gpus,
        workers, w_type, w_index):


    strategy = get_distribution_strategy(strategy=distribution_strategy, num_gpus=num_gpus, workers=workers, typ=w_type, index=w_index)
    print_msg ('Number of devices: {}'.format(strategy.num_replicas_in_sync), 'info')
   
    data_obj = Dataset(batch_size=128)
    train_dataset, test_dataset = data_obj.create_dataset()
    steps_per_epoch = data_obj.get_buffer_size()//(batch_size)
    train_obj = Benchmark(epochs, steps_per_epoch, 'resnet56')

    with strategy.scope():
        # Create and compile model within strategy scope
        train_obj.create_model('resnet56')
        train_obj.compile_model()
        
    print_msg('Training...', 'info')
    train_obj.run(train_dataset, test_dataset, train_mode)
    print_msg('Training Done.', 'succ')

예제 #2

파일 보기

파일: train.py 프로젝트: saber5433/tensorflow_benchmark

def main(epochs, buffer_size, batch_size, train_mode, display_every,
         distribution_strategy, num_gpus, workers, w_type, w_index,
         setup_cluster, verbose):

    if verbose: os.environ["TF_CPP_MIN_LOG_LEVEL"] = str(verbose)
    strategy = get_distribution_strategy(strategy=distribution_strategy,
                                         train_mode=train_mode,
                                         num_gpus=num_gpus,
                                         workers=workers,
                                         typ=w_type,
                                         index=w_index,
                                         setup=setup_cluster)
    if num_gpus == 1: num_gpus = strategy.num_replicas_in_sync
    print_msg('Number of devices: {}'.format(num_gpus), 'info')

    data_obj = Dataset(batch_size)
    train_dataset, test_dataset = data_obj.create_dataset()
    steps_per_epoch = data_obj.get_buffer_size() // (batch_size)
    train_obj = Benchmark(epochs, steps_per_epoch, batch_size, display_every,
                          num_gpus, 'resnet56', strategy)

    print_msg('Training...', 'info')
    train_obj.run(train_dataset, test_dataset, train_mode)
    print_msg('Training Done.', 'succ')

예제 #3

파일 보기

    parser = argparse.ArgumentParser()
    parser.add_argument("train", help="training", type=bool)
    parser.add_argument("config", help="config file path", type=str)
    args = parser.parse_args()

    with open(args.config) as f:
        config = yaml.load(f)
        if args.train:
            config = config["train"]
        else:
            config = config["test"]

    if args.train:
        dataset = Dataset(config["source_data_path"],
                          config["target_data_path"])
        en, ko = dataset.create_dataset()
        en_tensor, en_tokenizer, ko_tensor, ko_tokenizer = dataset.load_dataset(
            config["num_words"])
        en_words_count = len(en_tokenizer.word_index) + 1
        ko_words_count = len(ko_tokenizer.word_index) + 1

        train_ds = tf.data.Dataset.from_tensor_slices(
            (en_tensor, ko_tensor)).shuffle(10000).batch(
                config["batch_size"]).prefetch(1024)
        model = Seq2seq(source_words_count=en_words_count,
                        target_words_count=ko_words_count,
                        sos=ko_tokenizer.word_index["<start>"],
                        eos=ko_tokenizer.word_index["<end>"])

        loss_object = tf.keras.losses.SparseCategoricalCrossentropy()
        optimizer = tf.keras.optimizers.Adam()