Python DataLoader.load 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils.data_loader

클래스/타입: DataLoader

메소드/함수: load

hotexamples.com에서의 예제들: 3

Python DataLoader.load - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.data_loader.DataLoader.load에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DataLoader(30)

load_data(11)

load_video_views(10)

load_file_as_dataFrame(5)

load_embed_content_dict(5)

dataFrame_to_matrix(4)

load(3)

train_test_split(2)

to_sparse(2)

next_batch(2)

load_train_datasets(2)

load_test_datasets(2)

load_img(2)

load_all_datas(2)

load_all(2)

load_dir_datas(2)

get_dataset_info(2)

get_test_data(1)

load_whole_test(1)

build_example(1)

build_graph(1)

split(1)

send_data_to_clients(1)

read_senses(1)

read_ofds(1)

read_data(1)

process_test_data(1)

process_raw_data(1)

prepare(1)

build_source_graph(1)

make_train_and_test_set(1)

make_dataset(1)

embedded(1)

idx_to_label(1)

flow(1)

get_X_dim(1)

load_test(1)

load_pretrain_datasets(1)

get_Y_dim(1)

get_class_weights(1)

get_data(1)

build_data(1)

get_data_dim(1)

get_data_path(1)

get_dataset(1)

initialize(1)

init_task_dependent_variables(1)

transform_data(1)

예제 #1

파일 보기

파일: process_helper.py 프로젝트: MinhNKB/m1-events-stream

    def run(self):
        start = datetime.now()
        thread_id = start.strftime('%Y%m%d%H%M%S')
        logging.info("Thread %s - %s started" % (thread_id, self.file_path))

        sftp_reader = SFTPReader(self.host, self.port, self.username, self.password,
                                 self.ssh_key_path, self.sftp_max_retry)
        byte_io = sftp_reader.load_file(self.file_path)

        sftp_reader.close()
        step = datetime.now()
        logging.info("Thread %s - %s loaded data - Time: %d" % (thread_id, self.file_path, (step - start).seconds))

        if self.try_send_data:
            data_loader = DataLoader()

            processed_df = data_loader.load(byte_io, self.columns_seletion, fill_na_dict=self.fill_na_dict,
                                            concat_dict=self.concat_dict, rename_dict=self.rename_dict)
            step = datetime.now()
            logging.info("Thread %s - %s parsed data - Time: %d" % (thread_id, self.file_path, (step - start).seconds))

            event_sender = EventSender(self.connection_string, self.eventhub_name, self.max_event_per_batch,
                                       self.eventhub_max_retry, self.metadata, self.zvelo_helper)
            event_sender.send(processed_df)
            event_sender.close()

            step = datetime.now()
            logging.info("Thread %s - %s sent data - Time: %d" % (thread_id, self.file_path, (step - start).seconds))

        # Copy raw data to ADLS
        if (not self.blob_name == False) or (not self.blob_key == False):
            blob_helper = BlobHelper(self.blob_name, self.blob_key)
            file_name = self.file_path[self.file_path.rindex("/") + 1 : ]
            blob_path = "%s/%s" % (self.blob_path, file_name)
            byte_io.seek(0)
            blob_helper.upload_data(byte_io, self.blob_container, blob_path, overwrite=True)

        step = datetime.now()
        logging.info("Thread %s - %s stopped - Time: %d" % (thread_id, self.file_path, (step - start).seconds))

예제 #2

파일 보기

파일: train.py 프로젝트: leospecial/induction-network

parser.add_argument('--file_path', type=str, default='./data/source.pt')
parser.add_argument('--train_epochs', type=int, default=10000)
parser.add_argument('--lr', default=0.01)
parser.add_argument('--momentum', default=0.9)

args = parser.parse_args()

logging.basicConfig(
    level='INFO',
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')

logging.info('{}-way, {}-shot'.format(args.n_way, args.k_shot))

# prepare data
data_loader = DataLoader()
data_loader.load(args.file_path)
embedding = data_loader.embedded(vocab_size=args.vocab_size,
                                 embedding_size=args.embedding_size)
# model
model = EncoderInductionRelation(vocab_size=args.vocab_size,
                                 embedding_size=args.embedding_size,
                                 class_num=args.n_way,
                                 hidden_size=args.hidden_size,
                                 embedding=embedding)
# optimize
loss_f = nn.MSELoss()
optimize = optim.SGD(model.parameters(), lr=args.lr, momentum=args.momentum)

# train
training_loss = 0
for epoch in range(args.train_epochs):

예제 #3

파일 보기

파일: crf_train.py 프로젝트: hoangperry/POS-Tagger

    return [token for token, tag in sent]


def crf_extract_feature_train(_data_train, _data_test):
    _x_train = [get_features(s) for s in _data_train]
    _y_train = [get_tags(s) for s in _data_train]

    _x_test = [get_features(s) for s in _data_test]
    _y_test = [get_tags(s) for s in _data_test]

    return _x_train, _y_train, _x_test, _y_test


if __name__ == '__main__':
    dloader = DataLoader('./data/')
    dloader.load()

    if mini_data:
        dt_train, dt_test = dloader.transform_data(
            sub_train=1000,
            sub_test=100
        )
    else:
        dt_train, dt_test = dloader.transform_data()

    x_train, y_train, x_test, y_test = crf_extract_feature_train(dt_train, dt_test)

    crf = sklearn_crfsuite.CRF(
        algorithm='lbfgs',
        c1=0.1,
        c2=0.1,