Python Preprocessor.get_rnn_format 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: preprocessing

클래스/타입: Preprocessor

메소드/함수: get_rnn_format

hotexamples.com에서의 예제들: 2

Python Preprocessor.get_rnn_format - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 preprocessing.Preprocessor.get_rnn_format에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Preprocessor(21)

preprocess(4)

is_null_present(4)

impute_missing_values(4)

get_columns_with_zero_std_deviation(4)

from_json(3)

fit_transform(3)

exposure_equalization(2)

preprocess_image(2)

import_labeled_data(2)

get_version(2)

getDatasetSize(2)

get_rnn_format(2)

triple_intervals(2)

displayImage(2)

apply_pca(2)

encode_labels(2)

preprocess_images(1)

makeW2Vfile(1)

preprocess_raw_data(1)

inverse_transform_lemmas(1)

inverse_transform_morph(1)

inverse_transform_pos(1)

add_branch(1)

lemmatize_all_patterns(1)

loadDataset(1)

load_transformer(1)

merge(1)

_divide_data(1)

mutual_info_select(1)

inverse_transform_labels(1)

poetic_preprocessing(1)

prepare_nn_entries(1)

_preprocess_data(1)

preprocessComment(1)

preprocessComments(1)

preprocess_data(1)

preprocess_file(1)

path(1)

execute(1)

inv_perspective_transform(1)

get_dataset_paths(1)

find_signals(1)

fit(1)

create_data_loaders(1)

generateFixedLength(1)

getBatch(1)

convert_color(1)

getXVectorData(1)

get_classification_data(1)

예제 #1

파일 보기

parser.add_argument('batch_size', type=int)
opts = parser.parse_args(sys.argv[1:])

filename = os.path.join("output", opts.label + ".json")
if not os.path.exists(filename):
    parser.error("Could not find JSON preprocessed data: %s" % filename)

# De-serialize preprocessor
with open(filename, "r") as this_file:
    json_txt = this_file.read()
pre = Preprocessor()
pre.from_json(json_txt)

# Reshape input based on model type
if opts.model_name[0:4] == "LSTM":
    xdata1, ydata1, xdata2, ydata2 = pre.get_rnn_format()
    x_all = np.concatenate([xdata1, xdata2])
    y_all = np.concatenate([ydata1, ydata2])
elif opts.model_name[0:4] == "DENS":
    x_all = np.concatenate([pre.x_train, pre.x_test])
    y_all = np.concatenate([pre.y_train, pre.y_test])
else:
    raise ValueError("Unknown network type: %s" % opts.model_name[0:4])

# Fetch the model, just take the first "fold" since we need
# only one model now
model_dict = models.generate_models(pre)
model = model_dict[opts.model_name][0]

# Setup early stopping...
callbacks = [

예제 #2

파일 보기

def main():
    """Main entry point"""

    # Unclear why this is needed but I get BLAS errors otherwise
    physical_devices = tf.config.list_physical_devices('GPU')
    tf.config.experimental.set_memory_growth(physical_devices[0], True)

    # Valiate command line args
    parser = argparse.ArgumentParser(
        description="Fit and evaluate all models in `models.py`")
    parser.add_argument('label')
    parser.add_argument('epochs', type=int)
    parser.add_argument('batch_size', type=int)
    opts = parser.parse_args(sys.argv[1:])
    filename = os.path.join("output", opts.label+".json")

    if not os.path.exists(filename):
        parser.error("Could not find JSON preprocessed data: %s" % filename)

    # Create image output directory if it doesn't exist
    if not os.path.exists("images"):
        os.mkdir("images")

    # De-serialize preprocessor
    with open(filename, "r") as this_file:
        json_txt = this_file.read()
    pre_proc = Preprocessor()
    pre_proc.from_json(json_txt)

    # Create the models
    models_dict = models.generate_models(pre_proc)

    # Fitting with cross-validation
    kfolds = KFold(n_splits=models.K_FOLDS)
    results = {}

    # Loop over all models...
    for model_name, fold_models in models_dict.items():

        # Reshape X based on model type... standard neural networks
        # take a different shape than LSTM and have an additional input
        # for position in vector. This is handled automatically for LSTM
        # networks.
        if model_name[0:4] == "DENS":
            x_data = pre_proc.x_train
            y_data = pre_proc.y_train
        elif model_name[0:4] == "LSTM":
            x_data, y_data, _, _ = pre_proc.get_rnn_format()
        else:
            raise ValueError("Uknown model prefix: %s" % model_name[0:4])

        begin_time = time.time()
        train_err = []
        val_err = []
        history = []

        model_idx = 0
        for train_idx, val_idx in kfolds.split(x_data, y_data):

            # Grab the model for this fold
            model = fold_models[model_idx]

            train_dataset = tf.data.Dataset.from_tensor_slices((
                tf.cast(x_data[train_idx], tf.float32),
                tf.cast(y_data[train_idx], tf.float32),
            ))
            train_dataset = train_dataset.batch(opts.batch_size)

            val_dataset = tf.data.Dataset.from_tensor_slices((
                tf.cast(x_data[val_idx], tf.float32),
                tf.cast(y_data[val_idx], tf.float32),
            ))
            val_dataset = val_dataset.batch(opts.batch_size)

            # No suffle, already done
            hist = model.fit(
                        x=train_dataset,
                        epochs=opts.epochs,
                        shuffle=False,              # Shuffle already done
                        verbose=0,
                        callbacks=callbacks,
                        validation_data=val_dataset,
                        )

            # Story history and cycle to next fold
            history.append(hist)
            train_err.append(hist.history['loss'][-1])
            val_err.append(hist.history['val_loss'][-1])
            print("{0:10} {1:7.4f} {2:7.4f}".format(
                        model_name, train_err[-1], val_err[-1]))
            model_idx += 1

        # Done with all the folds
        end_time = time.time()
        fit_time = end_time-begin_time
        print("time: {0:7.2f}".format(fit_time))

        results[model_name] = (np.mean(train_err),
                               np.mean(val_err),
                               fit_time)

        fig = go.Figure()
        for i in range(models.K_FOLDS):
            fig.add_trace(go.Scatter(
                x=[t for t in range(len(history[i].history['loss']))],
                y=history[i].history['loss'],
                name="Train Fold {}".format(i+1),
                mode='lines',
            ))
            fig.add_trace(go.Scatter(
                x=[t for t in range(len(history[i].history['val_loss']))],
                y=history[i].history['val_loss'],
                name="Val Fold {}".format(i+1),
                mode='lines',
            ))

        fig.update_xaxes(title="Epoch")
        fig.update_yaxes(title="Loss")
        plot(fig)

    df_summary = pd.DataFrame(results).transpose()
    df_summary.columns = ['train', 'val', 'time']
    df_summary['labels'] = df_summary.index
    df_summary = df_summary[['labels', 'train', 'val', 'time']]

    outfile = os.path.join("output", "{0}_param_search.csv".format(opts.label))
    df_summary.to_csv(outfile)