Python split_train_val_data示例

编程语言: Python

命名空间/包名称: module_functions.make_data

方法/功能: split_train_val_data

hotexamples.com的示例: 5

Python split_train_val_data - 已找到5个示例。这些是从开源项目中提取的最受好评的module_functions.make_data.split_train_val_data现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： test_fit_predict_model.py 项目： made-ml-in-prod-2021/lainer991

def test_train_model(dataset_path: str, target_name: str, conf_path: str):
    training_pipeline_params = read_training_pipeline_params(conf_path)

    data = read_data(dataset_path)
    X, y = extract_target(data, target_name)
    X_transformed = full_transform(X)
    X_train, X_test, y_train, y_test = split_train_val_data(
        X_transformed, y, training_pipeline_params.splitting_params)
    model = train_model(X_train, y_train,
                        training_pipeline_params.train_params)
    assert isinstance(model, LogisticRegression)

示例#2

显示文件

文件： test_make_data.py 项目： made-ml-in-prod-2021/lainer991

def test_split_train_val_data(dataset_path: str, target_name: str,
                              conf_path: str):
    training_pipeline_params = read_training_pipeline_params(conf_path)

    data = read_data(dataset_path)
    X, y = extract_target(data, target_name)
    X_train, X_test, y_train, y_test = split_train_val_data(
        X, y, training_pipeline_params.splitting_params)
    assert len(X_train) > 0
    assert len(X_test) > 0
    assert len(y_train) > 0
    assert len(y_test) > 0

示例#3

显示文件

文件： test_fit_predict_model.py 项目： made-ml-in-prod-2021/lainer991

def test_predict_model(dataset_path: str, target_name: str, conf_path: str):
    training_pipeline_params = read_training_pipeline_params(conf_path)

    data = read_data(dataset_path)
    X, y = extract_target(data, target_name)
    X_transformed = full_transform(X)
    X_train, X_test, y_train, y_test = split_train_val_data(
        X_transformed, y, training_pipeline_params.splitting_params)

    model = train_model(X_train, y_train,
                        training_pipeline_params.train_params)
    pred_labels, pred_proba = predict_model(model, X_test)
    assert len(set(pred_labels)) == 2
    assert max(pred_proba) < 1

示例#4

显示文件

def test_train_pipeline(dataset_path: str, target_name: str, conf_path: str):
    training_pipeline_params = read_training_pipeline_params(conf_path)

    data = read_data(dataset_path)
    X, y = extract_target(data, target_name)
    X_transformed = full_transform(X)
    X_train, X_test, y_train, y_test = split_train_val_data(
        X_transformed, y, training_pipeline_params.splitting_params)
    model = train_model(X_train, y_train,
                        training_pipeline_params.train_params)
    pred_labels, pred_proba = predict_model(model, X_test)

    res = evaluate_model(y_test, pred_labels, pred_proba)
    assert res['accuracy'] > 0
    assert res['roc_auc_score'] > 0.5

示例#5

显示文件

文件： train_pipeline.py 项目： made-ml-in-prod-2021/lainer991

def train_pipeline_run(training_pipeline_params):
    logger.info(f"Start training pipeline")
    data = read_data(training_pipeline_params.input_data_path)
    X, y = extract_target(data, training_pipeline_params.target_name)
    logger.info(f"X and y shape is {X.shape, y.shape}")

    X_transformed = full_transform(X)
    X_train, X_test, y_train, y_test = split_train_val_data(
        X_transformed, y, training_pipeline_params.splitting_params)

    model = train_model(X_train, y_train,
                        training_pipeline_params.train_params)
    dump_model(training_pipeline_params.dump_model, model)
    logger.info(f"model fitted and dumped")

    pred_labels, pred_proba = predict_model(model, X_test)
    res = evaluate_model(y_test, pred_labels, pred_proba)

    logger.info(f"metrics is {res}")