Python MatchVariables.transform 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: feature_engine.preprocessing

클래스/타입: MatchVariables

메소드/함수: transform

hotexamples.com에서의 예제들: 5

Python MatchVariables.transform - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 feature_engine.preprocessing.MatchVariables.transform에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MatchVariables(8)

transform(5)

fit(4)

자주 사용되는 메소드들

MatchVariables (8)

transform (5)

fit (4)

예제 #1

파일 보기

def test_raises_error_if_na_in_df(df_na, df_vartypes):
    # when dataset contains na, fit method
    with pytest.raises(ValueError):
        transformer = MatchVariables()
        transformer.fit(df_na)

    # when dataset contains na, transform method
    with pytest.raises(ValueError):
        transformer = MatchVariables()
        transformer.fit(df_vartypes)
        transformer.transform(df_na)

예제 #2

파일 보기

def test_verbose_print_out(capfd, df_vartypes, df_na):

    match_columns = MatchVariables(missing_values="ignore", verbose=True)

    train = df_na.copy()
    train.loc[:, "new_variable"] = 5

    match_columns.fit(train)
    match_columns.transform(df_vartypes)

    out, err = capfd.readouterr()
    assert (out == "The following variables are added to the DataFrame: "
            "['new_variable', 'Studies']\n"
            or out == "The following variables are added to the DataFrame: "
            "['Studies', 'new_variable']\n")

    match_columns.fit(df_vartypes)
    match_columns.transform(train)

    out, err = capfd.readouterr()
    assert (out == "The following variables are dropped from the DataFrame: "
            "['new_variable', 'Studies']\n" or out
            == "The following variables are dropped from the DataFrame: "
            "['Studies', 'new_variable']\n")

예제 #3

파일 보기

def test_drop_and_add_columns(fill_value, expected_studies, expected_age,
                              df_vartypes, df_na):
    train = df_na.copy()
    test = df_vartypes.copy()
    test = test.drop("Age", axis=1)  # to add more than one column

    # adding columns to test if they are removed
    for new_col in ["test1", "test2"]:
        test.loc[:, new_col] = new_col

    match_columns = MatchVariables(
        fill_value=fill_value,
        missing_values="ignore",
    )
    match_columns.fit(train)

    transformed_df = match_columns.transform(test)

    expected_result = pd.DataFrame({
        "Name": ["tom", "nick", "krish", "jack"],
        "City": ["London", "Manchester", "Liverpool", "Bristol"],
        "Studies":
        expected_studies,
        "Age":
        expected_age,
        "Marks": [0.9, 0.8, 0.7, 0.6],
        "dob":
        pd.date_range("2020-02-24", periods=4, freq="T"),
    })

    # test init params
    if fill_value is np.nan:
        assert match_columns.fill_value is np.nan
    else:
        assert match_columns.fill_value == fill_value
    assert match_columns.verbose is True
    assert match_columns.missing_values == "ignore"
    # test fit attrs
    assert list(match_columns.input_features_) == list(train.columns)
    assert match_columns.n_features_in_ == 6
    # test transform output
    pd.testing.assert_frame_equal(expected_result, transformed_df)

예제 #4

파일 보기

def test_drop_columns_when_more_columns_in_test_than_train(df_vartypes, df_na):
    train = df_vartypes.copy()
    train = train.drop("City", axis=1)  # to remove more than one column
    test = df_na.copy()

    match_columns = MatchVariables(missing_values="ignore")
    match_columns.fit(train)

    transformed_df = match_columns.transform(test)

    expected_result = test.drop(columns=["Studies", "City"])

    # test init params
    assert match_columns.fill_value is np.nan
    assert match_columns.verbose is True
    assert match_columns.missing_values == "ignore"
    # test fit attrs
    assert list(match_columns.input_features_) == list(train.columns)
    assert match_columns.n_features_in_ == 4
    # test transform output
    pd.testing.assert_frame_equal(expected_result, transformed_df)

예제 #5

파일 보기

def test_non_fitted_error(df_vartypes):
    with pytest.raises(NotFittedError):
        transformer = MatchVariables()
        transformer.transform(df_vartypes)