Python Encoder.encode 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: preprocessy.encoding

클래스/타입: Encoder

메소드/함수: encode

hotexamples.com에서의 예제들: 8

Python Encoder.encode - 8개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 preprocessy.encoding.Encoder.encode에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Encoder(9)

encode(8)

자주 사용되는 메소드들

예제 #1

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_parser():
    train_df = pd.DataFrame({
        "A": [i for i in range(100)],
        "B": ["hello" if i % 2 == 0 else "bye" for i in range(100)],
    })
    params = {"train_df": train_df, "target_label": "C"}
    encoder = Encoder()
    encoder.encode(params=params)
    assert "B" in params["cat_cols"]

예제 #2

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_categorical_encoding():
    train_csv = pd.read_csv("datasets/encoding/testnew.csv")
    params = {
        "train_df": train_csv,
        "target_label": "Price",
        "cat_cols": ["Profession"],
        "one_hot": False,
    }
    encoder = Encoder()
    encoder.encode(params=params)
    assert "ProfessionEncoded" in params["train_df"].columns
    assert params["train_df"]["ProfessionEncoded"][0] == 0

예제 #3

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_ignore_cat_col():
    train_csv = pd.read_csv("datasets/encoding/testnew.csv")
    params = {
        "train_df": train_csv,
        "target_label": "Price",
        "cat_cols": ["Profession"],
        "ord_dict": ord_dict,
        "one_hot": True,
    }
    encoder = Encoder()
    encoder.encode(params=params)
    assert "Profession_HOD" not in params["train_df"].columns

예제 #4

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_one_hot_encoding():
    train_csv = pd.read_csv("datasets/encoding/testnew.csv")
    params = {
        "train_df": train_csv,
        "target_label": "Price",
        "cat_cols": ["Test", "Labels"],
        "ord_dict": ord_dict,
        "one_hot": True,
    }
    encoder = Encoder()
    encoder.encode(params=params)
    assert "Test_Tata" in params["train_df"].columns
    assert params["train_df"]["Test_Tata"][1] == 1

예제 #5

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_empty_weight_mapping():
    train_csv = pd.read_csv("datasets/encoding/testnew.csv")
    train_csv.drop(["Price"], axis=1, inplace=True)
    ord_dict1 = ord_dict.copy()
    ord_dict1["Size"] = None
    params = {
        "train_df": train_csv,
        "target_label": "Price",
        "ord_dict": ord_dict1,
    }
    with pytest.raises(ValueError):
        encoder = Encoder()
        encoder.encode(params=params)

예제 #6

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_mapping():
    train_csv = pd.read_csv("datasets/encoding/testnew.csv")
    train_csv.drop(["Price"], axis=1, inplace=True)
    params = {
        "train_df": train_csv,
        "target_label": "Price",
        "ord_dict": ord_dict,
    }
    encoder = Encoder()
    encoder.encode(params=params)
    assert params["train_df"]["ProfessionEncoded"].nunique() == 3
    assert params["train_df"]["ProfessionEncoded"][2] == 3
    assert Counter(params["ord_dict"]["Profession"].values()) == Counter(
        params["train_df"]["ProfessionEncoded"].unique())

예제 #7

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_target_label_warning():
    train_csv = pd.read_csv("datasets/encoding/testnew.csv")
    params = {"train_df": train_csv, "ord_dict": ord_dict}
    with pytest.warns(UserWarning):
        encoder = Encoder()
        encoder.encode(params=params)

예제 #8

0

파일 보기

파일: test_encode.py 프로젝트: Saif807380/preprocessy

def test_empty_df():
    params = {"target_label": "Price", "ord_dict": ord_dict}
    with pytest.raises(ValueError):
        encoder = Encoder()
        encoder.encode(params=params)