Python TimeGapSplit示例

编程语言: Python

命名空间/包名称: sklego.model_selection

类/类型: TimeGapSplit

hotexamples.com的示例: 9

Python TimeGapSplit - 已找到9个示例。这些是从开源项目中提取的最受好评的sklego.model_selection.TimeGapSplit现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

TimeGapSplit(9)

split(5)

summary(1)

示例#1

显示文件

def test_timegapsplit_using_splits():
    cv = TimeGapSplit(date_serie=df["date"],
                      train_duration=timedelta(days=5),
                      valid_duration=timedelta(days=3),
                      gap_duration=timedelta(days=1),
                      n_splits=3)
    assert len(list(cv.split(X_train, y_train))) == 3

示例#2

显示文件

文件： test_timegapsplit.py 项目： prateekchandrajha/scikit-lego

def test_timegapsplit():
    cv = TimeGapSplit(
        date_serie=df["date"],
        train_duration=timedelta(days=5),
        valid_duration=timedelta(days=3),
        gap_duration=timedelta(days=0),
    )

    for i, indices in enumerate(cv.split(X_train, y_train)):
        train_mindate = df.loc[X_train.iloc[indices[0]].index]["date"].min()
        train_maxdate = df.loc[X_train.iloc[indices[0]].index]["date"].max()
        valid_mindate = df.loc[X_train.iloc[indices[1]].index]["date"].min()
        valid_maxdate = df.loc[X_train.iloc[indices[1]].index]["date"].max()

        assert train_mindate <= train_maxdate <= valid_mindate <= valid_maxdate

    # regression testing, check if output changes of the last fold
    assert train_mindate == datetime.datetime.strptime(
        "2018-01-16", "%Y-%m-%d")
    assert train_maxdate == datetime.datetime.strptime(
        "2018-01-20", "%Y-%m-%d")
    assert valid_mindate == datetime.datetime.strptime(
        "2018-01-21", "%Y-%m-%d")
    assert valid_maxdate == datetime.datetime.strptime(
        "2018-01-23", "%Y-%m-%d")

示例#3

显示文件

def test_timegapsplit_too_many_splits():
    cv = TimeGapSplit(date_serie=df["date"],
                      train_duration=timedelta(days=5),
                      valid_duration=timedelta(days=3),
                      gap_duration=timedelta(days=1),
                      n_splits=7)
    with pytest.raises(ValueError):
        list(cv.split(X_train, y_train))

示例#4

显示文件

def test_timegapsplit_without_train_duration():
    cv = TimeGapSplit(date_serie=df["date"],
                      train_duration=None,
                      valid_duration=timedelta(days=3),
                      gap_duration=timedelta(days=5),
                      n_splits=3)
    csv = list(cv.split(X_train, y_train))

    assert len(csv) == 3
    assert cv.train_duration == timedelta(days=10)

示例#5

显示文件

文件： test_timegapsplit.py 项目： maxibor/scikit-lego

def test_timegapsplit_summary():

    cv = TimeGapSplit(date_serie=df['date'],
                      train_duration=timedelta(days=5),
                      valid_duration=timedelta(days=3),
                      gap_duration=timedelta(days=0))

    summary = cv.summary(X_train)

    assert summary.shape == (12, 5)

示例#6

显示文件

文件： test_timegapsplit.py 项目： maxibor/scikit-lego

def test_timegapsplit_with_a_gap():
    gap_duration = timedelta(days=2)
    cv_gap = TimeGapSplit(date_serie=df['date'],
                          train_duration=timedelta(days=5),
                          valid_duration=timedelta(days=3),
                          gap_duration=gap_duration)

    for i, indices in enumerate(cv_gap.split(X_train, y_train)):
        train_mindate = df.loc[X_train.iloc[indices[0]].index]['date'].min()
        train_maxdate = df.loc[X_train.iloc[indices[0]].index]['date'].max()
        valid_mindate = df.loc[X_train.iloc[indices[1]].index]['date'].min()
        valid_maxdate = df.loc[X_train.iloc[indices[1]].index]['date'].max()

        assert train_mindate <= train_maxdate <= valid_mindate <= valid_maxdate
        assert valid_mindate - train_maxdate >= gap_duration

示例#7

显示文件

def test_timegapsplit_train_or_nsplit():
    with pytest.raises(ValueError):
        cv = TimeGapSplit(date_serie=df["date"],
                          train_duration=None,
                          valid_duration=timedelta(days=3),
                          gap_duration=timedelta(days=5),
                          n_splits=None)

示例#8

显示文件

文件： test_timegapsplit.py 项目： maxibor/scikit-lego

def test_timegapsplit_too_big_gap():
    try:
        TimeGapSplit(date_serie=df['date'],
                     train_duration=timedelta(days=5),
                     valid_duration=timedelta(days=3),
                     gap_duration=timedelta(days=5))
    except ValueError:
        print("Successfully failed")

示例#9

显示文件

文件： test_timegapsplit.py 项目： prateekchandrajha/scikit-lego

def test_timegapsplit_with_gridsearch():

    cv = TimeGapSplit(
        date_serie=df["date"],
        train_duration=timedelta(days=5),
        valid_duration=timedelta(days=3),
        gap_duration=timedelta(days=0),
    )

    Lasso(random_state=0, tol=0.1, alpha=0.8).fit(X_train, y_train)

    pipe = Pipeline([("reg", Lasso(random_state=0, tol=0.1))])
    alphas = [0.1, 0.5, 0.8]
    grid = GridSearchCV(pipe, {"reg__alpha": alphas}, cv=cv)
    grid.fit(X_train, y_train)
    best_C = grid.best_estimator_.get_params()["reg__alpha"]

    assert best_C