Python splitDataForXValidation 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ex24.crossvalidation

메소드/함수: splitDataForXValidation

hotexamples.com에서의 예제들: 3

Python splitDataForXValidation - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ex24.crossvalidation.splitDataForXValidation에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: ex24_5.py 프로젝트: gabormakrai/landuseregression

def evalTrainStationTestStation(trainStation, testStation, features):
    trainX, _, trainY, _ = splitDataForXValidation(set([trainStation]), set(), "location", dataByStation[trainStation], features, "target")
    _, testX2, _, testY2 = splitDataForXValidation(set(), set([testStation]), "location", dataByStation[testStation], features, "target")
    model = RandomForestRegressor(max_depth=10, n_estimators = 60, n_jobs = -1, random_state=42)
    model.fit(trainX, trainY)
    prediction = model.predict(testX2)
    rmse = rmseEval(testY2, prediction)[1]
    print("Training on station " + str(trainStation) + ", applying on station " + str(testStation) + ": rmse: " + str(rmse))
    return rmse

예제 #2

파일 보기

파일: ex24_4.py 프로젝트: gabormakrai/landuseregression

    'bank_holiday', 'hour', 'month', 'day_of_week', 'building_count', 'length',
    'natural_area'
]

dataDict = {}
rmseDict = {}

for location in all_stations:

    print("stations " + str(location))

    trainStations = set(
        float(station) for station in all_stations if station != location)
    testStations = set([float(location)])

    trainX, testX, trainY, testY = splitDataForXValidation(
        trainStations, testStations, "location", data, features_TW, "target")
    print("\tTW #train: " + str(len(trainY)) + ", #test:" + str(len(testY)))
    model = RandomForestRegressor(min_samples_leaf=9,
                                  n_estimators=59,
                                  n_jobs=-1,
                                  random_state=42)
    model.fit(trainX, trainY)
    prediction = model.predict(testX)
    rmse = rmseEval(testY, prediction)[1]
    print("\trmse: " + str(rmse))
    dataDict[str(location) + "_obs"] = testY
    ae = []
    for i in range(0, len(testY)):
        ae.append(abs(testY[i] - prediction[i]))
    dataDict[str(location) + "_ae_tw"] = ae
    rmseDict[str(location) + "_ae_tw"] = rmse

예제 #3

파일 보기

파일: ex24_a.py 프로젝트: gabormakrai/landuseregression

columns = []
loadData(DATA_FILE, ["timestamp"], data, columns)

for iteration in range(0, 5):
    print("iter_" + str(iteration))
    trainStations = []
    testStations = []
    for i in range(0, 5):
        if i == iteration:
            testStations = testStations + locations_grouped[i]
        else:
            trainStations = trainStations + locations_grouped[i]
    print("\ttrainStations: " + str(trainStations))
    print("\ttestStations: " + str(testStations))

    trainStationSet = set(s for s in trainStations)
    testStationSet = set(s for s in testStations)

    trainX, testX, trainY, testY = splitDataForXValidation(
        trainStationSet, testStationSet, "location", data, columns, "target")
    print("\t#trainX: " + str(len(trainX)) + ", #testX:" + str(len(testX)))
    print("\t#trainY: " + str(len(trainY)) + ", #testY:" + str(len(testY)))
    model = RandomForestRegressor(max_depth=10,
                                  n_estimators=30,
                                  n_jobs=-1,
                                  random_state=42)
    model.fit(trainX, trainY)
    prediction = model.predict(testX)
    rmse = rmseEval(testY, prediction)[1]
    print("\trmse: " + str(rmse))