Python Client.get_dataset_split_job 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: h2oai_client

클래스/타입: Client

메소드/함수: get_dataset_split_job

hotexamples.com에서의 예제들: 5

Python Client.get_dataset_split_job - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 h2oai_client.Client.get_dataset_split_job에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

start_experiment_sync(8)

create_dataset_sync(6)

Client(5)

get_dataset_split_job(5)

upload_dataset_sync(2)

create_project(1)

download(1)

fit_transform_batch_sync(1)

get_dataset_job(1)

get_datasets_for_project(1)

link_dataset_to_project(1)

list_datasets(1)

list_projects(1)

make_dataset_split(1)

upload_custom_recipe_sync(1)

예제 #1

파일 보기

target = 'PositiveReview'
ratio = 0.8

reviews_data = h2oai.create_dataset_sync(dataPath)

# Split the data
reviews_split_data = h2oai.make_dataset_split(dataset_key=reviews_data.key,
                                              output_name1=basename + "_train",
                                              output_name2=basename + "_test",
                                              target=target,
                                              fold_col="",
                                              time_col="",
                                              ratio=ratio,
                                              seed=1234)

train_key = h2oai.get_dataset_split_job(reviews_split_data).entity[0]
test_key = h2oai.get_dataset_split_job(reviews_split_data).entity[1]

# Reviews Default

dropped = [
    'UserID', 'ProductId', 'Id', 'Summary', 'Score', 'HelpfulnessDenominator',
    'HelpfulnessNumerator', 'ProfileName', 'Time'
]
knobs = [8, 2, 7]
reviews1 = h2oai.start_experiment_sync(experiment_name="Reviews NLP Big",
                                       dataset_key=train_key,
                                       testset_key=test_key,
                                       target_col=target,
                                       is_classification=True,
                                       accuracy=knobs[0],

예제 #2

파일 보기

파일: card.py 프로젝트: davidwhiting/aquarium_driverless_ai

card_data = h2oai.create_dataset_sync(dataPath)

# Split the data
card_split_data = h2oai.make_dataset_split(
    dataset_key = card_data.key
    , output_name1 = basename + "_train"
    , output_name2 = basename + "_test"
    , target = target
    , fold_col = ""
    , time_col = ""
    , ratio = ratio
    , seed = 1234
)

train_key = h2oai.get_dataset_split_job(card_split_data).entity[0]
test_key  = h2oai.get_dataset_split_job(card_split_data).entity[1]

# Card Default
knobs = [6, 4, 6]
card_default = h2oai.start_experiment_sync(
      experiment_name = "Card Default"
    , dataset_key = train_key
    , testset_key = test_key
    , target_col = target
    , is_classification = True
    , accuracy = knobs[0]
    , time = knobs[1]
    , interpretability = knobs[2]
    , enable_gpus = True
    , cols_to_drop = dropped

예제 #3

파일 보기

파일: diabetes.py 프로젝트: davidwhiting/aquarium_driverless_ai

ratio = 0.8

diabetes_data = h2oai.create_dataset_sync(dataPath)

# Split the data
diabetes_split_data = h2oai.make_dataset_split(dataset_key=diabetes_data.key,
                                               output_name1=basename +
                                               "_train",
                                               output_name2=basename + "_test",
                                               target=target,
                                               fold_col="",
                                               time_col="",
                                               ratio=ratio,
                                               seed=1234)

train_key = h2oai.get_dataset_split_job(diabetes_split_data).entity[0]
test_key = h2oai.get_dataset_split_job(diabetes_split_data).entity[1]
dropped = []

# Diabetes Default
knobs = [8, 2, 8]
diabetes1 = h2oai.start_experiment_sync(experiment_name="Diabetes",
                                        dataset_key=train_key,
                                        testset_key=test_key,
                                        target_col=target,
                                        is_classification=True,
                                        accuracy=knobs[0],
                                        time=knobs[1],
                                        interpretability=knobs[2],
                                        enable_gpus=True,
                                        cols_to_drop=dropped)

예제 #4

파일 보기

파일: housing.py 프로젝트: davidwhiting/aquarium_driverless_ai

target = 'VALUE'
ratio = 0.8

boston_data = h2oai.create_dataset_sync(dataPath)

# Split the data
boston_split_data = h2oai.make_dataset_split(dataset_key=boston_data.key,
                                             output_name1=basename + "_train",
                                             output_name2=basename + "_test",
                                             target=target,
                                             fold_col="",
                                             time_col="",
                                             ratio=ratio,
                                             seed=1234)

train_key = h2oai.get_dataset_split_job(boston_split_data).entity[0]
test_key = h2oai.get_dataset_split_job(boston_split_data).entity[1]
dropped = []

# Housing Experiment #1
knobs = [7, 2, 8]
housing1 = h2oai.start_experiment_sync(experiment_name="Housing",
                                       dataset_key=train_key,
                                       testset_key=test_key,
                                       target_col=target,
                                       is_classification=False,
                                       accuracy=knobs[0],
                                       time=knobs[1],
                                       interpretability=knobs[2],
                                       scorer='RMSE',
                                       enable_gpus=True,

예제 #5

파일 보기

target = 'survived'
ratio = 0.8

titanic_data = h2oai.create_dataset_sync(dataPath)

# Split the data
titanic_split_data = h2oai.make_dataset_split(dataset_key=titanic_data.key,
                                              output_name1=basename + "_train",
                                              output_name2=basename + "_test",
                                              target=target,
                                              fold_col="",
                                              time_col="",
                                              ratio=ratio,
                                              seed=1234)

train_key = h2oai.get_dataset_split_job(titanic_split_data).entity[0]
test_key = h2oai.get_dataset_split_job(titanic_split_data).entity[1]

knobs = [8, 2, 8]

# Titanic Default

dropped = ['no.title', 'cabin', 'embarked', 'boat', 'body', 'home.dest']
titanic1 = h2oai.start_experiment_sync(experiment_name="Titanic",
                                       dataset_key=train_key,
                                       testset_key=test_key,
                                       target_col=target,
                                       is_classification=True,
                                       accuracy=knobs[0],
                                       time=knobs[1],
                                       interpretability=knobs[2],