Python get_targets 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ml_utils.data.handling

메소드/함수: get_targets

hotexamples.com에서의 예제들: 2

Python get_targets - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ml_utils.data.handling.get_targets에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: titanic.py 프로젝트: dmonroe85/kaggle_competitions

    # 'parch',
    # 'sibsp',
    # 'embarked',
    # 'fare',
    # 'age',
    # 'cabin',
    # 'ticket',
    # 'name',
]

# Preprocess Data
preprocessing_titanic(analysis_set, ignore_fields, target_field)
preprocessing_titanic(cheat_set, ignore_fields, target_field)

# Get Targets
balanced_set, targets = get_targets(analysis_set, target_field, balance=False)
_,      cheat_targets = get_targets(cheat_set, target_field, balance=False)

print "\nTarget mean = %s" % np.average(targets)
print "Cheat Target mean = %s\n" % np.average(cheat_targets)

DV = feature_extraction.DictVectorizer(sparse=False)

# CF = CollaborativeFilter()
# collaborated = CF.fit_transform(balanced_set, targets)

PL = pipeline.Pipeline(steps=[
    ("collab",          CollaborativeFilter(L=1)),
    ("pctcats",         PercentileCategorizer({'fare': 10, 'age': 10, 'ticket_number': 10})),
    # ("lowcount",        LowCountTrimmer(threshold=0, criteria='field')),

예제 #2

파일 보기

파일: sf_crime.py 프로젝트: dmonroe85/kaggle_competitions

target_field = 'category'
ignore_fields = ['descript', 'resolution', 'id',
    # 'dayofweek',
    # 'pddistrict',
    # 'dates',
    'x',
    'y',
    'address',
]

remove_ignored(training_set, ignore_fields)
# remove_ignored(test_set, ignore_fields)

preprocess_sf_crime(training_set)

train_wo_tgts, train_targets_wo_multiclass = get_targets(training_set, target_field)
train_targets = train_targets_wo_multiclass
# train_targets = split_multiclass(train_targets_wo_multiclass)

# Going away from pipeline - not enough need to chain things together.
print "DictVectorizer"
DV = feature_extraction.DictVectorizer(sparse=False)
train_inputs = DV.fit_transform(train_wo_tgts)
print train_inputs.shape

SSS = Splitter(train_targets_wo_multiclass, n_iter=1, test_size=0.5)
for tr, cv in SSS:
    print "Split"
    train_idx, cv_idx = tr, cv
    print train_idx.shape
    print cv_idx.shape