Python DataImport.get_clean_train_data 예제들

프로그래밍 언어: Python

클래스/타입: DataImport

메소드/함수: get_clean_train_data

hotexamples.com에서의 예제들: 2

Python DataImport.get_clean_train_data - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 DataImport.get_clean_train_data 패키지로부터 collabovid에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DataImport(7)

get_titanic_data(6)

Unit(3)

add_assignee(3)

add_citation(3)

get_clean_test_data(2)

get_titanic_test_results(2)

get_patient_ts(2)

get_clean_train_data(2)

create_document(2)

add_classification(2)

Halo(1)

create_train_test_valid(1)

create_us_document(1)

filter_age(1)

create_data_matrices(1)

combine_datasets(1)

Zlist(1)

MergerTree(1)

import_file(1)

예제 #1

파일 보기

파일: LogisticRegressionModel.py 프로젝트: roshan2M/kaggle

def build_train_set() -> list:
    titanic_train_data = di.get_clean_train_data()
    all_X = titanic_train_data[COLUMN_NAMES]
    all_y = titanic_train_data['Survived']
    return [all_X, all_y]

예제 #2

파일 보기

import pandas as pd
import DataImport as di

from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

COLUMN_NAMES = ['Pclass_1', 'Pclass_2', 'Pclass_3', 'Age_category_Missing',
                'Age_category_Infant', 'Age_category_Child', 'Age_category_Teenager',
                'Age_category_Young Adult', 'Age_category_Adult', 'Age_category_Senior',
                'Sex_female', 'Sex_male']

rf = RandomForestClassifier()

titanic_train_data = di.get_clean_train_data()
train_X = titanic_train_data[COLUMN_NAMES]
train_y = titanic_train_data['Survived']

titanic_test_data = di.get_clean_test_data()
test_X = titanic_test_data[COLUMN_NAMES]
test_y = di.get_titanic_test_results()['Survived']

rf.fit(train_X, train_y)
predictions = rf.predict(test_X)

results = pd.DataFrame(index=range(predictions.size), columns=[])
results["PassengerId"] = titanic_test_data["PassengerId"]
results["Survived"] = predictions
results.to_csv("Titanic Predictions Random Forest.csv", index=False)

score = accuracy_score(test_y, predictions)
print('Score: ' + str(score))