Python ChalearnWrapper.getAvailableDatasets 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: chalearn_wrapper

클래스/타입: ChalearnWrapper

메소드/함수: getAvailableDatasets

hotexamples.com에서의 예제들: 2

Python ChalearnWrapper.getAvailableDatasets - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 chalearn_wrapper.ChalearnWrapper.getAvailableDatasets에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

getAvailableDatasets(2)

getMLproblem(2)

getDatasetFiles(1)

get_train_test_dataset(1)

loadDatasetPropertiesDict(1)

loadNoHeaderDataframe(1)

예제 #1

파일 보기

파일: test_chalearnWrapper.py 프로젝트: abell25/EnsembleMachine

  def test_loadAllDatasets(self):
    chalearnWrapper = ChalearnWrapper(files_loc='../data/chalearn_autoML_challenge')
    available_datasets = chalearnWrapper.getAvailableDatasets()
    available_datasets = ['dorothea', 'christine', 'jasmine', 'madeline', 'philippine', 'sylvine', 'albert', 'dilbert', 'fabert', 'robert', 'volkert']

    for dataset_name in available_datasets:
        print("loading dataset {0}".format(dataset_name))
        chalearnWrapper.get_train_test_dataset(dataset_name)

예제 #2

파일 보기

파일: test_chalearnWrapper.py 프로젝트: abell25/EnsembleMachine

class TestChalearnWrapper(TestCase):

  def setUp(self):
    self.dataset_loc = '../data/chalearn_autoML_challenge'
    self.adult_dataset_loc = path.join(self.dataset_loc, 'round0/adult')
    self.chalearnWrapper = ChalearnWrapper(self.dataset_loc)

  def test_getDatasetFiles(self):
    datasetFiles = self.chalearnWrapper.getDatasetFiles(self.adult_dataset_loc, 'adult')

  def test_getAvailableDatasets(self):
    available_datasets = self.chalearnWrapper.getAvailableDatasets()
    self.assertTrue('adult' in available_datasets)

  def test_getDataset(self):
    mlProblem = self.chalearnWrapper.getMLproblem('adult')
    self.assertTrue(mlProblem.has_key('train_data'))

  def test_loadDatasetPropertiesDict(self):
    self.chalearnWrapper.loadDatasetPropertiesDict(path.join(self.dataset_loc, 'round0/adult/adult_public.info'))

  def test_loadNoHeaderDataframe(self):
    df = self.chalearnWrapper.loadNoHeaderDataframe(path.join(self.dataset_loc, 'round0/adult/adult_train.data'))
    self.assertEqual(df.values.shape[0], 34190)
    self.assertEqual(df.values.shape[1], 24)

  def test_loadDataset(self):
    chalearnWrapper = ChalearnWrapper(files_loc='../data/chalearn_autoML_challenge')
    mlProblem = chalearnWrapper.getMLproblem('adult')
    dataLoader = TrainTestDataLoader(train=mlProblem.train_df, test=mlProblem.test_df, train_labels=mlProblem.train_labels, try_date_parse=False)
    dataLoader.cleanData(max_onehot_limit=200)
    X, X_sub, y = dataLoader.getTrainTestData()

  def test_loadAllDatasets(self):
    chalearnWrapper = ChalearnWrapper(files_loc='../data/chalearn_autoML_challenge')
    available_datasets = chalearnWrapper.getAvailableDatasets()
    available_datasets = ['dorothea', 'christine', 'jasmine', 'madeline', 'philippine', 'sylvine', 'albert', 'dilbert', 'fabert', 'robert', 'volkert']

    for dataset_name in available_datasets:
        print("loading dataset {0}".format(dataset_name))
        chalearnWrapper.get_train_test_dataset(dataset_name)