Python Dataset.Dataset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: serenata_toolbox.federal_senate.dataset

클래스/타입: Dataset

메소드/함수: Dataset

hotexamples.com에서의 예제들: 11

Python Dataset.Dataset - 11개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 serenata_toolbox.federal_senate.dataset.Dataset.Dataset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Dataset(11)

fetch(5)

clean(4)

translate(4)

자주 사용되는 메소드들

Dataset (11)

fetch (5)

clean (4)

translate (4)

예제 #1

파일 보기

    def test_dataset_translation_failing_to_find_file(self):
        self.subject = Dataset(os.path.join('tests', 'fixtures', 'csv'),
                               [2007])

        with self.assertRaises(FileNotFoundError) as context:
            self.subject.translate()

        self.assertTrue(isinstance(context.exception, FileNotFoundError))

예제 #2

파일 보기

    def update_datasets(self):
        os.makedirs(self.path, exist_ok=True)
        federal_senate = Dataset(self.path)
        federal_senate.fetch()
        federal_senate.translate()
        federal_senate_reimbursements_path = federal_senate.clean()

        return federal_senate_reimbursements_path

예제 #3

파일 보기

    def test_fetch_raises_URLError(self, mocked_url_retrieve):
        mocked_url_retrieve.side_effect = urllib.error.URLError('tests reason')
        path = gettempdir()
        subject = Dataset(path, [2007])

        with self.assertRaises(urllib.error.URLError) as context:
            subject.fetch()

        self.assertTrue(isinstance(context.exception, urllib.error.URLError))

예제 #4

파일 보기

    def test_fetch_not_found_files_from_S3(self):
        self.path = gettempdir()
        self.subject = Dataset(self.path, 2007, 2008)

        retrieved_files, not_found_files = self.subject.fetch()

        for not_found_file, expected_file in zip(not_found_files,
                                                 self.expected_files):

            self.assertIn('federal-senate-2007.csv', not_found_file)

예제 #5

파일 보기

    def test_fetch_raises_HTTPError(self, mocked_url_retrieve):
        mocked_url_retrieve.side_effect = urllib.error.HTTPError(
            None, None, None, None, None)
        self.path = gettempdir()
        self.subject = Dataset(self.path, [2007])

        with self.assertRaises(urllib.error.HTTPError) as context:
            self.subject.fetch()

        self.assertTrue(isinstance(context.exception, urllib.error.HTTPError))

예제 #6

파일 보기

    def test_dataset_cleanup(self):
        self.subject = Dataset(os.path.join('tests', 'fixtures', 'xz'), [2009])

        reimbursement_path = self.subject.clean()

        expected_path = os.path.join('tests', 'fixtures', 'xz',
                                     'federal-senate-reimbursements.xz')
        self.assertEqual(reimbursement_path, expected_path)

        os.remove(expected_path)

예제 #7

파일 보기

    def test_dataset_translation_failing_to_find_file(self):
        self.subject = Dataset(os.path.join('tests', 'fixtures', 'csv'), 2007,
                               2008)

        expected_files = ['federal-senate-2007.csv']

        translated_files, not_found_files = self.subject.translate()

        for not_found_files, expected_file in zip(not_found_files,
                                                  expected_files):

            self.assertIn(expected_file, not_found_files)

예제 #8

파일 보기

    def test_dataset_translation(self):
        self.subject = Dataset(os.path.join('tests', 'fixtures', 'csv'), 2008,
                               2009)

        expected_files = ['federal-senate-2008.csv']

        translated_files, not_found_files = self.subject.translate()

        for translated_file, expected_file in zip(translated_files,
                                                  expected_files):

            self.assertIn(expected_file, translated_file)

예제 #9

파일 보기

    def test_fetch_files_from_S3(self, mocked_url_etrieve):
        self.path = gettempdir()
        self.subject = Dataset(self.path)

        retrieved_files, not_found_files = self.subject.fetch()

        self.assertTrue(mocked_url_etrieve.called)
        self.assertEqual(mocked_url_etrieve.call_count,
                         len(self.subject.year_range))
        for retrieved_file, expected_file in zip(retrieved_files,
                                                 self.expected_files):

            self.assertIn(expected_file, retrieved_file)

예제 #10

파일 보기

    def test_if_translation_happened_as_expected(self):
        self.subject = Dataset(os.path.join('tests', 'fixtures', 'csv'), 2008,
                               2009)

        file_path = os.path.join(self.subject.path, 'federal-senate-2008.csv')
        federal_senate_2008 = pd.read_csv(file_path,
                                          sep=';',
                                          encoding='ISO-8859-1',
                                          skiprows=1)
        self.assertIsNotNone(federal_senate_2008['ANO'],
                             'expects \'ANO\' as column in this dataset')

        self.subject.translate()

        translated_file_path = os.path.join(self.subject.path,
                                            'federal-senate-2008.xz')
        translated_federal_senate_2008 = pd.read_csv(translated_file_path,
                                                     encoding='utf-8')

        self.assertIsNotNone(translated_federal_senate_2008['year'],
                             'expects \'year\' as column in this dataset')

        os.remove(os.path.join(self.subject.path, 'federal-senate-2008.xz'))

예제 #11

파일 보기

파일: test_federal_senate_dataset.py 프로젝트: JamesLinus/serenata-toolbox

 def setUp(self):
     self.path = gettempdir()
     self.subject = Dataset(self.path)