Python DerivaCSV Examples, deriva.utils.catalog.manage.deriva_csv.DerivaCSV Python Examples

Example #1

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

    def test_upload_to_deriva_partial(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()

        # get part of table:
        pfile_name = '{}/{}_partial.csv'.format(self.test_dir, self.table_name)

        with open(self.tablefile, 'r') as wholefile:
            with open(pfile_name, 'w', newline='') as partfile:
                tablereader = csv.reader(wholefile)
                tablewriter = csv.writer(partfile)
                for i in range(self.table_size // 2):
                    tablewriter.writerow(next(tablereader))

        partial_table = DerivaCSV(pfile_name,
                                  self.schema_name,
                                  table_name=self.table_name,
                                  key_columns='id',
                                  column_map=True)
        partial_row_count, _ = partial_table.upload_to_deriva(self.catalog)
        self.assertEqual(partial_row_count, self.table_size // 2 - 1)

        row_count, _ = self.table.upload_to_deriva(self.catalog)

        self.assertEqual(row_count,
                         self.table_size - (self.table_size // 2 - 1))

        pb = self.catalog.getPathBuilder()
        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        self.assertEqual(len(list(target_table.entities())), self.table_size)

Example #2

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

 def test_convert_to_deriva(self):
     self.table = DerivaCSV(self.tablefile,
                            self.schema_name,
                            key_columns='id',
                            column_map=True)
     self._create_test_table()
     tname = self.table.map_name(self.table_name)

Example #3

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

 def test_validate(self):
     self.table = DerivaCSV(self.tablefile,
                            self.schema_name,
                            key_columns='id',
                            column_map=True)
     self._create_test_table()
     self.table.validate(self.catalog)

Example #4

0

Show file

File: test_configure_catalog.py Project: ytfqj/deriva-catalog-manage

    def setUp(self):
        self.server = 'dev.isrd.isi.edu'
        self.credentials = get_credential(self.server)
        self.catalog_id = None
        self.schema_name = 'TestSchema'
        self.table_name = 'TestTable'

        self.table_size = 100
        self.column_count = 20
        self.test_dir = tempfile.mkdtemp()

        (row, self.headers) = generate_test_csv(self.column_count)
        self.tablefile = '{}/{}.csv'.format(self.test_dir, self.table_name)

        with open(self.tablefile, 'w', newline='') as f:
            tablewriter = csv.writer(f)
            for i, j in zip(range(self.table_size + 1), row):
                tablewriter.writerow(j)

        self.configfile = os.path.dirname(os.path.realpath(__file__)) + '/config.py'
        self.catalog = TempErmrestCatalog('https', self.server, credentials=self.credentials)

        model = self.catalog.getCatalogModel()
        model.create_schema(self.catalog, em.Schema.define(self.schema_name))

        self.table = DerivaCSV(self.tablefile, self.schema_name, column_map=True, key_columns='id')
      #  self._create_test_table()
        self.table.create_validate_upload_csv(self.catalog, create=True, upload=True)
        logger.debug('Setup done....')

Example #5

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

 def test_upload_to_deriva_upload_id(self):
     self.table = DerivaCSV(self.tablefile,
                            self.schema_name,
                            column_map=True,
                            row_number_as_key=True)
     self._create_test_table()
     row_count, upload_id = self.table.upload_to_deriva(self.catalog)
     print(row_count, upload_id)
     self.assertEqual(row_count, self.table_size)

Example #6

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

 def test_upload_to_deriva_validate(self):
     self.table = DerivaCSV(self.tablefile,
                            self.schema_name,
                            column_map=True,
                            key_columns='id')
     self._create_test_table()
     valid, report = self.table.validate(self.catalog)
     if not valid:
         for i in report['tables'][0]['errors']:
             print(i)
     self.assertEqual(valid, True)

Example #7

0

Show file

def load_csvs(catalog):
    (row, headers) = generate_test_csv(column_count)
    with open(csv_file, 'w', newline='') as f:
        tablewriter = csv.writer(f)
        for i, j in zip(range(table_size + 1), row):
            tablewriter.writerow(j)
    
    (row, headers) = generate_test_csv(column_count)
    with open(csv_file_public, 'w', newline='') as f:
        tablewriter = csv.writer(f)
        for i, j in zip(range(table_size + 1), row):
            tablewriter.writerow(j)

    # Upload CSVs into catalog, creating two new tables....
    csv_foo = DerivaCSV(csv_file, schema_name, column_map=['ID'], key_columns='id')
    csv_foo.create_validate_upload_csv(catalog, convert=True, create=True, upload=True)
    
    csv_foo_public = DerivaCSV(csv_file_public, schema_name, column_map=True, key_columns='id')
    csv_foo_public.create_validate_upload_csv(catalog, convert=True, create=True, upload=True)

    table = catalog.schema_model('TestSchema').table_model('Foo')
    table.configure_table_defaults(public=True)
    table.create_default_visible_columns(really=True)
    table_public = catalog.schema_model('TestSchema').table_model('Foo')
    table_public.configure_table_defaults(public=True)
    table_public.create_default_visible_columns(really=True)

Example #8

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

 def test_upload_to_deriva_validate_id(self):
     self.table = DerivaCSV(self.tablefile,
                            self.schema_name,
                            column_map=True,
                            row_number_as_key=True)
     self._create_test_table()
     try:
         valid, report = self.table.validate(self.catalog)
     except exceptions.ValidationError as err:
         print(err.errors)
     if not valid:
         for i in report['tables'][0]['errors']:
             print(i)
     self.assertEqual(valid, True)

Example #9

0

Show file

File: test_configure_catalog.py Project: ytfqj/deriva-catalog-manage

class TestConfigureCatalog(TestCase):
    def setUp(self):
        self.server = 'dev.isrd.isi.edu'
        self.credentials = get_credential(self.server)
        self.catalog_id = None
        self.schema_name = 'TestSchema'
        self.table_name = 'TestTable'

        self.table_size = 100
        self.column_count = 20
        self.test_dir = tempfile.mkdtemp()

        (row, self.headers) = generate_test_csv(self.column_count)
        self.tablefile = '{}/{}.csv'.format(self.test_dir, self.table_name)

        with open(self.tablefile, 'w', newline='') as f:
            tablewriter = csv.writer(f)
            for i, j in zip(range(self.table_size + 1), row):
                tablewriter.writerow(j)

        self.configfile = os.path.dirname(os.path.realpath(__file__)) + '/config.py'
        self.catalog = TempErmrestCatalog('https', self.server, credentials=self.credentials)

        model = self.catalog.getCatalogModel()
        model.create_schema(self.catalog, em.Schema.define(self.schema_name))

        self.table = DerivaCSV(self.tablefile, self.schema_name, column_map=True, key_columns='id')
      #  self._create_test_table()
        self.table.create_validate_upload_csv(self.catalog, create=True, upload=True)
        logger.debug('Setup done....')
        # Make upload directory:
        # mkdir schema_name/table/
        #    schema/file/id/file1, file2, ....for

    def tearDown(self):
        self.catalog.delete_ermrest_catalog(really=True)
        logger.debug('teardown...')


    def test_configure_baseline_catalog(self):
        configure_catalog.configure_baseline_catalog(self.catalog, catalog_name='test', admin='isrd-systems')
        return

    def test_configure_table_defaults(self):
        model = self.catalog.getCatalogModel()
        configure_catalog.configure_baseline_catalog(self.catalog, catalog_name='test', admin='isrd-systems')
        configure_catalog.configure_table_defaults(self.catalog,
                                                   model.schemas[self.schema_name].tables[self.table.map_name(self.table_name)])

Example #10

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

    def test_upload_to_deriva_partial_id(self):
        # get part of table:
        pfile_name = '{}/{}_partial.csv'.format(self.test_dir, self.table_name)

        with open(self.tablefile, 'r') as wholefile:
            with open(pfile_name, 'w', newline='') as partfile:
                tablereader = csv.reader(wholefile)
                tablewriter = csv.writer(partfile)
                for i in range(self.table_size // 2):
                    tablewriter.writerow(next(tablereader))

        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               table_name=self.table_name,
                               row_number_as_key=True,
                               column_map=True)
        partial_table = DerivaCSV(pfile_name,
                                  self.schema_name,
                                  table_name=self.table_name,
                                  row_number_as_key=True,
                                  column_map=True)
        self._create_test_table()

        # Upload first half...
        partial_row_count, partial_upload_id = partial_table.upload_to_deriva(
            self.catalog)
        self.assertEqual(partial_row_count, self.table_size // 2 - 1)

        # Upload second half....
        row_count, upload_id_1 = self.table.upload_to_deriva(
            self.catalog, upload_id=partial_upload_id)
        self.assertEqual(row_count,
                         self.table_size - (self.table_size // 2 - 1))

        # Check to see if whole table is there.
        pb = self.catalog.getPathBuilder()
        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        self.assertEqual(len(list(target_table.entities())), self.table_size)

        # Upload table again, using new upload_id.
        row_count, upload_id_1 = self.table.upload_to_deriva(self.catalog)
        self.assertEqual(row_count, self.table_size)

        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        self.assertEqual(len(list(target_table.entities())),
                         2 * self.table_size)

Example #11

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

    def test_table_schema_from_catalog(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()

        tableschema = self.table.table_schema_from_catalog(self.catalog)

        self.assertEqual([
            self.table.map_name(i['name'])
            for i in self.table.schema.descriptor['fields']
        ], [i['name'] for i in tableschema.descriptor['fields']])
        self.assertEqual(
            [i['type'] for i in self.table.schema.descriptor['fields']],
            [i['type'] for i in tableschema.descriptor['fields']])

Example #12

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

    def test_compound_key(self):
        key_columns = [['id', 'field 1', 'field 2'], 'field 3',
                       ['field 4', 'field 5']]
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns=key_columns,
                               column_map=True)
        self.assertEqual(self.table.schema.primary_key,
                         ['id', 'field 1', 'field 2'])

        for h in self.table.headers:
            f = self.table.schema.get_field(h)
            self.assertEqual((h in [
                'id', 'field 1', 'field 2', 'field 3', 'field 4', 'field 5'
            ] and f.required) or not f.required,
                             True,
                             msg='Missing required in field {}'.format(h))
            self.assertEqual((h == 'field 3' and f.descriptor.get('unique', False)) or not \
                            f.descriptor.get('unique', False), True)

        self._create_test_table()

        model = self.catalog.getCatalogModel()
        target_table = model.schemas[self.schema_name].tables[
            self.table.map_name(self.table_name)]

        catalog_keys = [sorted(i.unique_columns) for i in target_table.keys]

        # Check to make sure that each kiy is set for no nulls...
        for k in self.table._key_columns:
            for col in k:
                self.assertEqual(target_table.column_definitions[
                    self.table.map_name(col)].nullok,
                                 False,
                                 msg='nullok not set for {}'.format(col))
            n = [self.table.map_name(i) for i in k]
            n.sort()
            self.assertEqual(n in catalog_keys,
                             True,
                             msg='Key missing {}'.format(k))
        # Now check to make sure the key constraints made it....
        for k in target_table.keys:
            print(k.unique_columns)

        return

Example #13

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

    def test_table_schema_from_catalog_compound(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns=[['id', 'field 1']],
                               column_map=True)
        self._create_test_table()

        tableschema = self.table.table_schema_from_catalog(self.catalog)

        self.assertEqual([
            self.table.map_name(i['name'])
            for i in self.table.schema.descriptor['fields']
        ], [i['name'] for i in tableschema.descriptor['fields']])
        self.assertEqual(
            [i['type'] for i in self.table.schema.descriptor['fields']],
            [i['type'] for i in tableschema.descriptor['fields']])
        print(tableschema.primary_key)
        self.assertEqual(tableschema.primary_key, ['Id', 'Field_1'])

Example #14

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

    def test_upload_to_deriva(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()
        row_count, _ = self.table.upload_to_deriva(self.catalog)
        self.assertEqual(row_count, self.table_size)

        pb = self.catalog.getPathBuilder()
        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        e = target_table.entities()
        edict = {i['Id']: i for i in e}
        source = self.table.read(keyed=True)
        i = 0
        for k, v in source[i].items():
            id = source[i]['id']
            print(k, edict[id][self.table.map_name(k)], v)

Example #15

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

class TestDerivaCSV(TestCase):
    def setUp(self):
        self.server = 'dev.isrd.isi.edu'
        self.credentials = get_credential(self.server)
        self.catalog_id = None
        self.schema_name = 'TestSchema'
        self.table_name = 'TestTable'

        self.configfile = os.path.dirname(
            os.path.realpath(__file__)) + '/config.py'
        self.catalog = TempErmrestCatalog('https',
                                          self.server,
                                          credentials=self.credentials)
        model = self.catalog.getCatalogModel()
        model.create_schema(self.catalog, em.Schema.define(self.schema_name))

        self.table_size = 1000
        self.column_count = 20
        self.test_dir = tempfile.mkdtemp()

        (row, self.headers) = generate_test_csv(self.column_count)

        self.tablefile = '{}/{}.csv'.format(self.test_dir, self.table_name)
        with open(self.tablefile, 'w', newline='') as f:
            tablewriter = csv.writer(f)
            for i, j in zip(range(self.table_size + 1), row):
                tablewriter.writerow(j)

    def tearDown(self):
        self.catalog.delete_ermrest_catalog(really=True)

    def _create_test_table(self):
        pyfile = '{}/{}.py'.format(self.test_dir, self.table_name)
        try:
            self.table.convert_to_deriva(outfile=pyfile)
            tablescript = load_module_from_path(pyfile)
            tablescript.main(self.catalog, 'table')
        except ValueError as e:
            print(e)

    def test_map_name(self):
        path = os.path.dirname(os.path.realpath(__file__))

        column_map = None
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'foo bar')

        column_map = False
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'foo bar')

        column_map = True
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'Foo_Bar')

        column_map = ['DNA', 'RNA']
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'Foo_Bar')

        column_map = {
            '(%)': '(Percent)',
            'RnA': 'RNA',
            'dna': 'DNA',
            'the hun': 'Attila_The_Hun',
            'the_clown': 'Bozo_The_Clown'
        }
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('Change in value (%)'),
                         'Change_In_Value_(Percent)')
        self.assertEqual(table.map_name('amountDna'), 'Amount_DNA')
        self.assertEqual(table.map_name('the hun'), 'Attila_The_Hun')
        self.assertEqual(table.map_name('the clown'), 'Bozo_The_Clown')

    def test_convert_to_deriva(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()
        tname = self.table.map_name(self.table_name)

    def test_compound_key(self):
        key_columns = [['id', 'field 1', 'field 2'], 'field 3',
                       ['field 4', 'field 5']]
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns=key_columns,
                               column_map=True)
        self.assertEqual(self.table.schema.primary_key,
                         ['id', 'field 1', 'field 2'])

        for h in self.table.headers:
            f = self.table.schema.get_field(h)
            self.assertEqual((h in [
                'id', 'field 1', 'field 2', 'field 3', 'field 4', 'field 5'
            ] and f.required) or not f.required,
                             True,
                             msg='Missing required in field {}'.format(h))
            self.assertEqual((h == 'field 3' and f.descriptor.get('unique', False)) or not \
                            f.descriptor.get('unique', False), True)

        self._create_test_table()

        model = self.catalog.getCatalogModel()
        target_table = model.schemas[self.schema_name].tables[
            self.table.map_name(self.table_name)]

        catalog_keys = [sorted(i.unique_columns) for i in target_table.keys]

        # Check to make sure that each kiy is set for no nulls...
        for k in self.table._key_columns:
            for col in k:
                self.assertEqual(target_table.column_definitions[
                    self.table.map_name(col)].nullok,
                                 False,
                                 msg='nullok not set for {}'.format(col))
            n = [self.table.map_name(i) for i in k]
            n.sort()
            self.assertEqual(n in catalog_keys,
                             True,
                             msg='Key missing {}'.format(k))
        # Now check to make sure the key constraints made it....
        for k in target_table.keys:
            print(k.unique_columns)

        return

    def test_table_schema_from_catalog(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()

        tableschema = self.table.table_schema_from_catalog(self.catalog)

        self.assertEqual([
            self.table.map_name(i['name'])
            for i in self.table.schema.descriptor['fields']
        ], [i['name'] for i in tableschema.descriptor['fields']])
        self.assertEqual(
            [i['type'] for i in self.table.schema.descriptor['fields']],
            [i['type'] for i in tableschema.descriptor['fields']])

    def test_table_schema_from_catalog_compound(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns=[['id', 'field 1']],
                               column_map=True)
        self._create_test_table()

        tableschema = self.table.table_schema_from_catalog(self.catalog)

        self.assertEqual([
            self.table.map_name(i['name'])
            for i in self.table.schema.descriptor['fields']
        ], [i['name'] for i in tableschema.descriptor['fields']])
        self.assertEqual(
            [i['type'] for i in self.table.schema.descriptor['fields']],
            [i['type'] for i in tableschema.descriptor['fields']])
        print(tableschema.primary_key)
        self.assertEqual(tableschema.primary_key, ['Id', 'Field_1'])

    def test_validate(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()
        self.table.validate(self.catalog)

    def test_upload_to_deriva(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()
        row_count, _ = self.table.upload_to_deriva(self.catalog)
        self.assertEqual(row_count, self.table_size)

        pb = self.catalog.getPathBuilder()
        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        e = target_table.entities()
        edict = {i['Id']: i for i in e}
        source = self.table.read(keyed=True)
        i = 0
        for k, v in source[i].items():
            id = source[i]['id']
            print(k, edict[id][self.table.map_name(k)], v)

    def test_upload_to_deriva_partial(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               key_columns='id',
                               column_map=True)
        self._create_test_table()

        # get part of table:
        pfile_name = '{}/{}_partial.csv'.format(self.test_dir, self.table_name)

        with open(self.tablefile, 'r') as wholefile:
            with open(pfile_name, 'w', newline='') as partfile:
                tablereader = csv.reader(wholefile)
                tablewriter = csv.writer(partfile)
                for i in range(self.table_size // 2):
                    tablewriter.writerow(next(tablereader))

        partial_table = DerivaCSV(pfile_name,
                                  self.schema_name,
                                  table_name=self.table_name,
                                  key_columns='id',
                                  column_map=True)
        partial_row_count, _ = partial_table.upload_to_deriva(self.catalog)
        self.assertEqual(partial_row_count, self.table_size // 2 - 1)

        row_count, _ = self.table.upload_to_deriva(self.catalog)

        self.assertEqual(row_count,
                         self.table_size - (self.table_size // 2 - 1))

        pb = self.catalog.getPathBuilder()
        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        self.assertEqual(len(list(target_table.entities())), self.table_size)

    def test_upload_to_deriva_upload_id(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               column_map=True,
                               row_number_as_key=True)
        self._create_test_table()
        row_count, upload_id = self.table.upload_to_deriva(self.catalog)
        print(row_count, upload_id)
        self.assertEqual(row_count, self.table_size)

    def test_upload_to_deriva_validate(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               column_map=True,
                               key_columns='id')
        self._create_test_table()
        valid, report = self.table.validate(self.catalog)
        if not valid:
            for i in report['tables'][0]['errors']:
                print(i)
        self.assertEqual(valid, True)

    def test_upload_to_deriva_validate_id(self):
        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               column_map=True,
                               row_number_as_key=True)
        self._create_test_table()
        try:
            valid, report = self.table.validate(self.catalog)
        except exceptions.ValidationError as err:
            print(err.errors)
        if not valid:
            for i in report['tables'][0]['errors']:
                print(i)
        self.assertEqual(valid, True)

    def test_upload_to_deriva_partial_id(self):
        # get part of table:
        pfile_name = '{}/{}_partial.csv'.format(self.test_dir, self.table_name)

        with open(self.tablefile, 'r') as wholefile:
            with open(pfile_name, 'w', newline='') as partfile:
                tablereader = csv.reader(wholefile)
                tablewriter = csv.writer(partfile)
                for i in range(self.table_size // 2):
                    tablewriter.writerow(next(tablereader))

        self.table = DerivaCSV(self.tablefile,
                               self.schema_name,
                               table_name=self.table_name,
                               row_number_as_key=True,
                               column_map=True)
        partial_table = DerivaCSV(pfile_name,
                                  self.schema_name,
                                  table_name=self.table_name,
                                  row_number_as_key=True,
                                  column_map=True)
        self._create_test_table()

        # Upload first half...
        partial_row_count, partial_upload_id = partial_table.upload_to_deriva(
            self.catalog)
        self.assertEqual(partial_row_count, self.table_size // 2 - 1)

        # Upload second half....
        row_count, upload_id_1 = self.table.upload_to_deriva(
            self.catalog, upload_id=partial_upload_id)
        self.assertEqual(row_count,
                         self.table_size - (self.table_size // 2 - 1))

        # Check to see if whole table is there.
        pb = self.catalog.getPathBuilder()
        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        self.assertEqual(len(list(target_table.entities())), self.table_size)

        # Upload table again, using new upload_id.
        row_count, upload_id_1 = self.table.upload_to_deriva(self.catalog)
        self.assertEqual(row_count, self.table_size)

        target_table = pb.schemas[self.schema_name].tables[self.table.map_name(
            self.table_name)].alias('target_table')
        self.assertEqual(len(list(target_table.entities())),
                         2 * self.table_size)

Example #16

0

Show file

def add_demo_content(catalog, schema_name='Demo'):
    dir = os.path.dirname(os.path.abspath(__file__))

    # Now add some content.....
    experiment_csv = DerivaCSV(dir + '/Experiment.csv', schema_name)
    experiment_csv.upload_to_deriva(catalog)

Example #17

0

Show file

File: test_derivaCSV.py Project: ytfqj/deriva-catalog-manage

    def test_map_name(self):
        path = os.path.dirname(os.path.realpath(__file__))

        column_map = None
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'foo bar')

        column_map = False
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'foo bar')

        column_map = True
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'Foo_Bar')

        column_map = ['DNA', 'RNA']
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('foo bar'), 'Foo_Bar')

        column_map = {
            '(%)': '(Percent)',
            'RnA': 'RNA',
            'dna': 'DNA',
            'the hun': 'Attila_The_Hun',
            'the_clown': 'Bozo_The_Clown'
        }
        table = DerivaCSV(path + '/test1.csv',
                          self.schema_name,
                          column_map=column_map)
        self.assertEqual(table.map_name('Change in value (%)'),
                         'Change_In_Value_(Percent)')
        self.assertEqual(table.map_name('amountDna'), 'Amount_DNA')
        self.assertEqual(table.map_name('the hun'), 'Attila_The_Hun')
        self.assertEqual(table.map_name('the clown'), 'Bozo_The_Clown')