Python PositionFilter.filter_tables Beispiele

Programmiersprache: Python

Namespace / Paketname: py_stringsimjoin.filter.position_filter

Klasse / Typ: PositionFilter

Methode / Funktion: filter_tables

Beispiele auf hotexamples.com: 8

Python PositionFilter.filter_tables - 8 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die py_stringsimjoin.filter.position_filter.PositionFilter.filter_tables, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

PositionFilter(14)

filter_tables(4)

build_index(3)

find_candidates(3)

apply_filter(1)

filter_candset(1)

filter_pair(1)

Beispiel #1

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

    def test_filter_tables(self, tokenizer, sim_measure_type, threshold,
                           allow_empty, allow_missing, args, expected_pairs):
        position_filter = PositionFilter(tokenizer, sim_measure_type,
                                         threshold, allow_empty, allow_missing)
        actual_candset = position_filter.filter_tables(*args)

        expected_output_attrs = ['_id']
        l_out_prefix = self.default_l_out_prefix
        r_out_prefix = self.default_r_out_prefix

        # Check for l_out_prefix in args.
        if len(args) > 8:
            l_out_prefix = args[8]
        expected_output_attrs.append(l_out_prefix + args[2])

        # Check for r_out_prefix in args.
        if len(args) > 9:
            r_out_prefix = args[9]
        expected_output_attrs.append(r_out_prefix + args[3])

        # Check for l_out_attrs in args.
        if len(args) > 6:
            if args[6]:
                l_out_attrs = remove_redundant_attrs(args[6], args[2])
                for attr in l_out_attrs:
                    expected_output_attrs.append(l_out_prefix + attr)

        # Check for r_out_attrs in args.
        if len(args) > 7:
            if args[7]:
                r_out_attrs = remove_redundant_attrs(args[7], args[3])
                for attr in r_out_attrs:
                    expected_output_attrs.append(r_out_prefix + attr)

        # verify whether the output table has the necessary attributes.
        assert_list_equal(list(actual_candset.columns.values),
                          expected_output_attrs)

        actual_pairs = set()
        for idx, row in actual_candset.iterrows():
            actual_pairs.add(','.join((str(row[l_out_prefix + args[2]]),
                                       str(row[r_out_prefix + args[3]]))))

        # verify whether the actual pairs and the expected pairs match.
        assert_equal(len(expected_pairs), len(actual_pairs))
        common_pairs = actual_pairs.intersection(expected_pairs)
        assert_equal(len(common_pairs), len(expected_pairs))

Beispiel #2

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

    def test_filter_tables(self, tokenizer, sim_measure_type, threshold,
                           allow_empty, allow_missing, args, expected_pairs):
        position_filter = PositionFilter(tokenizer, sim_measure_type, threshold,
                                         allow_empty, allow_missing)
        actual_candset = position_filter.filter_tables(*args)

        expected_output_attrs = ['_id']
        l_out_prefix = self.default_l_out_prefix
        r_out_prefix = self.default_r_out_prefix

        # Check for l_out_prefix in args.
        if len(args) > 8:
            l_out_prefix = args[8]
        expected_output_attrs.append(l_out_prefix + args[2])

        # Check for r_out_prefix in args.
        if len(args) > 9:
            r_out_prefix = args[9]
        expected_output_attrs.append(r_out_prefix + args[3])

        # Check for l_out_attrs in args.
        if len(args) > 6:
            if args[6]:
                l_out_attrs = remove_redundant_attrs(args[6], args[2])
                for attr in l_out_attrs:
                    expected_output_attrs.append(l_out_prefix + attr)

        # Check for r_out_attrs in args.
        if len(args) > 7:
            if args[7]:
                r_out_attrs = remove_redundant_attrs(args[7], args[3])
                for attr in r_out_attrs:
                    expected_output_attrs.append(r_out_prefix + attr)

        # verify whether the output table has the necessary attributes.
        assert_list_equal(list(actual_candset.columns.values),
                          expected_output_attrs)

        actual_pairs = set()
        for idx, row in actual_candset.iterrows():
            actual_pairs.add(','.join((str(row[l_out_prefix + args[2]]),
                                       str(row[r_out_prefix + args[3]]))))

        # verify whether the actual pairs and the expected pairs match.
        assert_equal(len(expected_pairs), len(actual_pairs))
        common_pairs = actual_pairs.intersection(expected_pairs)
        assert_equal(len(common_pairs), len(expected_pairs))

Beispiel #3

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

 def test_invalid_r_out_attr(self):
     position_filter = PositionFilter(self.tokenizer, self.sim_measure_type,
                                      self.threshold)
     position_filter.filter_tables(self.A, self.B, 'A.id', 'B.id', 'A.attr',
                                   'B.attr', ['A.attr'], ['B.invalid_attr'])

Beispiel #4

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

 def test_numeric_r_filter_attr(self):
     position_filter = PositionFilter(self.tokenizer, self.sim_measure_type,
                                      self.threshold)
     position_filter.filter_tables(self.A, self.B, 'A.id', 'B.id', 'A.attr',
                                   'B.int_attr')

Beispiel #5

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

 def test_invalid_rtable(self):
     position_filter = PositionFilter(self.tokenizer, self.sim_measure_type,
                                      self.threshold)
     position_filter.filter_tables(self.A, [], 'A.id', 'B.id', 'A.attr',
                                   'B.attr')

Beispiel #6

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

 def test_invalid_r_out_attr(self):
     position_filter = PositionFilter(self.tokenizer, self.sim_measure_type,
                                      self.threshold)
     position_filter.filter_tables(self.A, self.B, 'A.id', 'B.id',
                                   'A.attr', 'B.attr',
                                   ['A.attr'], ['B.invalid_attr'])

Beispiel #7

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

 def test_numeric_r_filter_attr(self):                                       
     position_filter = PositionFilter(self.tokenizer, self.sim_measure_type, 
                                      self.threshold)                        
     position_filter.filter_tables(self.A, self.B, 'A.id', 'B.id',           
                                   'A.attr', 'B.int_attr')

Beispiel #8

0

Datei anzeigen

Datei: test_position_filter.py Projekt: anhaidgroup/py_stringsimjoin

 def test_invalid_rtable(self):
     position_filter = PositionFilter(self.tokenizer, self.sim_measure_type,
                                      self.threshold)
     position_filter.filter_tables(self.A, [], 'A.id', 'B.id',
                                   'A.attr', 'B.attr')