Python label_schema_matchingの例

プログラミング言語: Python

名前空間/パッケージ名: kgextension.schema_matching

メソッド/関数: label_schema_matching

hotexamples.comのコード掲載数: 4

Python label_schema_matching - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのkgextension.schema_matching.label_schema_matchingの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: test_schema_matching.py プロジェクト: jbdatascience/kgextension

    def test1_smallset(self):
        path_input = "test/data/schema_matching/default_matches_cities_input.csv"
        df = pd.read_csv(path_input)    

        pairs_relational = relational_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)
        pairs_string = string_similarity_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)
        pairs_schema = label_schema_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)
        pairs_overlap = value_overlap_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)

        assert all([pairs_relational.equals(x) for x in [pairs_string, pairs_schema, pairs_overlap]])

コード例 #2

ファイルを表示

ファイル: test_schema_matching.py プロジェクト: jbdatascience/kgextension

    def test4_uri_querier_no_matches(self):
        path_input = "test/data/schema_matching/no_matches_cities_boolean_input.csv"
        df = pd.read_csv(path_input)
        
        path_expected = "test/data/schema_matching/no_matches_cities_boolean_expected.csv"
        expected_matches = pd.read_csv(path_expected)
        
        output_matches = label_schema_matching(df, uri_data_model=True)
        output_matches['same_label'] = pd.to_numeric(output_matches['same_label'])

        pd.testing.assert_frame_equal(
            output_matches, expected_matches, check_like=True)

コード例 #3

ファイルを表示

ファイル: test_schema_matching.py プロジェクト: jbdatascience/kgextension

    def test1_default(self):
        path_input = "test/data/schema_matching/default_matches_cities_boolean_input.csv"
        df = pd.read_csv(path_input)
        
        path_expected = "test/data/schema_matching/default_matches_cities_boolean_expected.csv"
        expected_matches = pd.read_csv(path_expected)
        
        output_matches = label_schema_matching(df)
        output_matches['same_label'] = pd.to_numeric(output_matches['same_label'])

        pd.testing.assert_frame_equal(
            output_matches, expected_matches, check_like=True)

コード例 #4

ファイルを表示

ファイル: test_schema_matching.py プロジェクト: jbdatascience/kgextension

    def test2_bigset(self):

        #WARNING: Takes long to run!

        path_input = "test/data/schema_matching/pair_equality_test2_bigset.csv"
        df = pd.read_csv(path_input)    

        pairs_relational = relational_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)
        pairs_string = string_similarity_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)
        pairs_schema = label_schema_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)
        pairs_overlap = value_overlap_matching(df)[["uri_1","uri_2"]].sort_values(by=["uri_1","uri_2"]).reset_index(drop=True)

        assert all([pairs_relational.equals(x) for x in [pairs_string, pairs_schema, pairs_overlap]])