Python delete_duplicate_columns 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: scripts.normalize_data

메소드/함수: delete_duplicate_columns

hotexamples.com에서의 예제들: 4

Python delete_duplicate_columns - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 scripts.normalize_data.delete_duplicate_columns에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_normalize_data.py 프로젝트: eODP/data-processing

    def test_ignores_columns_with_different_names_and_same_values(self):
        csv_data = "a,b\n" "1,1\n" "2,2\n"
        df = pd.read_csv(StringIO(csv_data))
        expected = pd.read_csv(StringIO(csv_data))

        delete_duplicate_columns(df)

        assert list(df.columns) == ["a", "b"]
        assert_frame_equal(df, expected)

예제 #2

파일 보기

파일: test_normalize_data.py 프로젝트: eODP/data-processing

    def test_deletes_columns_with_surrounding_spaces_and_same_names_and_values(
            self, csv_data):
        df = pd.read_csv(StringIO(csv_data))
        csv_data2 = "a,b\n" "1,1\n" "2,2\n"
        expected = pd.read_csv(StringIO(csv_data2))

        delete_duplicate_columns(df)

        assert list(df.columns) == ["a", "b"]
        assert_frame_equal(df, expected)

예제 #3

파일 보기

파일: test_normalize_data.py 프로젝트: eODP/data-processing

    def test_deletes_columns_with_same_names_and_same_values_with_nan(self):
        csv_data = "a,a,a,b\n" "1,1,1,1\n" f"{np.nan},{np.nan},{np.nan},2\n"
        df = pd.read_csv(StringIO(csv_data))
        csv_data2 = "a,b\n" f"1,1\n" f"{np.nan},2\n"
        expected = pd.read_csv(StringIO(csv_data2))

        delete_duplicate_columns(df)

        assert list(df.columns) == ["a", "b"]
        assert_frame_equal(df, expected)

예제 #4

파일 보기

파일: test_normalize_data.py 프로젝트: eODP/data-processing

    def test_deletes_multiple_columns_with_same_names_and_same_values(self):
        csv_data = "a,b,a,b\n" "1,3,1,3\n" "2,4,2,4\n"
        df = pd.read_csv(StringIO(csv_data))
        csv_data2 = "a,b\n" "1,3\n" "2,4\n"
        expected = pd.read_csv(StringIO(csv_data2))

        delete_duplicate_columns(df)

        assert list(df.columns) == ["a", "b"]
        assert_frame_equal(df, expected)