Python FileProcessor.generate_statisticsの例

プログラミング言語: Python

名前空間/パッケージ名: file_processor

クラス/型: FileProcessor

メソッド/関数: generate_statistics

hotexamples.comのコード掲載数: 2

Python FileProcessor.generate_statistics - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfile_processor.FileProcessor.generate_statisticsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

FileProcessor(28)

dir_to_files(13)

process(6)

match_file(6)

run(5)

read_file(4)

transform_features(3)

train(3)

_zip_bytes_io(2)

delete_csv(2)

generate_statistics(2)

process_file(1)

save_file(1)

retrieveData(1)

remove_output_dir(1)

read_in_chunks(1)

readFile(1)

process_files(1)

prepare(1)

_s3_prefix(1)

convert_file_names_to_name_data_dict(1)

parse_data(1)

_bucket_key_list(1)

main(1)

get_second_lowest_cost_lookup(1)

get_rate_code_lookup(1)

get_lines_as_array(1)

get_file_contents(1)

_upload_file_obj(1)

create_outfile(1)

update_outfile(1)

コード例 #1

ファイルを表示

ファイル: test_file_processor.py プロジェクト: Art95/jooble_test

    def test_generate_statistics_some_codes(self):
        needed_feature_codes = random.sample(self.feature_codes, k=2)

        file_processor = FileProcessor(self.input_file_path)
        actual_stats = file_processor.generate_statistics(needed_feature_codes)

        _, feature_codes, features = read_test_data_as_arrays(
            self.input_file_path)

        selected_indexes = []

        for code in needed_feature_codes:
            indexes = np.where(feature_codes == code)[0].tolist()
            selected_indexes += indexes

        selected_features = features[selected_indexes]

        expected_stats = {
            "count": np.uint32(selected_features.shape[0]),
            "mean": selected_features.mean(axis=0),
            "std": selected_features.std(axis=0, ddof=1),
            "max": np.amax(selected_features, axis=0),
            "min": np.amin(selected_features, axis=0)
        }

        for metric in expected_stats:
            np.testing.assert_allclose(actual_stats[metric],
                                       expected_stats[metric])

コード例 #2

ファイルを表示

ファイル: test_file_processor.py プロジェクト: Art95/jooble_test

    def test_generate_statistics_all_codes(self):
        file_processor = FileProcessor(self.input_file_path)
        actual_stats = file_processor.generate_statistics()

        _, _, features = read_test_data_as_arrays(self.input_file_path)

        expected_stats = {
            "count": np.uint32(features.shape[0]),
            "mean": features.mean(axis=0),
            "std": features.std(axis=0, ddof=1),
            "max": np.amax(features, axis=0),
            "min": np.amin(features, axis=0)
        }

        for metric in expected_stats:
            np.testing.assert_allclose(actual_stats[metric],
                                       expected_stats[metric])