Python map_dataframe 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: catalyst.utils

메소드/함수: map_dataframe

hotexamples.com에서의 예제들: 2

Python map_dataframe - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 catalyst.utils.map_dataframe에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: dataset.py 프로젝트: catalyst-team/dl-course

def get_cat_dogs_dataset(
    dirs: str = "/app/data/data_cat_dogs/*",
    extension: str = "*.jpg",
    test_size: float = 0.2,
    random_state: int = 42,
    tag_file_path: tp.Optional[str] = None,
) -> tp.Tuple[tp.Dict[str, tp.Any], tp.Dict[str, tp.Any], int]:
    dataset = utils.create_dataset(dirs=dirs, extension=extension)
    df = utils.create_dataframe(dataset, columns=["class", "filepath"])

    tag_to_label = utils.get_dataset_labeling(df, "class")
    if tag_file_path is not None:
        with open(tag_file_path, "w") as file:
            json.dump(tag_to_label, file)

    df_with_labels = utils.map_dataframe(
        df,
        tag_column="class",
        class_column="label",
        tag2class=tag_to_label,
        verbose=False,
    )

    train_data, valid_data = utils.split_dataframe_train_test(
        df_with_labels, test_size=test_size, random_state=random_state)
    return (
        train_data.to_dict("records"),
        valid_data.to_dict("records"),
        len(tag_to_label),
    )

예제 #2

파일 보기

def prepare_splits(args):
    tag2class = dict(safitty.load(args.labeling))
    df_with_labels = map_dataframe(pd.read_csv(args.df),
                                   tag_column="class",
                                   class_column="label",
                                   tag2class=tag2class,
                                   verbose=False)
    train_data, val_data = train_test_split(df_with_labels,
                                            random_state=args.seed,
                                            test_size=args.test)
    train_data.to_csv(os.path.join(args.out_path, 'train.csv'), index=False)
    val_data.to_csv(os.path.join(args.out_path, 'valid.csv'), index=False)