Python HaloNotebook.stop_and_persist 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: halo

클래스/타입: HaloNotebook

메소드/함수: stop_and_persist

hotexamples.com에서의 예제들: 2

Python HaloNotebook.stop_and_persist - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 halo.HaloNotebook.stop_and_persist에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

start(23)

HaloNotebook(22)

succeed(16)

stop(15)

text(7)

fail(6)

_output(2)

stop_and_persist(2)

clear(1)

color(1)

info(1)

placement(1)

spinner(1)

warn(1)

예제 #1

파일 보기

def add_features(input_file, output_file, force):
    """ Runs build features scripts to turn processed data from (../processed) into
        improved data (saved in ../processed as well).

        Parameters
        ----------
        input_file: str
            Input file to be processed
        output_file: str
            Output processed file
        force: bool
            Force to process the input file
    """
    spinner = Halo(text='Building features...', spinner='dots')

    clean_data = pd.read_csv(input_file)

    # Add lat/lon columns
    if force or not os.path.exists(output_file):
        spinner.start("Adding Latitude and Longitude columns")
        transformed_data = apply_nomatin(clean_data)
        transformed_data.to_csv(output_file, index=False)
        spinner.succeed("Latitude and Longitude features added!")
    else:
        spinner.start("Loading transformed file...")
        time.sleep(2)
        transformed_data = pd.read_csv(output_file)
        spinner.stop_and_persist(text="Transformed file already exists!")

    # Combine features
    transformed_data = combine_features(transformed_data)

    transformed_data.to_csv(output_file, index=False)

    return transformed_data

예제 #2

파일 보기

def process_dataset(input_file, output_file, scrape):
    """ Runs data processing scripts to turn raw data from (../raw) into
        cleaned data ready to be analyzed (saved in ../processed).

        Parameters
        ----------
        input_file: str
            Input file to be processed
        output_file: str
            Output processed file
        scrape: bool
            Force the scraping process
    """
    spinner = Halo(text='Making dataset...', spinner='dots')
    logger = logging.getLogger(__name__)
    logger.info('Making final dataset from raw data')
    # Scrape data
    if scrape or not os.path.exists(input_file):
        spinner.start("Scraping data")
        with open('./references/urls.txt', 'r') as f:
            urls = f.readlines()
        scraped_dfs = []
        for url in urls:
            scraped_dfs.append(navigate(url, 1, 500))
        # Save results
        raw_data = pd.concat(scraped_dfs)
        raw_data.to_csv(input_file, index=False)
        spinner.succeed("Data Scrapped!")
    else:
        spinner.succeed("Loading scraped file...")
        raw_data = pd.read_csv(input_file)
        spinner.succeed("Scraped file already exists!")

    # Remove duplicates
    spinner.start("Removing duplicates and invalid values...")
    time.sleep(1)
    interim_data = remove_duplicates_and_na(raw_data)
    interim_data.to_csv(output_file.replace("processed", "interim"),
                        index=False)
    spinner.succeed("Done removing duplicates!")

    # Remove outliers
    spinner.start("Removing outliers and inconsistent values...")
    time.sleep(1)
    final_data = remove_outliers(interim_data)
    final_data.to_csv(output_file, index=False)
    spinner.succeed("Done removing outliers!")
    spinner.start("Cleaning processing done!")
    spinner.stop_and_persist(symbol='✔'.encode('utf-8'),
                             text="Cleaning processing done!")

    return final_data