Python Wrangler.parse_pdfの例

プログラミング言語: Python

名前空間/パッケージ名: wrangler

クラス/型: Wrangler

メソッド/関数: parse_pdf

hotexamples.comのコード掲載数: 2

Python Wrangler.parse_pdf - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのwrangler.Wrangler.parse_pdfの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Wrangler(6)

parse_pdf(2)

よく使われるメソッド

Wrangler (6)

parse_pdf (2)

コード例 #1

ファイルを表示

ファイル: main.py プロジェクト: adamturn/port-spider

def get_history():
    """Download historical vessel schedules."""

    src_dir = get_src_dir_path(__file__)
    data_dir = src_dir.parent / "data"

    start_date = datetime.date(year=2020, month=1, day=1)
    end_date = datetime.date(year=2020, month=1, day=10)
    time_delta = datetime.timedelta(days=1)

    file_paths = []
    jocasta = Spider()
    while start_date <= end_date:
        time.sleep(random.randrange(0, 5, 1))
        file_path = jocasta.crawl(data_dir, date=start_date)
        file_paths.append(file_path)
        start_date += time_delta
        
    for file_path in file_paths:
        if file_path.endswith('.xlsx'):
            print("unhandled xlsx file!")

        elif file_path.endswith('.pdf'):
            tables = Wrangler.parse_pdf(file_path)

        else:
            raise ValueError(f"Unexpected file type: {file_path}")

    return None

コード例 #2

ファイルを表示

ファイル: main.py プロジェクト: adamturn/port-spider

def main():
    """Main spider program processes the latest vessel schedule."""

    src_dir = get_src_dir_path(__file__)
    data_dir = src_dir.parent / "data"

    # TODO: testing on Nov 11, 2020
    file_path = Spider().crawl(data_dir, date=datetime.date(year=2020, month=11, day=11))
    # file_path = Spider().crawl(data_dir)

    if file_path.endswith('.xlsx'):
        print("unhandled xlsx file!")

    elif file_path.endswith('.pdf'):
        tables = Wrangler.parse_pdf(file_path)
        breakpoint()
    else:
        raise ValueError(f"Unexpected file type: {file_path}")

    return None