Python PdfWriter.remove_text 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: PyPDF2

클래스/타입: PdfWriter

메소드/함수: remove_text

hotexamples.com에서의 예제들: 2

Python PdfWriter.remove_text - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 PyPDF2.PdfWriter.remove_text에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

PdfWriter(21)

write(16)

add_page(12)

insert_page(4)

add_bookmark(3)

add_uri(2)

add_metadata(2)

remove_text(2)

encrypt(2)

append_pages_from_reader(2)

add_link(2)

add_blank_page(1)

update_page_form_field_values(1)

set_page_mode(1)

add_attachment(1)

remove_links(1)

remove_images(1)

pdf_header(1)

insert_blank_page(1)

add_named_destination(1)

get_named_dest_root(1)

add_bookmark_destination(1)

clone_document_from_reader(1)

_set_page_layout(1)

_get_page_layout(1)

add_js(1)

_get_page_mode(1)

예제 #1

파일 보기

파일: test_writer.py 프로젝트: mstamy2/PyPDF2

def test_remove_text(input_path, ignore_byte_string_object):
    pdf_path = os.path.join(RESOURCE_ROOT, input_path)

    reader = PdfReader(pdf_path)
    writer = PdfWriter()

    page = reader.pages[0]
    writer.insert_page(page, 0)
    writer.remove_text(ignore_byte_string_object=ignore_byte_string_object)

    # finally, write "output" to PyPDF2-output.pdf
    tmp_filename = "dont_commit_writer_removed_text.pdf"
    with open(tmp_filename, "wb") as output_stream:
        writer.write(output_stream)

    # Cleanup
    os.remove(tmp_filename)

예제 #2

파일 보기

파일: test_writer.py 프로젝트: mstamy2/PyPDF2

def test_remove_text_all_operators(ignore_byte_string_object):
    stream = (b"BT "
              b"/F0 36 Tf "
              b"50 706 Td "
              b"36 TL "
              b"(The Tj operator) Tj "
              b'1 2 (The double quote operator) " '
              b"(The single quote operator) ' "
              b"ET")
    pdf_data = (
        b"%%PDF-1.7\n"
        b"1 0 obj << /Count 1 /Kids [5 0 R] /Type /Pages >> endobj\n"
        b"2 0 obj << >> endobj\n"
        b"3 0 obj << >> endobj\n"
        b"4 0 obj << /Length %d >>\n"
        b"stream\n" + (b"%s\n" % stream) + b"endstream\n"
        b"endobj\n"
        b"5 0 obj << /Contents 4 0 R /CropBox [0.0 0.0 2550.0 3508.0]\n"
        b" /MediaBox [0.0 0.0 2550.0 3508.0] /Parent 1 0 R"
        b" /Resources << /Font << >> >>"
        b" /Rotate 0 /Type /Page >> endobj\n"
        b"6 0 obj << /Pages 1 0 R /Type /Catalog >> endobj\n"
        b"xref 1 6\n"
        b"%010d 00000 n\n"
        b"%010d 00000 n\n"
        b"%010d 00000 n\n"
        b"%010d 00000 n\n"
        b"%010d 00000 n\n"
        b"%010d 00000 n\n"
        b"trailer << /Root 6 0 R /Size 6 >>\n"
        b"startxref\n%d\n"
        b"%%%%EOF")
    startx_correction = -1
    pdf_data = pdf_data % (
        len(stream),
        pdf_data.find(b"1 0 obj") + startx_correction,
        pdf_data.find(b"2 0 obj") + startx_correction,
        pdf_data.find(b"3 0 obj") + startx_correction,
        pdf_data.find(b"4 0 obj") + startx_correction,
        pdf_data.find(b"5 0 obj") + startx_correction,
        pdf_data.find(b"6 0 obj") + startx_correction,
        # startx_correction should be -1 due to double % at the beginning indiducing an error on startxref computation
        pdf_data.find(b"xref"),
    )
    print(pdf_data.decode())
    pdf_stream = BytesIO(pdf_data)

    reader = PdfReader(pdf_stream, strict=False)
    writer = PdfWriter()

    page = reader.pages[0]
    writer.insert_page(page, 0)
    writer.remove_text(ignore_byte_string_object=ignore_byte_string_object)

    # finally, write "output" to PyPDF2-output.pdf
    tmp_filename = "dont_commit_writer_removed_text.pdf"
    with open(tmp_filename, "wb") as output_stream:
        writer.write(output_stream)

    # Cleanup
    os.remove(tmp_filename)