Python Page.get_contents Exemples

Langage de programmation: Python

Espace de nommage/Pack: fitz

Class/Type: Page

Méthode/Fonction: get_contents

Exemples au hotexamples.com: 3

Python Page.get_contents - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de fitz.Page.get_contents extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

getPixmap(7)

getText(7)

getImageBbox(3)

getImageList(3)

get_contents(3)

readContents(2)

get_pixmap(2)

annots(2)

bound(2)

cleanContents(2)

get_images(2)

get_xobjects(1)

get_texttrace(1)

get_text_blocks(1)

get_text(1)

_getContents(1)

get_image_rects(1)

get_drawings(1)

_wrapContents(1)

getContents(1)

getTextPage(1)

Méthodes fréquemment utilisées

getPixmap (7)

getText (7)

getImageBbox (3)

getImageList (3)

get_contents (3)

readContents (2)

get_pixmap (2)

annots (2)

bound (2)

cleanContents (2)

Méthodes fréquemment utilisées

get_images (2)

get_xobjects (1)

get_texttrace (1)

get_text_blocks (1)

get_text (1)

_getContents (1)

get_image_rects (1)

get_drawings (1)

_wrapContents (1)

getContents (1)

getTextPage (1)

Méthodes fréquemment utilisées

getTextPage (1)

Exemple #1

0

Afficher le fichier

def clip_page(cls, page: fitz.Page, bbox: fitz.Rect = None, zoom: float = 3.0): """Clip page pixmap (without text) according to ``bbox``. Args: page (fitz.Page): pdf page to extract. bbox (fitz.Rect, optional): Target area to clip. Defaults to None, i.e. entire page. zoom (float, optional): Improve resolution by this rate. Defaults to 3.0. Returns: dict: Raw dict of the extracted pixmap. """ # hide text before clip the image only # render Tr: set the text rendering mode # - 3: neither fill nor stroke the text -> invisible # read more: # - https://github.com/pymupdf/PyMuPDF/issues/257 # - https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/pdf_reference_archives/PDFReference.pdf doc = page.parent for xref in page.get_contents(): stream = doc.xrefStream(xref).replace(b'BT', b'BT 3 Tr') \ .replace(b'Tm', b'Tm 3 Tr') \ .replace(b'Td', b'Td 3 Tr') doc.updateStream(xref, stream) # improve resolution # - https://pymupdf.readthedocs.io/en/latest/faq.html#how-to-increase-image-resolution # - https://github.com/pymupdf/PyMuPDF/issues/181 bbox = page.rect if bbox is None else bbox & page.rect image = page.getPixmap(clip=bbox, matrix=fitz.Matrix(zoom, zoom)) # type: fitz.Pixmap return cls.to_raw_dict(image, bbox)

Exemple #2

0

Afficher le fichier

Fichier : ImagesExtractor.py Projet : ripsita/FileConverter

def _hide_page_text(cls, page: fitz.Page): """Hide page text before clipping page. Args: page (fitz.Page): pdf page to extract. """ # render Tr: set the text rendering mode # - 3: neither fill nor stroke the text -> invisible # read more: # - https://github.com/pymupdf/PyMuPDF/issues/257 # - https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/pdf_reference_archives/PDFReference.pdf doc = page.parent for xref in page.get_contents(): stream = doc.xrefStream(xref).replace(b'BT', b'BT 3 Tr') \ .replace(b'Tm', b'Tm 3 Tr') \ .replace(b'Td', b'Td 3 Tr') doc.updateStream(xref, stream)

Exemple #3

0

Afficher le fichier

def _hide_page_text(page: fitz.Page): '''Hide page text before clipping page.''' # NOTE: text might exist in both content stream and form object stream # - content stream, i.e. direct page content # - form object, i.e. contents referenced by this page xref_list = [ xref for (xref, name, invoker, bbox) in page.get_xobjects() ] xref_list.extend(page.get_contents()) # render Tr: set the text rendering mode # - 3: neither fill nor stroke the text -> invisible # read more: # - https://github.com/pymupdf/PyMuPDF/issues/257 # - https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/pdf_reference_archives/PDFReference.pdf doc = page.parent # type: fitz.Document for xref in xref_list: stream = doc.xref_stream(xref).replace(b'BT', b'BT 3 Tr') \ .replace(b'Tm', b'Tm 3 Tr') \ .replace(b'Td', b'Td 3 Tr') doc.update_stream(xref, stream)