Python Cache.set_ocr Exemples

Langage de programmation: Python

Espace de nommage/Pack: aleph.model

Class/Type: Cache

Méthode/Fonction: set_ocr

Exemples au hotexamples.com: 4

Python Cache.set_ocr - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de aleph.model.Cache.set_ocr extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

get_cache(5)

set_cache(5)

get_ocr(2)

set_ocr(2)

Méthodes fréquemment utilisées

get_cache (5)

set_cache (5)

get_ocr (2)

set_ocr (2)

Associées

randomUuid

fmttime

expand_path

ChainClassLookup

admin_serialize_node

get_nout

convert2group

get_certificate

NotificationBar

uploadProxy

Related in langs

EmailAddressValidator (PHP)

_prime_comment_caches (PHP)

LawyerParameter (C#)

MovieCommentRequest (C#)

sqlite3PagerWrite (C++)

storeValues (C++)

NewParserWithOptions (Go)

SetBody (Go)

Action (Java)

ServerInstrumentation (Java)

Exemple #1

0

Afficher le fichier

Fichier : tesseract.py Projet : CodeForAfrica/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text try: img = Image.open(StringIO(data)) except DecompressionBombWarning as dce: log.debug("Image too large: %", dce) return None except IOError as ioe: log.info("Unknown image format: %r", ioe) return None # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) extractor.clear() log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text

Exemple #2

0

Afficher le fichier

Fichier : tesseract.py Projet : wilbrodn/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text try: img = Image.open(StringIO(data)) except DecompressionBombWarning as dce: log.debug("Image too large: %", dce) return None except IOError as ioe: log.info("Unknown image format: %r", ioe) return None # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_image(img) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.get_text() or '' text = text.decode(encoding="UTF-8") # extractor.clear() log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text

Exemple #3

0

Afficher le fichier

Fichier : tesseract.py Projet : tomjie/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text img = Image.open(StringIO(data)) # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text

Exemple #4

0

Afficher le fichier

Fichier : tesseract.py Projet : nivertech/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text img = Image.open(StringIO(data)) # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text