Python _get_languages Exemples

Langage de programmation: Python

Espace de nommage/Pack: extractors.constants

Méthode/Fonction: _get_languages

Exemples au hotexamples.com: 3

Python _get_languages - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de extractors.constants._get_languages extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

withName

firstattr

get_text_links

xml_document

length

Signature

twitterCommunication

UpYun

build_request

sameProxiedObjects

Related in langs

getDatumBisOfReservierung (PHP)

last_week_range (PHP)

ADMasterErrorLog (C#)

PositiveMoney (C#)

feh (C++)

fei (C++)

NewDiscoveryClient (Go)

NewGroupWebService (Go)

LibraryKind (Java)

Entry (Java)

Exemple #1

0

Afficher le fichier

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" if TESSDATA_PREFIX is None: raise ValueError('Env TESSDATA_PREFIX is not set, OCR will not work.') key, text = get_cache(data) if text is not None: return text try: img = Image.open(StringIO(data)) except Exception as ex: log.debug('Failed to parse image internally: %r', ex) return '' # TODO: play with contrast and sharpening the images. try: languages = _get_languages(languages) extractor = Tesseract(TESSDATA_PREFIX, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug('OCR done: %s, %s characters extracted', languages, len(text)) set_cache(key, text) return text except Exception as ex: log.exception(ex) return ''

Exemple #2

0

Afficher le fichier

Fichier : tesseract.py Projet : pudo/extractors

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" if TESSDATA_PREFIX is None: raise ValueError("Env TESSDATA_PREFIX is not set, OCR will not work.") key, text = get_cache(data) if text is not None: return text try: img = Image.open(StringIO(data)) except Exception as ex: log.debug("Failed to parse image internally: %r", ex) return "" # TODO: play with contrast and sharpening the images. try: languages = _get_languages(languages) extractor = Tesseract(TESSDATA_PREFIX, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug("OCR done: %s, %s characters extracted", languages, len(text)) set_cache(key, text) return text except Exception as ex: log.exception(ex) return ""

Exemple #3

0

Afficher le fichier

Fichier : tesseract.py Projet : 01-/extractors

def _get_tesseract(): # FIXME: not currently loading small language sets. languages = _get_languages(None) if not hasattr(tess, 'instance'): tess.instance = Tesseract(TESSDATA_PREFIX, languages) tess.instance.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) return tess.instance