Exemplos de Tesseract.set_page_seg_mode em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: tesserwrap

Classe / Tipo: Tesseract

Método / Função: set_page_seg_mode

Exemplos em hotexamples.com: 7

Tesseract.set_page_seg_mode em Python - 7 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de tesserwrap.Tesseract.set_page_seg_mode em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Tesseract(9)

ocr_image(7)

clear(4)

get_text(3)

set_page_seg_mode(3)

set_variable(3)

get_mean_confidence(2)

get_utf8_text(2)

set_image(2)

get_words(1)

Métodos Frequentes

Tesseract (9)

ocr_image (7)

clear (4)

get_text (3)

set_page_seg_mode (3)

set_variable (3)

get_mean_confidence (2)

get_utf8_text (2)

set_image (2)

get_words (1)

Relacionados

Plotter

Cache

check_exists_s3

Viterbi

AdapterManagerMixin

create_identity_matrix

gen_random_arrays

PriceList

warn_out

make_hash

Related in langs

phorum_date (PHP)

drupal_install_profile_distribution_name (PHP)

ProductDataSql (C#)

DEREncoding (C#)

register_alloc_info (C++)

CanProspectIndustry (C++)

Call (Go)

GenerateId (Go)

TileEntityTreasure (Java)

CxxCompilationDatabaseUtils (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: tesseract.py Projeto: wilbrodn/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text try: img = Image.open(StringIO(data)) except DecompressionBombWarning as dce: log.debug("Image too large: %", dce) return None except IOError as ioe: log.info("Unknown image format: %r", ioe) return None # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_image(img) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.get_text() or '' text = text.decode(encoding="UTF-8") # extractor.clear() log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text

Exemplo n.º 2

0

Exibir arquivo

Arquivo: tesseract.py Projeto: CodeForAfrica/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text try: img = Image.open(StringIO(data)) except DecompressionBombWarning as dce: log.debug("Image too large: %", dce) return None except IOError as ioe: log.info("Unknown image format: %r", ioe) return None # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) extractor.clear() log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text

Exemplo n.º 3

0

Exibir arquivo

Arquivo: tesseract.py Projeto: pudo/extractors

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" if TESSDATA_PREFIX is None: raise ValueError("Env TESSDATA_PREFIX is not set, OCR will not work.") key, text = get_cache(data) if text is not None: return text try: img = Image.open(StringIO(data)) except Exception as ex: log.debug("Failed to parse image internally: %r", ex) return "" # TODO: play with contrast and sharpening the images. try: languages = _get_languages(languages) extractor = Tesseract(TESSDATA_PREFIX, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug("OCR done: %s, %s characters extracted", languages, len(text)) set_cache(key, text) return text except Exception as ex: log.exception(ex) return ""

Exemplo n.º 4

0

Exibir arquivo

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" if TESSDATA_PREFIX is None: raise ValueError('Env TESSDATA_PREFIX is not set, OCR will not work.') key, text = get_cache(data) if text is not None: return text try: img = Image.open(StringIO(data)) except Exception as ex: log.debug('Failed to parse image internally: %r', ex) return '' # TODO: play with contrast and sharpening the images. try: languages = _get_languages(languages) extractor = Tesseract(TESSDATA_PREFIX, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug('OCR done: %s, %s characters extracted', languages, len(text)) set_cache(key, text) return text except Exception as ex: log.exception(ex) return ''

Exemplo n.º 5

0

Exibir arquivo

Arquivo: coc-auto.py Projeto: saez0pub/coc-auto

def ocrImage(tagDest,tessdataPrefix,lang,charWhitelist,pageMode): destOcrImg = "/tmp/"+genymotion_vm_name+"-"+tagDest+".png" print "OCR : "+str(destOcrImg) #OCR Def tr = Tesseract(tessdataPrefix, lang) tr.set_variable("tessedit_char_whitelist", charWhitelist) tr.set_page_seg_mode(pageMode) #OCR image = Image.open(destOcrImg) tr.set_image(image) return tr.get_utf8_text()

Exemplo n.º 6

0

Exibir arquivo

Arquivo: tesseract.py Projeto: tomjie/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text img = Image.open(StringIO(data)) # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text

Exemplo n.º 7

0

Exibir arquivo

Arquivo: tesseract.py Projeto: nivertech/aleph

def extract_image_data(data, languages=None): """Extract text from a binary string of data.""" tessdata_prefix = get_config('TESSDATA_PREFIX') if tessdata_prefix is None: raise IngestorException("TESSDATA_PREFIX is not set, OCR won't work.") languages = get_languages_iso3(languages) text = Cache.get_ocr(data, languages) if text is not None: return text img = Image.open(StringIO(data)) # TODO: play with contrast and sharpening the images. extractor = Tesseract(tessdata_prefix, lang=languages) extractor.set_page_seg_mode(PageSegMode.PSM_AUTO_OSD) text = extractor.ocr_image(img) log.debug('OCR done: %s, %s characters extracted', languages, len(text)) Cache.set_ocr(data, languages, text) return text