Python pdfdata_to_textの例

プログラミング言語: Python

名前空間/パッケージ名: billy.fulltext

メソッド/関数: pdfdata_to_text

hotexamples.comのコード掲載数: 15

Python pdfdata_to_text - 15件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのbilly.fulltext.pdfdata_to_textの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

def extract_text(oyster_doc, data):
    text = pdfdata_to_text(data)
    lines = text.splitlines()
    line_num_re = re.compile('\s*-\d+-')  # number:  -#-
    for i, line in enumerate(lines):
        if 'LEGISLATIVE RESOLUTION' in line:
            break
    text = ' '.join(line for line in lines[i:] if not line_num_re.match(line))
    return text

コード例 #2

ファイルを表示

ファイル: __init__.py プロジェクト: BrandonLewis/openstates

def extract_text(oyster_doc, data):
    text = pdfdata_to_text(data)
    lines = text.splitlines()
    line_num_re = re.compile('\s*-\d+-')  # number:  -#-
    for i, line in enumerate(lines):
        if 'LEGISLATIVE RESOLUTION' in line:
            break
    text = ' '.join(line for line in lines[i:]
                    if not line_num_re.match(line))
    return text

コード例 #3

ファイルを表示

ファイル: __init__.py プロジェクト: ritchiewilson/openstates

def extract_text(oyster_doc, data):
    if oyster_doc["metadata"]["mimetype"] == "application/pdf":
        return text_after_line_numbers(pdfdata_to_text(data))

コード例 #4

ファイルを表示

ファイル: __init__.py プロジェクト: apd3691/openstates

def extract_text(oyster_doc, data):
    text = pdfdata_to_text(data)
    return text_after_line_numbers(text)

コード例 #5

ファイルを表示

def extract_text(oyster_doc, data):
    return text_after_line_numbers(pdfdata_to_text(data))

コード例 #6

ファイルを表示

ファイル: __init__.py プロジェクト: annerajb/openstates

def extract_text(oyster_doc, data):
    if oyster_doc['metadata']['mimetype'] == 'application/pdf':
        return text_after_line_numbers(pdfdata_to_text(data))

コード例 #7

ファイルを表示

def extract_text(oyster_doc, data):
    if oyster_doc['metadata']['mimetype'] == 'application/pdf':
        return text_after_line_numbers(pdfdata_to_text(data))

コード例 #8

ファイルを表示

ファイル: __init__.py プロジェクト: BrandonLewis/openstates

def extract_text(oyster_doc, data):
    lines = pdfdata_to_text(data).splitlines()
    no_big_indent = re.compile('^\s{0,10}\S')
    text = '\n'.join(line for line in lines if no_big_indent.match(line))
    return text

コード例 #9

ファイルを表示

ファイル: __init__.py プロジェクト: BrandonLewis/openstates

def extract_text(oyster_doc, data):
    return ' '.join(line for line in pdfdata_to_text(data).splitlines()
                    if re.findall('[a-z]', line))

コード例 #10

ファイルを表示

ファイル: __init__.py プロジェクト: annerajb/openstates

def extract_text(oyster_doc, data):
    text = pdfdata_to_text(data)
    return text_after_line_numbers(text).encode('ascii', 'ignore')

コード例 #11

ファイルを表示

ファイル: __init__.py プロジェクト: rzar/openstates

def extract_text(oyster_doc, data):
    text = pdfdata_to_text(data)
    return text_after_line_numbers(text).encode('ascii', 'ignore')

コード例 #12

ファイルを表示

def extract_text(oyster_doc, data):
    lines = pdfdata_to_text(data).splitlines()
    no_big_indent = re.compile('^\s{0,10}\S')
    text = '\n'.join(line for line in lines if no_big_indent.match(line))
    return text

コード例 #13

ファイルを表示

ファイル: __init__.py プロジェクト: BrandonLewis/openstates

def extract_text(oyster_doc, data):
    is_pdf = (oyster_doc['metadata']['mimetype'] == 'application/pdf' or
              oyster_doc['url'].endswith('.pdf'))
    if is_pdf:
        return text_after_line_numbers(pdfdata_to_text(data))

コード例 #14

ファイルを表示

ファイル: __init__.py プロジェクト: annerajb/openstates

def extract_text(oyster_doc, data):
    return ' '.join(line for line in pdfdata_to_text(data).splitlines()
                    if re.findall('[a-z]', line))

コード例 #15

ファイルを表示

ファイル: __init__.py プロジェクト: annerajb/openstates

def extract_text(oyster_doc, data):
    is_pdf = (oyster_doc['metadata']['mimetype'] == 'application/pdf'
              or oyster_doc['url'].endswith('.pdf'))
    if is_pdf:
        return text_after_line_numbers(pdfdata_to_text(data))