Python parse示例

编程语言: Python

命名空间/包名称: philologic.shlaxtree

方法/功能: parse

hotexamples.com的示例: 4

Python parse - 已找到4个示例。这些是从开源项目中提取的最受好评的philologic.shlaxtree.parse现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： shlaxtractor2.py 项目： ARTFL-Project/libphilo

def extract(filename,text):
    biblio = {}
    root = st.parse(text)
    header = root.find("teiHeader")
    
    biblio["filename"] = filename    

    for author in bib_metadata["auth_name"]:
	if header.findtext(author):
	    biblio["author"] = header.findtext(author)
	    break

    for auth_date in bib_metadata["auth_dates"]:
	if header.findtext(auth_date):
	    biblio["auth_date"] = header.findtext(auth_date)
	    break

    for gender in bib_metadata["auth_gender"]:
        if header.findtext(gender):
            biblio["gender"] = header.findtext(gender)
            break

    for title in bib_metadata["titles"]:
	if header.findtext(title):
	    biblio["title"] = header.findtext(title)
	    break

    for cr_date in bib_metadata["createdate"]:
	if header.findtext(cr_date):
	    biblio["date"] = int(header.findtext(cr_date))
	    break

    for genre in bib_metadata["text_genre"]:
	if header.findtext(genre):
	    biblio["genre"] = header.findtext(genre)
	    break

    for publisher in bib_metadata["publishers"]:
        if header.findtext(publisher):
            biblio["publisher"] = header.findtext(publisher)
            break

    for pub_place in bib_metadata["pub_places"]:
        if header.findtext(pub_place):
            biblio["pub_place"] = header.findtext(pub_place)
            break

    return biblio

示例#2

显示文件

文件： shlaxtractor2.py 项目： pleonard212/PhiloLogic4

def extract(filename, text):
    biblio = {}
    root = st.parse(text)
    header = root.find("teiHeader")

    biblio["filename"] = filename

    for author in bib_metadata["auth_name"]:
        if header.findtext(author):
            biblio["author"] = header.findtext(author)
            break

    for auth_date in bib_metadata["auth_dates"]:
        if header.findtext(auth_date):
            biblio["auth_date"] = header.findtext(auth_date)
            break

    for gender in bib_metadata["auth_gender"]:
        if header.findtext(gender):
            biblio["gender"] = header.findtext(gender)
            break

    for title in bib_metadata["titles"]:
        if header.findtext(title):
            biblio["title"] = header.findtext(title)
            break

    for cr_date in bib_metadata["createdate"]:
        if header.findtext(cr_date):
            biblio["date"] = int(header.findtext(cr_date))
            break

    for genre in bib_metadata["text_genre"]:
        if header.findtext(genre):
            biblio["genre"] = header.findtext(genre)
            break

    for publisher in bib_metadata["publishers"]:
        if header.findtext(publisher):
            biblio["publisher"] = header.findtext(publisher)
            break

    for pub_place in bib_metadata["pub_places"]:
        if header.findtext(pub_place):
            biblio["pub_place"] = header.findtext(pub_place)
            break

    return biblio

示例#3

显示文件

文件： elements.py 项目： pleonard212/PhiloLogic4

#!/usr/bin/env python
import philologic.shlaxtree as st
import sys
import codecs

for filename in sys.argv[1:]:
    file = codecs.open(filename, "r", "utf-8")
    root = st.parse(file)
    header = root.find("teiHeader")
    print st.et.tostring(header)
    print header.findtext(".//titleStmt/title")
    print header.findtext(".//titleStmt/author")

示例#4

显示文件

文件： elements.py 项目： ARTFL-Project/libphilo

#!/usr/bin/env python
import philologic.shlaxtree as st
import sys
import codecs

for filename in sys.argv[1:]:
    file = codecs.open(filename,"r","utf-8")
    root = st.parse(file)
    header = root.find("teiHeader")
    print st.et.tostring(header)
    print header.findtext(".//titleStmt/title")
    print header.findtext(".//titleStmt/author")