Python canon_links示例

编程语言: Python

命名空间/包名称: canon_foreign

方法/功能: canon_links

hotexamples.com的示例: 4

Python canon_links - 已找到4个示例。这些是从开源项目中提取的最受好评的canon_foreign.canon_links现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： canon_russian.py 项目： benwing2/RuNounChanges

import blib
import ru_translit
from canon_foreign import canon_links

pa = blib.init_argparser("Canonicalize Russian and translit")
pa.add_argument("--cattype", default="borrowed",
    help="""Categories to examine ('vocab', 'borrowed', 'translation',
'links', 'pagetext', 'pages' or comma-separated list)""")
pa.add_argument("--page-file",
    help="""File containing "pages" to process when --cattype pagetext,
or list of pages when --cattype pages""")

params = pa.parse_args()
startFrom, upTo = blib.parse_start_end(params.start, params.end)
pages_to_do = []
if params.page_file:
  for line in codecs.open(params.page_file, "r", encoding="utf-8"):
    line = line.strip()
    if params.cattype == "pages":
      pages_to_do.append(line)
    else:
      m = re.match(r"^Page [0-9]+ (.*?): [^:]*: Processing (.*?)$", line)
      if not m:
        msg("WARNING: Unable to parse line: [%s]" % line)
      else:
        pages_to_do.append(m.groups())

canon_links(params.save, params.verbose, params.cattype, "ru", "Russian",
    "Cyrl", ru_translit, startFrom, upTo, pages_to_do=pages_to_do)

示例#2

显示文件

    help="""File containing "pages" to process when --cattype pagetext,
or list of pages when --cattype pages""")

params = pa.parse_args()
startFrom, upTo = blib.parse_start_end(params.start, params.end)
pages_to_do = []
if params.page_file:
    for line in codecs.open(params.page_file, "r", encoding="utf-8"):
        line = line.strip()
        if params.cattype == "pages":
            pages_to_do.append(line)
        else:
            m = re.match(r"^Page [0-9]+ (.*?): [^:]*: Processing (.*?)$", line)
            if not m:
                m = re.match(r"\* \[\[(.*?)]]: .*?<nowiki>(.*?)</nowiki>$",
                             line)
            if not m:
                msg("WARNING: Unable to parse line: [%s]" % line)
            else:
                pages_to_do.append(m.groups())

canon_links(params.save,
            params.verbose,
            params.cattype,
            "grc",
            "Ancient Greek", ["polytonic", "Grek"],
            grc_translit,
            startFrom,
            upTo,
            pages_to_do=pages_to_do)

示例#3

显示文件

文件： canon_russian.py 项目： benwing2/RuNounChanges

    "--page-file",
    help="""File containing "pages" to process when --cattype pagetext,
or list of pages when --cattype pages""")

params = pa.parse_args()
startFrom, upTo = blib.parse_start_end(params.start, params.end)
pages_to_do = []
if params.page_file:
    for line in codecs.open(params.page_file, "r", encoding="utf-8"):
        line = line.strip()
        # FIXME: We don't yet support a cattype list containing 'pages'
        if params.cattype == "pages":
            pages_to_do.append(line)
        else:
            m = re.match(r"^Page [0-9]+ (.*?): [^:]*: Processing (.*?)$", line)
            if not m:
                msg("WARNING: Unable to parse line: [%s]" % line)
            else:
                pages_to_do.append(m.groups())

canon_links(params.save,
            params.verbose,
            params.cattype,
            "ru",
            "Russian",
            "Cyrl",
            ru_translit,
            startFrom,
            upTo,
            pages_to_do=pages_to_do)

示例#4

显示文件

文件： canon_greek.py 项目： benwing2/RuNounChanges

from canon_foreign import canon_links

pa = blib.init_argparser("Canonicalize Greek and translit")
pa.add_argument("--cattype", default="borrowed",
    help="""Categories to examine ('vocab', 'borrowed', 'translation',
'links', 'pagetext', 'pages' or comma-separated list)""")
pa.add_argument("--page-file",
    help="""File containing "pages" to process when --cattype pagetext,
or list of pages when --cattype pages""")

params = pa.parse_args()
startFrom, upTo = blib.parse_start_end(params.start, params.end)
pages_to_do = []
if params.page_file:
  for line in codecs.open(params.page_file, "r", encoding="utf-8"):
    line = line.strip()
    if params.cattype == "pages":
      pages_to_do.append(line)
    else:
      m = re.match(r"^Page [0-9]+ (.*?): [^:]*: Processing (.*?)$", line)
      if not m:
        m = re.match(r"\* \[\[(.*?)]]: .*?<nowiki>(.*?)</nowiki>$", line)
      if not m:
        msg("WARNING: Unable to parse line: [%s]" % line)
      else:
        pages_to_do.append(m.groups())

canon_links(params.save, params.verbose, params.cattype, "grc", "Ancient Greek",
    ["polytonic", "Grek"], grc_translit, startFrom, upTo,
    pages_to_do=pages_to_do)