Python Lexicon.add示例

编程语言: Python

命名空间/包名称: inflexion.lexicon

类/类型: Lexicon

方法/功能: add

hotexamples.com的示例: 10

Python Lexicon.add - 已找到10个示例。这些是从开源项目中提取的最受好评的inflexion.lexicon.Lexicon.add现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Lexicon(7)

add(5)

find_stems(3)

示例#1

显示文件

文件： test.py 项目： michaelstorm/inflexion

 def test_lexicon(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "foo")
     self.assertEqual(lexicon.lemma_to_stems["FOO"],
                      [("bar", "foo", set())])
     self.assertEqual(lexicon.stem_to_lemma_key_regex["foo"],
                      {("FOO", "bar", ())})

示例#2

显示文件

文件： test.py 项目： michaelstorm/inflexion

 def setUp(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "foo")
     rules = StemmingRuleSet()
     self.rule = rules.add("barista", "|o><|llow")
     self.inflexion = Inflexion()
     self.inflexion.add_lexicon(lexicon)
     self.inflexion.add_stemming_rule_set(rules)

示例#3

显示文件

文件： test.py 项目： Tolchi/inflexion

 def setUp(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "foo")
     rules = StemmingRuleSet()
     self.rule = rules.add("barista", "|o><|llow")
     self.inflexion = Inflexion()
     self.inflexion.add_lexicon(lexicon)
     self.inflexion.add_stemming_rule_set(rules)

示例#4

显示文件

文件： test.py 项目： Tolchi/inflexion

 def test_find_stems_with_tags_2(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "faa", {'-a'})
     lexicon.add("FOO", "bar", "fee", {'-b'})
     self.assertEqual(
         lexicon.find_stems("FOO", "barista"),
         {"faa", "fee"}
     )

示例#5

显示文件

文件： fileformat.py 项目： diyclassics/greek-inflexion

def load_lexicon(lexicon_file, pre_processor=lambda x: x):
    lexicon = Lexicon()

    partnum_to_key_regex = {
        "1-": "P",
        "1-A": "PA",
        "1-M": "PM",
        "1+": "I",
        "2-": "F[AM]",
        "2-A": "FA",
        "2-M": "FM",
        "3-": "A[AM][NPDSO]",
        "3+": "A[AM]I",
        "3+A": "AAI",
        "3+M": "AMI",
        "4-": "XA",
        "4+": "YA",
        "5-": "X[MP]",
        "5+": "Y[MP]",
        "6-": "AP[NPDSO]",
        "6+": "API",
        "7-": "FP",
    }

    form_override = {}
    accent_override = defaultdict(list)

    with open(lexicon_file) as f:

        for lemma, entry in yaml.load(f).items():

            if "stems" not in entry:
                continue

            stems = []

            for partnum, stems in sorted(entry["stems"].items()):

                key_regex = partnum_to_key_regex[partnum]

                for stem, tag in split_stem_tags(stems):
                    lexicon.add(lemma, key_regex, pre_processor(stem), tag)

            for key_regex, stems in entry.get("stem_overrides", []):

                if stems is None:
                    continue

                for stem, tag in split_stem_tags(stems):
                    lexicon.add(lemma, key_regex, pre_processor(stem), tag)

            for key, form in entry.get("forms", {}).items():
                form_override[(lemma, key)] = form

            for key_regex, form in entry.get("accents", []):
                accent_override[lemma].append((key_regex, form))

    return lexicon, form_override, accent_override

示例#6

显示文件

文件： test.py 项目： Tolchi/inflexion

 def test_lexicon(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "foo")
     self.assertEqual(
         lexicon.lemma_to_stems["FOO"],
         [("bar", "foo", set())]
     )
     self.assertEqual(
         lexicon.stem_to_lemma_key_regex["foo"],
         {("FOO", "bar", ())}
     )

示例#7

显示文件

文件： test.py 项目： michaelstorm/inflexion

 def test_find_stems_with_tags_2(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "faa", {'-a'})
     lexicon.add("FOO", "bar", "fee", {'-b'})
     self.assertEqual(lexicon.find_stems("FOO", "barista"), {"faa", "fee"})

示例#8

显示文件

文件： test.py 项目： michaelstorm/inflexion

 def test_find_stems(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "foo")
     self.assertEqual(lexicon.find_stems("FOO", "barista"), {"foo"})

示例#9

显示文件

def load_lexicon(lexicon_file, pre_processor=lambda x: x):
    lexicon = Lexicon()

    partnum_to_key_regex = {
        "1-": "P",
        "1-A": "PA",
        "1-M": "PM",
        "1+": "I",
        "2-": "F[AM]",
        "2-A": "FA",
        "2-M": "FM",
        "3-": "A[AM][NPDSO]",
        "3+": "A[AM]I",
        "3+A": "AAI",
        "3+M": "AMI",
        "4-": "XA",
        "4+": "YA",
        "5-": "X[MP]",
        "5+": "Y[MP]",
        "6-": "AP[NPDSO]",
        "6+": "API",
        "7-": "FP",
        "8-": "Z[MP]",
        "M": "..M",
        "F": "..F",
        "N": "..N",
    }

    form_override = {}
    accent_override = defaultdict(list)

    with open(lexicon_file) as f:

        for lemma, entry in yaml.load(f).items():

            if "stems" in entry:

                stems = []

                for partnum, stems in sorted(
                    (entry["stems"] if entry.get("stems") else {}).items()):

                    key_regex = partnum_to_key_regex[partnum]

                    for stem, tag in split_stem_tags(stems):
                        lexicon.add(lemma, key_regex, pre_processor(stem), tag)

                for key_regex, stems in entry.get("stem_overrides", []):

                    if stems is None:
                        continue

                    for stem, tag in split_stem_tags(stems):
                        lexicon.add(lemma, key_regex, pre_processor(stem), tag)

            for key, form in entry.get("forms", {}).items():
                form_override[(lemma, key)] = form

            for key_regex, form in entry.get("accents", []):
                accent_override[lemma].append((key_regex, form))

    return lexicon, form_override, accent_override

示例#10

显示文件

文件： test.py 项目： Tolchi/inflexion

 def test_find_stems(self):
     lexicon = Lexicon()
     lexicon.add("FOO", "bar", "foo")
     self.assertEqual(lexicon.find_stems("FOO", "barista"), {"foo"})