Python Lemmatizer Examples

Programming Language: Python

Namespace/Package Name: build_dict

Class/Type: Lemmatizer

Examples at hotexamples.com: 3

Python Lemmatizer - 3 examples found. These are the top rated real world Python examples of build_dict.Lemmatizer extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

lemma(2)

Example #1

Show file

File: synonyms.py Project: asivokon/ailas

class Synonyms:
    def __init__(self, filename='./data/th_uk_UA.dat.txt'):
        self.lemmatizer = Lemmatizer()
        self.synonyms = parse_synonyms(filename)
        self.lemmed_synonyms = {}
        for w, s in self.synonyms.items():
            self.lemmed_synonyms[self.lemmatizer.lemma(w)] = s

    def get_synonyms(self, word):
        if word in self.synonyms:
            return self.synonyms[word]
        return self.lemmed_synonyms.get(self.lemmatizer.lemma(word), [])

Example #2

Show file

File: synonyms.py Project: asivokon/ailas

def parse_synonyms(filename='./data/th_uk_UA.dat.txt'):
    lemmatizer = Lemmatizer()
    synonyms = OrderedDict()
    with open(filename) as f:
        word = None
        for line in f:
            if word is None and line is not None and not line.startswith('|'):
                word = line
            elif word is not None:
                word, syns = _process(word, line)
                # clean synonyms from too similar words
                lemma_word = lemmatizer.lemma(word)
                syns_filtered = [s for s in syns if lemma_word != lemmatizer.lemma(s)]
                if syns_filtered:
                    synonyms[word] = syns_filtered

                word = None

    return synonyms

Example #3

Show file

File: synonyms.py Project: asivokon/ailas

 def __init__(self, filename='./data/th_uk_UA.dat.txt'):
     self.lemmatizer = Lemmatizer()
     self.synonyms = parse_synonyms(filename)
     self.lemmed_synonyms = {}
     for w, s in self.synonyms.items():
         self.lemmed_synonyms[self.lemmatizer.lemma(w)] = s