Python Majka 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: majka

메소드/함수: Majka

hotexamples.com에서의 예제들: 5

Python Majka - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 majka.Majka에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def _get_morph():
     morph = majka.Majka(os.path.join(NLP_DATA_PATH, 'majka.w-lt'))
     morph.tags = False
     morph.first_only = True
     morph.negative = "ne"
     morph.flags |= majka.IGNORE_CASE  # ignore the word case whatsoever
     return morph

예제 #2

파일 보기

def convert_words_into_lemmas(text, text_language):
    try:
        morph = majka.Majka("../majka/" + text_language + ".w-lt")
    except:
        return text

    result = ""
    for word in text.split():
        lemma_result = morph.find(word)
        if len(lemma_result) is 0:
            result += (" " + word)
        else:
            result += (" " + lemma_result[0]['lemma'])

    return result

예제 #3

파일 보기

 def init_lemmatizer(self, majka_path):
     lemmatizer = majka.Majka('{}\\{}'.format(majka_path, 'majka.w-lt'))
     lemmatizer.first_only = True
     lemmatizer.tags = False
     lemmatizer.negative = 'ne'
     return lemmatizer

예제 #4

파일 보기

import psycopg2
import os
import re
import sys
import majka
import json
import time

morph_cz = majka.Majka('/home/jhu/PycharmProjects/ConEv/nlp/majka.w-lt')
morph_en = majka.Majka('/home/jhu/PycharmProjects/ConEv/nlp/w-lt.en.fsa')
morph_de = majka.Majka('/home/jhu/PycharmProjects/ConEv/nlp/w-lt.ger.fsa')
# https://nlp.fi.muni.cz/czech-morphology-analyser/

db_connection = psycopg2.connect(
    "dbname=ConEv user=postgres password=forward host=127.0.0.1")
db = db_connection.cursor()


def find_word_attrs(word, language):

    #-----------------------------------------------------------------------------------------------CZ
    morph_cz.flags |= majka.ADD_DIACRITICS  # find word forms with diacritics
    morph_cz.flags |= majka.DISALLOW_LOWERCASE  # do not enable to find lowercase variants
    morph_cz.flags |= majka.IGNORE_CASE  # ignore the word case whatsoever
    morph_cz.flags = 0  # unset all flags

    morph_cz.tags = False  # return just the lemma, do not process the tags
    morph_cz.tags = True  # turn tag processing back on (default)

    morph_cz.compact_tag = True  # return tag in compact form (as returned by Majka)
    morph_cz.compact_tag = False  # do not return compact tag (default)

예제 #5

파일 보기

파일: czech_lemmatizer.py 프로젝트: MarekUlip/TextAnalysis

import majka

lemmatizer = majka.Majka('majka.w-lt')
lemmatizer.first_only = True
lemmatizer.tags = False
lemmatizer.negative = 'ne'


def lemmatize(word):
    lemma = lemmatizer.find(word)
    if len(lemma) > 0:
        return lemma[0]['lemma']
    else:
        return word