Python HundisambigAnalyzer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: langtools.utils.huntool_wrapper

클래스/타입: HundisambigAnalyzer

hotexamples.com에서의 예제들: 4

Python HundisambigAnalyzer - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 langtools.utils.huntool_wrapper.HundisambigAnalyzer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

HundisambigAnalyzer(1)

analyze(1)

예제 #1

파일 보기

파일: tool_wrapper.py 프로젝트: WajihCZ/hunmisc

 def __init__(self, params):
     hundisambig = Hundisambig(params['hundisambig_runnable'],
                               params['hundisambig_model'],
                               params['hundisambig_morphtable'],
                               params.get('ocamorph_encoding', 'iso-8859-2'),
                               True)
     self.morph_analyzer = HundisambigAnalyzer(hundisambig)

예제 #2

파일 보기

class HundisambigWrapper(PosTaggerWrapper, LemmatizerWrapper):
    def __init__(self, params):
        hundisambig = Hundisambig(
            params['hundisambig_runnable'], params['hundisambig_model'],
            params['hundisambig_morphtable'],
            params.get('ocamorph_encoding', 'iso-8859-2'), True)
        self.morph_analyzer = HundisambigAnalyzer(hundisambig)

    def add_pos_and_stems(self, tokens):
        """Adds POS tags and lemmatizes the words in @c tokens."""
        for sen_i, sen in enumerate(tokens):
            if sen == []:
                continue
            # TODO The API expects [sentences+], but it can only handle one :(
            ret = list(self.morph_analyzer.analyze([[word[0]
                                                     for word in sen]]))[0]
            for tok_i, _ in enumerate(sen):
                try:
                    spl = ret[tok_i][1].rsplit('|', 2)
                    tokens[sen_i][tok_i].append(spl[2])
                    tokens[sen_i][tok_i].append(spl[0])
                except Exception, e:
                    logging.warning("Exception:", str(e))
                    logging.warning(unicode(sen[tok_i]).encode('utf-8'))

예제 #3

파일 보기

파일: tool_wrapper.py 프로젝트: WajihCZ/hunmisc

class HundisambigWrapper(PosTaggerWrapper, LemmatizerWrapper):
    def __init__(self, params):
        hundisambig = Hundisambig(params['hundisambig_runnable'],
                                  params['hundisambig_model'],
                                  params['hundisambig_morphtable'],
                                  params.get('ocamorph_encoding', 'iso-8859-2'),
                                  True)
        self.morph_analyzer = HundisambigAnalyzer(hundisambig)

    def add_pos_and_stems(self, tokens):
        """Adds POS tags and lemmatizes the words in @c tokens."""
        for sen_i, sen in enumerate(tokens):
            if sen == []:
                continue
            # TODO The API expects [sentences+], but it can only handle one :(
            ret = list(self.morph_analyzer.analyze([[word[0] for word in sen]]))[0]
            for tok_i, _ in enumerate(sen):
                try:
                    spl = ret[tok_i][1].rsplit('|', 2)
                    tokens[sen_i][tok_i].append(spl[2])
                    tokens[sen_i][tok_i].append(spl[0])
                except Exception, e:
                    logging.warning("Exception:", str(e))
                    logging.warning(unicode(sen[tok_i]).encode('utf-8'))

예제 #4

파일 보기

 def __init__(self, params):
     hundisambig = Hundisambig(
         params['hundisambig_runnable'], params['hundisambig_model'],
         params['hundisambig_morphtable'],
         params.get('ocamorph_encoding', 'iso-8859-2'), True)
     self.morph_analyzer = HundisambigAnalyzer(hundisambig)