Python Parser 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pattern.text

클래스/타입: Parser

hotexamples.com에서의 예제들: 24

Python Parser - 24개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pattern.text.Parser에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

find_tags(7)

find_tokens(5)

find_chunks(1)

예제 #1

파일 보기

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") in (PENN, None):
         kwargs.setdefault("map", lambda token, tag: (token, tag))
     if kwargs.get("tagset") == UNIVERSAL:
         kwargs.setdefault(
             "map", lambda token, tag: penntreebank2universal(token, tag))
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #2

파일 보기

    def find_tags(self, tokens, **kwargs):

        # Parser.find_tags() can take an optional map(token, tag) function,
        # which returns an updated (token, tag)-tuple for each token. 

        kwargs.setdefault("map", parole2penntreebank)
        return Parser.find_tags(self, tokens, **kwargs)

예제 #3

파일 보기

파일: __init__.py 프로젝트: DataBranner/pattern

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") in (PENN, None):
         kwargs.setdefault("map", lambda token, tag: (token, tag))
     if kwargs.get("tagset") == UNIVERSAL:
         kwargs.setdefault(
             "map", lambda token, tag: penntreebank2universal(token, tag))
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #4

파일 보기

 def find_tokens(self, tokens, **kwargs):
     # 's in Dutch preceded by a vowel indicates plural ("auto's"): don't replace.
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", {"'n": " 'n"})
     s = _Parser.find_tokens(self, tokens, **kwargs)
     s = [re.sub(r"' s (ochtends|morgens|middags|avonds)", "'s \\1", s) for s in s]
     return s

예제 #5

파일 보기

파일: __init__.py 프로젝트: BarcelonaMedia-ViL/pattern

 def find_tokens(self, tokens, **kwargs):
     # 's in Dutch preceded by a vowel indicates plural ("auto's"): don't replace.
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", {"'n": " 'n"})
     s = _Parser.find_tokens(self, tokens, **kwargs)
     s = [re.sub(r"' s (ochtends|morgens|middags|avonds)", "'s \\1", s) for s in s]
     return s

예제 #6

파일 보기

파일: __init__.py 프로젝트: pattern3/pattern

 def find_tokens(self, tokens, **kwargs):
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", replacements)
     s = _Parser.find_tokens(self, tokens, **kwargs)
     s = [s.replace("&rsquo ;", u"’") if isinstance(
         s, unicode) else s for s in s]
     return s

예제 #7

파일 보기

 def find_tokens(self, tokens, **kwargs):
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", replacements)
     #return _Parser.find_tokens(self, tokens, **kwargs)
     
     s = _Parser.find_tokens(self, tokens, **kwargs)
     s = [s.replace(" &contraction ;", u"'").replace("XXX -", "-") for s in s]
     return s

예제 #8

파일 보기

파일: __init__.py 프로젝트: Afey/pattern

 def find_tokens(self, tokens, **kwargs):
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", replacements)
     #return _Parser.find_tokens(self, tokens, **kwargs)
     
     s = _Parser.find_tokens(self, tokens, **kwargs)
     s = [s.replace(" &contraction ;", u"'").replace("XXX -", "-") for s in s]
     return s

예제 #9

파일 보기

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") != STTS:
         kwargs.setdefault("map", stts2penntreebank)
     # The lexicon uses Swiss spelling: "ss" instead of "ß".
     # We restore the "ß" after parsing.
     tokens_ss = [t.replace(u"ß", "ss") for t in tokens]
     tokens_ss = _Parser.find_tags(self, tokens_ss, **kwargs)
     return [[w] + tokens_ss[i][1:] for i, w in enumerate(tokens)]

예제 #10

파일 보기

 def find_tokens(self, tokens, **kwargs):
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", replacements)
     s = _Parser.find_tokens(self, tokens, **kwargs)
     s = [
         s.replace("&rsquo ;", "’") if isinstance(s, str) else s for s in s
     ]
     return s

예제 #11

파일 보기

파일: __init__.py 프로젝트: Maulanadurer/pattern

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") in (PENN, None):
         kwargs.setdefault("map", lambda token, tag: stts2penntreebank(token, tag))
     if kwargs.get("tagset") == UNIVERSAL:
         kwargs.setdefault("map", lambda token, tag: stts2universal(token, tag))
     if kwargs.get("tagset") is STTS:
         kwargs.setdefault("map", lambda token,tag: (token, tag))
     # The lexicon uses Swiss spelling: "ss" instead of "ß".
     # We restore the "ß" after parsing.
     tokens_ss = [t.replace(u"ß", "ss") for t in tokens]
     tokens_ss = _Parser.find_tags(self, tokens_ss, **kwargs)
     return [[w] + tokens_ss[i][1:] for i, w in enumerate(tokens)]

예제 #12

파일 보기

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") in (PENN, None):
         kwargs.setdefault("map", lambda token, tag: stts2penntreebank(token, tag))
     if kwargs.get("tagset") == UNIVERSAL:
         kwargs.setdefault("map", lambda token, tag: stts2universal(token, tag))
     if kwargs.get("tagset") is STTS:
         kwargs.setdefault("map", lambda token,tag: (token, tag))
     # The lexicon uses Swiss spelling: "ss" instead of "ß".
     # We restore the "ß" after parsing.
     tokens_ss = [t.replace(u"ß", "ss") for t in tokens]
     tokens_ss = _Parser.find_tags(self, tokens_ss, **kwargs)
     return [[w] + tokens_ss[i][1:] for i, w in enumerate(tokens)]

예제 #13

파일 보기

파일: __init__.py 프로젝트: DevKhokhar/pattern

 def find_chunks(self, tokens, **kwargs):
     return _Parser.find_chunks(self, tokens, **kwargs)

예제 #14

파일 보기

파일: __init__.py 프로젝트: DevKhokhar/pattern

 def find_tags(self, tokens, **kwargs):
     kwargs.setdefault("map", tagset2penntreebank)
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #15

파일 보기

파일: __init__.py 프로젝트: DevKhokhar/pattern

 def find_tokens(self, tokens, **kwargs):
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", REPLACEMENTS)
     return _Parser.find_tokens(self, tokens, **kwargs)

예제 #16

파일 보기

 def find_chunks(self, tokens, **kwargs):
     return _Parser.find_chunks(self, tokens, **kwargs)

예제 #17

파일 보기

 def find_tags(self, tokens, **kwargs):
     kwargs.setdefault("map", tagset2penntreebank)
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #18

파일 보기

 def find_tokens(self, tokens, **kwargs):
     kwargs.setdefault("abbreviations", ABBREVIATIONS)
     kwargs.setdefault("replace", REPLACEMENTS)
     return _Parser.find_tokens(self, tokens, **kwargs)

예제 #19

파일 보기

파일: __init__.py 프로젝트: BarcelonaMedia-ViL/pattern

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") != WOTAN:
         kwargs.setdefault("map", wotan2penntreebank)
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #20

파일 보기

파일: __init__.py 프로젝트: BarcelonaMedia-ViL/pattern

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") != PAROLE:
         kwargs.setdefault("map", parole2penntreebank)
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #21

파일 보기

파일: __init__.py 프로젝트: lazycrazyowl/pattern

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") != WOTAN:
         kwargs.setdefault("map", wotan2penntreebank)
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #22

파일 보기

파일: pattern.py 프로젝트: jgsogo/lingwars

 def find_tags(self, tokens, **kwargs):
     # Parser.find_tags() can take an optional map(token, tag) function,
     # which returns an updated (token, tag)-tuple for each token.
     kwargs.setdefault("map", parole2penntreebank)
     return Parser.find_tags(self, tokens, **kwargs)

예제 #23

파일 보기

파일: __init__.py 프로젝트: lazycrazyowl/pattern

 def find_tags(self, tokens, **kwargs):
     if kwargs.get("tagset") != PAROLE:
         kwargs.setdefault("map", parole2penntreebank)
     return _Parser.find_tags(self, tokens, **kwargs)

예제 #24

파일 보기

파일: Python_Computational_Linguistics_Redefine_Find_Token( ).py 프로젝트: VakinduPhilliam/Python_Computation_Linguistics

    def find_tokens(self, tokens, **kwargs):

        kwargs.setdefault("abbreviations", ABBREVIATIONS)
        kwargs.setdefault("replace", CONTRACTIONS)
        return Parser.find_tokens(self, tokens, **kwargs)