Python Twitter.parse示例

编程语言: Python

命名空间/包名称: konlpy.tag

类/类型: Twitter

方法/功能: parse

hotexamples.com的示例: 1

Python Twitter.parse - 已找到1个示例。这些是从开源项目中提取的最受好评的konlpy.tag.Twitter.parse现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Twitter(30)

morphs(30)

nouns(30)

pos(30)

phrases(11)

add_dictionary(5)

parse(1)

set_visible(1)

strip(1)

texts_to_sequences(1)

示例#1

显示文件

文件： tokenizer.py 项目： kjyggg-sketch/DAlmaden

class Morph :
    def __init__(self, nlpEngine = "Mecab"):
        '''e
        원하는 형태소 분석기 엔진으로 형태소 분석기 생성
        :param nlpEngine: 형태소 분석기 이름(첫글자 대문자) str
        '''
        self.nlpEngine = nlpEngine
        if nlpEngine == "Okt":
            self.nlp = Okt()
        elif nlpEngine == "Komoran":
            self.nlp = Komoran()
        elif nlpEngine == "Kkma":
            self.nlp = Kkma()
        elif nlpEngine == "Hannanum":
            self.nlp = Hannanum()
        elif nlpEngine == "Mecab":
            self.nlp = Mecab()
        elif nlpEngine == "Twitter":
            self.nlp = Twitter()
        else:
            raise NameError("unknown nlp name")

    def get_morphs(self, sentence, norm=True, stem=True, join=False):
        if self.nlpEngine == "Mecab":
            try :
                a = self.nlp.parse(sentence)
                b = [aa.split(',') for aa in a.split('\n')][:-2]
                if stem :
                    s = [[d[3],d[0].split('\t')[1]] for d in b]
                else :
                    s = [d[0].split('\t') for d in b]
                if join :
                    j = ['/'.join(ss) for ss in s]
                else :
                    j = [tuple(ss) for ss in s]
                return j
            except :
                return []
        else :
            return self.nlp.pos(sentence, norm=norm, stem=stem, join=join)

    def get_nouns(self,text):
        if self.nlpEngine == "Mecab" :
            all_tags_raw1 = self.nlp.parse(text).split("\n")
            all_tags_raw2 = [tt.split(",")[0] for tt in all_tags_raw1]
            all_tags = [t.split("\t") for t in all_tags_raw2]
            nounList = []
            for tags in all_tags :
                if len(tags) == 2 :
                    if tags[1][0:2] in ['NN','NP'] :
                        nounList.append(tags[0])
            print(nounList)
            return nounList
        else :
            return self.nlp.nouns(text)

    def get_nouns(self,text):
        if self.nlpEngine == "Mecab" :
            all_tags_raw1 = self.nlp.parse(text).split("\n")
            all_tags_raw2 = [tt.split(",")[0] for tt in all_tags_raw1]
            all_tags = [t.split("\t") for t in all_tags_raw2]
            nounList = []
            for tags in all_tags :
                if len(tags) == 2 :
                    if tags[1][0:2] in ['NN','NP'] :
                        nounList.append(tags[0])
            print(nounList)
            return nounList
        else :
            return self.nlp.nouns(text)