Ejemplo n.º 1
0
def GenList(filePath, att="", bAddTail=False):
    dataParse.init()
    sentences = dataParse.GetGensimList(filePath, att, bAddTail=bAddTail)
    genList = dataParse.CleanWords_gensim(sentences,
                                          nMinLen=1,
                                          att=att,
                                          bAddTail=bAddTail)
    return genList
Ejemplo n.º 2
0
def sample3():
    dataParse.init()
    # 获得出现次数最多的前20个分词  每个分词 词性是 n  最小长度是 2
    topList = dataParse.GetBookTop("f0.txt", 20, "n", 2)

    # 生成条状图
    draw.barh_dict(topList)
    # 生成词云
    draw.ToWordCloud_dict(dict(topList))
Ejemplo n.º 3
0
def sample1():
    dataParse.init()
    #提取关键字的形式分词,并生成词云
    dataParse.jiebaFenciByAtt("f0.txt",att="nr",num=100,bExtractKey=True)
Ejemplo n.º 4
0
def sample2():
    #根据词性 分词,生成词云
    dataParse.init()
    wlist=dataParse.GetCutWords_Att("f0.txt","ns")
    draw.ToWordCloud(wlist)