Esempi in Python per Doc.get_w

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: doc

Classe/tipologia: Doc

Metodo/funzione: get_w

Esempi su hotexamples.com: 2

Doc.get_w in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per doc.Doc.get_w, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Doc(30)

from_url(4)

add(3)

gen_biterms(3)

clear(2)

size(2)

parse(2)

get_w(2)

format(2)

fuse(2)

append(2)

applyChanges(2)

ajoute_sommet(2)

build_doc(1)

ngramfreqctx(1)

__setattr__(1)

sentence_tokenization(1)

save(1)

satisfies(1)

run(1)

response(1)

patch(1)

_id(1)

hasattr(1)

merge(1)

delete(1)

has_book_node(1)

hasId(1)

__getattr__(1)

from_xml_node(1)

astuple(1)

find_ner_tags(1)

display(1)

update(1)

Esempio n. 1

Mostra file

    def load_docs(self, docs_pt):
        print("load docs: " + docs_pt)
        rf = open(docs_pt)
        if not rf:
            print("file not found: " + docs_pt)

        for line in rf.readlines():
            d = Doc(line)
            biterms = []
            d.gen_biterms(biterms)
            # statistic the empirical word distribution
            for i in range(d.size()):
                w = d.get_w(i)
                self.pw_b[w] += 1
            for b in biterms:
                self.bs.append(b)

        self.pw_b.normalize()

Esempio n. 2

Mostra file

File: Model.py Progetto: Yang2018/Codes

    def load_docs(self, docs_pt):
        '''
        @description: 
        @param docs_pt:
        @return: 
        '''
        print("load docs: " + docs_pt)
        rf = open(docs_pt)
        if not rf:
            print("file not found: " + docs_pt)

        for line in rf.readlines():
            d = Doc(line)
            biterms = []  #一句话里的单词能组成的词对。
            d.gen_biterms(biterms)
            # statistic the empirical word distribution
            for i in range(d.size()):
                w = d.get_w(i)
                self.pw_b[w] += 1  #这行代码是在统计词频
            for b in biterms:
                self.bs.append(b)  #self.bs中添加的是一个biterm类。类的内容是这段文本中所有可能的词的组合.
        self.pw_b.normalize()  #做归一化处理,现在 pw_b中保存的是 词：词频率。