Python IterWords示例

编程语言: Python

命名空间/包名称: koch.proto.util

方法/功能: IterWords

hotexamples.com的示例: 5

Python IterWords - 已找到5个示例。这些是从开源项目中提取的最受好评的koch.proto.util.IterWords现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： tf_idf.py 项目： trs225/koch

 def pipe(self, key, value):
   doc = value
   for word in set(w.text for w in util.IterWords(doc)):
     new_doc = document_pb2.Document()
     new_doc.CopyFrom(doc)
     
     yield str(word), new_doc

示例#2

显示文件

文件： tf_idf.py 项目： trs225/koch

  def pipe(self, key, value):
    doc = value
    for word in set(w.text for w in util.IterWords(doc)):
      keyword = document_pb2.Keyword()
      keyword.word = word
      keyword.doc_count = 1
      keyword.total_doc_count = self.n

      yield str(word), keyword

示例#3

显示文件

文件： naive_bayes.py 项目： trs225/koch

    def pipe(self, key, value):
        doc = value
        label = Label(doc, self.label, self.classes)
        for word in set(w.text for w in util.IterWords(doc)):
            keyword = document_pb2.Keyword()
            keyword.word = word
            keyword.prior[label] = 1

            yield str(word), keyword

示例#4

显示文件

文件： tf_idf.py 项目： trs225/koch

  def pipe(self, key, value):
    doc, keyword = value
    term_count = 0
    doc_term_count = 0
    for word in (w.text for w in util.IterWords(doc)):
      doc_term_count += 1
      if word == keyword.word:
        term_count += 1
        
    keyword.term_count = term_count
    keyword.tf_idf = self.score(
        term_count, doc_term_count, keyword.doc_count, keyword.total_doc_count)
    doc.keywords.extend([keyword])

    if float(keyword.doc_count) / keyword.total_doc_count > self.min_df:
      yield str(doc.url), doc

示例#5

显示文件

文件： naive_bayes.py 项目： trs225/koch

 def weight(self, doc, word):
     return sum(1 for w in util.IterWords(doc) if w.text == word)