Python TermsCounterQueueの例

プログラミング言語: Python

名前空間/パッケージ名: termscounterqueue

クラス/型: TermsCounterQueue

hotexamples.comのコード掲載数: 2

Python TermsCounterQueue - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのtermscounterqueue.TermsCounterQueueの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

add_termscounter(1)

discard_termscounter(1)

get_termscounter(1)

コード例 #1

ファイルを表示

ファイル: topicdetector.py プロジェクト: pomber/cyclone

class TopicDetector(object):

	def __init__(self, terms_counter=None, topics_count=60, queue_size=12):
		self._terms_counter = terms_counter or TermsCounter()
		self.topics_count = topics_count
		self._tc_queue = TermsCounterQueue(queue_size)

	def get_topics(self, docset):
		docset_terms_counter = self._get_terms_counter(docset)
		self._tc_queue.add_termscounter(docset_terms_counter)
		
		discarded_termscounter = self._tc_queue.discard_termscounter()
		self._terms_counter.add(discarded_termscounter)

		current_termscounter = self._tc_queue.get_termscounter()
		weights = self._get_terms_weights(current_termscounter)
		top_terms = self._get_top_terms(weights)

		return [Topic(term, weights[term]) for term in top_terms[:self.topics_count]]

	def get_terms_counter(self):
		return self._terms_counter

	def _get_terms_counter(self, docset):
		terms_counter = TermsCounter()
		for doc in docset.stream():
			terms_counter.update(doc)
		return terms_counter

	def _get_terms_weights(self, terms_counter):
		weights = defaultdict(float)
		for term in terms_counter.list():
			tf = docprocessing.get_tf(term, terms_counter)
			idf = docprocessing.get_idf(term, self._terms_counter)
			weights[term] = tf * idf
		return weights

	def _get_top_terms(self, weights):
		return sorted(weights, key=weights.get, reverse=True)

コード例 #2

ファイルを表示

ファイル: topicdetector.py プロジェクト: pomber/cyclone

	def __init__(self, terms_counter=None, topics_count=60, queue_size=12):
		self._terms_counter = terms_counter or TermsCounter()
		self.topics_count = topics_count
		self._tc_queue = TermsCounterQueue(queue_size)