Python VectorQuantization示例

编程语言: Python

命名空间/包名称: vectorization

hotexamples.com的示例: 2

Python VectorQuantization - 已找到2个示例。这些是从开源项目中提取的最受好评的vectorization.VectorQuantization现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

bigram_vector(2)

morphosyntactic_vector(2)

示例#1

显示文件

文件： classification.py 项目： Ernesttt/Trainer

	def classify_comment(self, comment, classifier_type='SVM', no_classes=5):
		sentiment = None
		preprocessor = Preprocessing()
		vectorizer = VectorQuantization()
		if classifier_type == 'SVM':
			preprocessed_comment = preprocessor.preprocessing(comment)
			comment_vector = vectorizer.morphosyntactic_vector(preprocessed_comment)
			sentiment = classifier_svm.classify(comment_vector)
			if no_classes == 5:
				return sentiment
			elif no_classes == 3:
				if sentiment == u'positivo' or sentiment == u'muy_positivo':
					return u'positivo'
				elif sentiment == u'negativo' or sentiment == u'muy_negativo':
					return u'negativo'
				else:
					return sentiment
		elif classifier_type == 'MNB':
			preprocessed_comment = preprocessor.preprocessing(comment)
			comment_vector = vectorizer.bigram_vector(preprocessed_comment)
			sentiment = classifier_mnb.classify(comment_vector)
			if no_classes == 5:
				return sentiment
			elif no_classes == 3:
				if sentiment == u'positivo' or sentiment == u'muy_positivo':
					return u'positivo'
				elif sentiment == u'negativo' or sentiment == u'muy_negativo':
					return u'negativo'
				else:
					return sentiment

示例#2

显示文件

文件： models.py 项目： Ernesttt/Trainer

	def create(self, corpus_path, model_type="morphosyntactic"):
		preprocessor = Preprocessing()
		vectorizer = VectorQuantization()
		document_list = []
		with codecs.open(corpus_path, 'r', 'utf-8') as corpus:
			line = corpus.readline()
			while line:
				comment = preprocessor.preprocessing(line.split('/|/')[1])
				category = line.split('/|/')[2].split('\n')[0]
				if model_type == "morphosyntactic":
					comment_vector = vectorizer.morphosyntactic_vector(comment)
				elif model_type == "bigram":
					comment_vector = vectorizer.bigram_vector(comment)
				else:
					print "No model defined using default: morphosyntactic"
					comment_vector = vectorizer.morphosyntactic_vector(comment)
				if comment_vector:
					document_list.append(pattern_Document(comment_vector, 
														  type=category))
				line = corpus.readline()
		model = pattern_Model(documents=document_list, weight=None)
		return model