Python Util.get_num_samples Examples

Programming Language: Python

Class/Type: Util

Method/Function: get_num_samples

Examples at hotexamples.com: 2

Python Util.get_num_samples - 2 examples found. These are the top rated real world Python examples of Util.get_num_samples from package charm4py extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

BuildHeader(30)

getWidgetValue(22)

Abort(10)

get_keys_values_of_dict(8)

Assert(8)

get_files_in_directory(7)

getSimpleJson(6)

multiply_matrix(5)

flatList(5)

adjust_angle(4)

istextenglish(4)

medoid(4)

extract_fragid(4)

canonical(4)

centroid(4)

get_ref_to_system_array(4)

linkToDict(4)

crossValidate(4)

getIntegralImage(4)

get_user_level(4)

Cache(4)

BuildMessage(4)

get_new_system_array(4)

delay(3)

isPython(3)

getPointerPosition(3)

is_color_alpha(3)

ASCIIColor(3)

makeQuaternion(3)

net(3)

generatebase64uuid(3)

matrix_error(3)

featureExtracion(2)

getPeriod(2)

isSoundFile(2)

data_date_convert(2)

getTwitterClient(2)

get_insert_into_sql_string(2)

filterchars(2)

get_outref_to_system_array(2)

get_num_samples(2)

full_url(2)

generateSshKeyPair(2)

idx2(2)

getProfilePath(2)

idx1(2)

getByName(2)

identity(2)

getCurrentProfile(2)

get_timenow(2)

Example #1

Show file

File: Retrieval.py Project: nmonath/NLPProject

def RunEKD(dirname, model, train_test='train',TopK=5):
	if train_test.lower() == 'train':
		Y = Util.LoadClassFile(os.path.join(dirname, 'train_classes.txt'))
	else:
		Y = Util.LoadClassFile(os.path.join(dirname, 'test_classes.txt'))




	# # Manditory settings for the Features Module. Others are up to you
	import Features as FeaturesModule
	FeaturesModule.FUNIT = FeaturesModule.FeatureUnits.WORD
	FeaturesModule.FTYPE = FeaturesModule.FeatureType.BINARY
	FeaturesModule.FREP = FeaturesModule.FeatureRepresentation.STRING
	FeaturesModule.REMOVE_FEATURES_APPEARING_IN_ONLY_ONE_DOCUMENT=False
	FeaturesModule.REMOVE_FEATURES_ONLY_APPEARING_ONE_TIME=False
	FeaturesModule.DisplayConfiguration()

	(feature_def, X) = FeaturesModule.Features(os.path.join(dirname, train_test), frep=FeaturesModule.FREP, ftype=FeaturesModule.FTYPE, funit=FeaturesModule.FUNIT)
	(word_idx, emb) = Word2VecExecuter.Word2VecLoadWordsHashTable(model, list(feature_def.T[0]))
	X = FeaturesModule.Features(os.path.join(dirname, train_test), frep=FeaturesModule.FREP, ftype=FeaturesModule.FTYPE, funit=FeaturesModule.FUNIT, feature=np.array(word_idx.keys()).reshape((len(word_idx), 1)))

 	count1 = 0
	N = Util.get_num_samples(os.path.join(dirname, train_test))
	dists = np.zeros((N,N))
	for i in xrange(0, N):
		Doc1 = EKD.Document(embeddings=emb[X[i, :], :]) 
		for j in xrange(0, N):
			if not i == j:
				Doc2 = EKD.Document(embeddings=emb[X[j, :], :])
				dists[i,j] = Doc1.distance(Doc2)

	precision = 0
	recall = 0
	print("\n**Results**")

	for i in xrange(0, N):
		R = dists[i,:].argsort()
		R = R[1:TopK]
		precision += Metrics.RetrievalPrecision(Y[i], Y[R])
		recall += Metrics.RetrievalRecall(Y[i], Y[R], Y, TopK)
		print("Document Number: " + str(i) + " Class: " + str(Y[i]))
		print("Top Matching Documents: " + str(R))
		print("Top Matching Documents (Associated Class Labels: " + str(Y[R]))
		print(" Precision: " + str(Metrics.RetrievalPrecision(Y[i], Y[R])) + " Recall: " + str(Metrics.RetrievalRecall(Y[i], Y[R], Y, TopK)))
	
	precision = precision / N
	recall = recall / N
	print("Average Precision: " + str(precision) + " Average Recall: " + str(recall))
	return (precision, recall)

	
# # This will be for pairwise
# # Compare document to every other document and say if they are the same or different
# def Run(FeaturesModule, dirname, train_test='train', Score Cut off):
# def RunEKD(dirname, train_test='train'):

Example #2

Show file

File: Retrieval.py Project: nmonath/NLPProject

def RunPAD(dirname, model, train_test, TopK=5):
	if train_test.lower() == 'train':
		Y = Util.LoadClassFile(os.path.join(dirname, 'train_classes.txt'))
	else:
		Y = Util.LoadClassFile(os.path.join(dirname, 'test_classes.txt'))


	count1 = 0
	N = Util.get_num_samples(os.path.join(dirname, train_test))
	dists = np.zeros((N,N))
	for filename1 in os.listdir(os.path.join(dirname, train_test)):
		count2 = 0
		if '.srl' in filename1:
			Doc1 = PAD.Document(doc_file_name=os.path.join(dirname, train_test, filename1), model=model, use_lemma=False)
			for filename2 in os.listdir(os.path.join(dirname, train_test)):
				if filename1 == filename2:
					dists[count1, count2] = 0
					count2 += 1
				elif '.srl' in filename2:
					Doc2 = PAD.Document(doc_file_name=os.path.join(dirname, train_test, filename2), model=model, use_lemma=False)
					dists[count1, count2] = Doc1.distance(Doc2)
					count2 += 1
			count1 += 1

	precision = 0
	recall = 0
	print("\n**Results**")
	for i in xrange(0, N):
		R = dists[i,:].argsort()
		R = R[1:TopK]
		precision += Metrics.RetrievalPrecision(Y[i], Y[R])
		recall += Metrics.RetrievalRecall(Y[i], Y[R], Y, TopK)
		print("Document Number: " + str(i) + " Class: " + str(Y[i]))
		print("Top Matching Documents: " + str(R))
		print("Top Matching Documents (Associated Class Labels: " + str(Y[R]))
		print(" Precision: " + str(Metrics.RetrievalPrecision(Y[i], Y[R])) + " Recall: " + str(Metrics.RetrievalRecall(Y[i], Y[R], Y, TopK)))
	
	precision = precision / N
	recall = recall / N
	print("Average Precision: " + str(precision) + " Average Recall: " + str(recall))
	return (precision, recall)