Python ner_feature 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rdt.nlp.classifier

메소드/함수: ner_feature

hotexamples.com에서의 예제들: 2

Python ner_feature - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rdt.nlp.classifier.ner_feature에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: classifier.py 프로젝트: juchiyama/bigdata_fall2015

	def test_evaluate(self):
		# the data sources
		ukr = self.source.find_clean({"subreddit" : "UkrainianConflict"}, limit=2500, batch_size=1000)
		askr = self.source.find_clean({"subreddit" : "AskReddit"}, limit=2500, batch_size=1000)
		alll = self.source.find_clean(limit=10000)
		tagger = ngrams.make_backoff_tagger()

		featuresets = [(cls.ner_feature(doc,tagger=tagger), "YES") for doc in ukr]
		featuresets.extend([(cls.ner_feature(doc,tagger=tagger), "NO") for doc in askr])
		random.shuffle(featuresets)
		
		trainset, testset = featuresets[1250:], featuresets[:1250]
		classifier = NaiveBayesClassifier.train(trainset)
		f = open("./UkrainianConflictNVM","w")
		for doc in alll:
			del (doc["_id"])
			truthiness = False
			truthiness = classifier.classify(cls.ner_feature(doc,tagger=tagger))
			if truthiness:
				f.write(json.dumps(doc) + "\n")
		f.close()
		print(nltk.classify.accuracy(classifier, testset))

예제 #2

파일 보기

파일: annotate.py 프로젝트: juchiyama/bigdata_fall2015

	def test_classbased(self):
		tagger = ngrams.make_backoff_tagger()
		params = {
			"corpora" : self.source,
			"labeled_set" : lambda : self.source.find_clean({"subreddit" : "fitness"}, batch_size=1000, limit=2000),
			"unlabeled_set" : lambda : self.source.find_clean({"subreddit" : "AskReddit"}, batch_size=1000, limit=2000),
			"feature" : lambda x : cls.ner_feature(x,tagger=tagger),
			"exit" : lambda self : self.corpora.exit()
		}

		pnb_a = annotate.PNBAnnotater(**params)
		pnb_a.train()
		pnb_a.describe()
		ct = 0
		for doc, annotation in pnb_a.classify_iter(self.source.find_clean()):
			ct += 1
			# print(doc)
			print(annotation)
			if ct == 10:
				break
			print("------------")