Python PriorFactory 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: scattertext.PriorFactory

클래스/타입: PriorFactory

hotexamples.com에서의 예제들: 5

Python PriorFactory - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 scattertext.PriorFactory.PriorFactory에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

PriorFactory(5)

자주 사용되는 메소드들

PriorFactory (5)

예제 #1

파일 보기

파일: test_PriorFactory.py 프로젝트: weizhao-BME/scattertext

 def test_align_to_target(self):
     full_corpus = get_test_corpus()
     corpus = full_corpus.remove_categories(['swift'])
     priors = PriorFactory(full_corpus).use_all_categories().get_priors()
     with self.assertRaises(ValueError):
         (LogOddsRatioInformativeDirichletPrior(priors).get_scores(
             *corpus.get_term_freq_df().values.T))
     priors = (PriorFactory(full_corpus).use_all_categories().
               align_to_target(corpus).get_priors())
     (LogOddsRatioInformativeDirichletPrior(priors).get_scores(
         *corpus.get_term_freq_df().values.T))

예제 #2

파일 보기

파일: test_PriorFactory.py 프로젝트: rjhere/scattertext

    def test_neutral_categories(self):
        corpus = get_test_corpus()
        priors = (PriorFactory(
            corpus, 'hamlet', starting_count=0.001,
            not_categories=['swift']).use_neutral_categories().get_priors())
        self.assertEqual(priors.min(), 0.001)
        self.assertEqual(priors.shape[0], corpus._X.shape[1])

        corpus = get_test_corpus()
        priors = (PriorFactory(
            corpus, 'hamlet', starting_count=0.001, not_categories=[
                'swift'
            ]).use_neutral_categories().drop_zero_priors().get_priors())

        jzcnts = corpus.get_term_freq_df()['jay-z/r. kelly freq'].where(
            lambda x: x > 0).dropna()
        np.testing.assert_equal(priors.values, jzcnts.values + 0.001)

예제 #3

파일 보기

파일: test_PriorFactory.py 프로젝트: rjhere/scattertext

 def test_all_categories(self):
     corpus = get_test_corpus()
     priors, my_corpus = (PriorFactory(
         corpus, starting_count=0,
         category='hamlet').use_all_categories().build())
     tdf = corpus.get_term_freq_df()
     self.assertEqual(len(priors), len(tdf))
     np.testing.assert_equal(priors.values,
                             corpus.get_term_freq_df().sum(axis=1).values)

예제 #4

파일 보기

파일: test_PriorFactory.py 프로젝트: tanvijain13/CS5590-490-0001-Python-and-Deep-Learning-Programming-

	def test_get_custom_term_frequencies(self):
		corpus = get_test_corpus()
		fact = (PriorFactory(corpus, starting_count=0.04)
			.use_custom_term_frequencies(pd.Series({'halt': 3, 'i': 8}))
			.drop_zero_priors()
			)
		priors, clean_corpus = fact.build()
		self.assertEqual(set(clean_corpus.get_terms()), {'i', 'halt'})
		np.testing.assert_equal(priors.sort_values().values, [3.04, 8.04])

예제 #5

파일 보기

파일: test_PriorFactory.py 프로젝트: rjhere/scattertext

    def test_get_general_term_frequencies(self):
        corpus = get_test_corpus()
        fact = (PriorFactory(corpus,
                             category='hamlet',
                             not_categories=['swift'],
                             starting_count=0).use_general_term_frequencies().
                use_all_categories())
        priors, clean_corpus = fact.build()

        expected_prior = pd.merge(
            corpus.get_term_doc_count_df(),
            corpus.get_term_and_background_counts()[['background']],
            left_index=True,
            right_index=True,
            how='left').fillna(0.).sum(axis=1)

        np.testing.assert_allclose(priors.values, expected_prior.values)