Python load_nips 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: chowmein.data

메소드/함수: load_nips

hotexamples.com에서의 예제들: 6

Python load_nips - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 chowmein.data.load_nips에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_data.py 프로젝트: rafaelmaeuer/chowmein

def test_load_nips_raw():
    docs = data.load_nips(years=[2008], raw=True)
    assert_equal(len(docs), 250)
    assert_true(isinstance(docs[0], basestring))

    docs = data.load_nips(raw=True)
    assert_equal(len(docs), 2261)
    assert_true(isinstance(docs[0], basestring))

예제 #2

파일 보기

파일: test_data.py 프로젝트: rafaelmaeuer/chowmein

def test_load_nips_tokenized():
    docs = data.load_nips(years=[2008], raw=False)
    assert_equal(len(docs), 250)
    assert_true(isinstance(docs[0], list))

    docs = data.load_nips(raw=False)
    assert_equal(len(docs), 2261)
    assert_true(isinstance(docs[0], list))

예제 #3

파일 보기

파일: test_label_finder.py 프로젝트: xiaohan2012/chowmein

def test_label_finder():
    finder = BigramLabelFinder(measure='pmi', pos=None)
    labels = finder.find(load_nips(years=[2009]), top_n=5)
    assert_equal(labels, [(u'monte', u'carlo'),
                          (u'high', u'dimensional'),
                          (u'does', u'not'),  # not so good
                          (u'experimental', u'results'),
                          (u'nonparametric', u'bayesian')])

예제 #4

파일 보기

def test_label_finder():
    finder = BigramLabelFinder(measure='pmi', pos=None)
    labels = finder.find(load_nips(years=[2009]), top_n=5)
    assert_equal(
        labels,
        [
            (u'monte', u'carlo'),
            (u'high', u'dimensional'),
            (u'does', u'not'),  # not so good
            (u'experimental', u'results'),
            (u'nonparametric', u'bayesian')
        ])

예제 #5

파일 보기

def test_label_finder_with_pos():
    tagger = CorpusPOSTagger()
    finder = BigramLabelFinder(measure='pmi', pos=[('NN', 'NN'), ('JJ', 'NN')])

    docs = load_nips(years=[2009])
    docs = tagger.transform(docs)

    labels = finder.find(docs, top_n=5, strip_tags=False)

    assert_equal(labels, [((u'monte', 'NN'), (u'carlo', 'NN')),
                          ((u'nonparametric', 'JJ'), (u'bayesian', 'NN')),
                          ((u'active', 'JJ'), (u'learning', 'NN')),
                          ((u'machine', 'NN'), (u'learning', 'NN')),
                          ((u'semi-supervised', 'JJ'), (u'learning', 'NN'))])

    labels = finder.find(docs, top_n=5)

    assert_equal(labels, [(u'monte', u'carlo'),
                          (u'nonparametric', u'bayesian'),
                          (u'active', u'learning'), (u'machine', u'learning'),
                          (u'semi-supervised', u'learning')])

예제 #6

파일 보기

파일: test_label_finder.py 프로젝트: xiaohan2012/chowmein

def test_label_finder_with_pos():
    tagger = CorpusPOSTagger()
    finder = BigramLabelFinder(measure='pmi', pos=[('NN', 'NN'),
                                                   ('JJ', 'NN')])

    docs = load_nips(years=[2009])
    docs = tagger.transform(docs)

    labels = finder.find(docs, top_n=5, strip_tags=False)
    
    assert_equal(labels, [((u'monte', 'NN'), (u'carlo', 'NN')),
                          ((u'nonparametric', 'JJ'), (u'bayesian', 'NN')),
                          ((u'active', 'JJ'), (u'learning', 'NN')),
                          ((u'machine', 'NN'), (u'learning', 'NN')),
                          ((u'semi-supervised', 'JJ'), (u'learning', 'NN'))])

    labels = finder.find(docs, top_n=5)
    
    assert_equal(labels, [(u'monte', u'carlo'),
                          (u'nonparametric', u'bayesian'),
                          (u'active', u'learning'),
                          (u'machine', u'learning'),
                          (u'semi-supervised', u'learning')])