Python Extractor.Extractor 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: com.lish.ajia.googlescholar.extractor

클래스/타입: Extractor

메소드/함수: Extractor

hotexamples.com에서의 예제들: 5

Python Extractor.Extractor - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 com.lish.ajia.googlescholar.extractor.Extractor.Extractor에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

pinMaxQuery(7)

getInstance(7)

Extractor(5)

extract_from_source(3)

_Extractor__merge_into_extractedmap(1)

getNodesByPersonName(1)

getNodesByPubs(1)

예제 #1

파일 보기

    def test_matchPub(self):
        self.extractor = Extractor().getInstance()
        pubdao = PublicationDao()
        person_id = 13419
        person_name = 'jie tang'
        # Read sources from files
        all_models = {}
        for page in range(0, 3):
            filename = "".join((person_name, '_page_', str(page), '.html'))
            f = file(os.path.join(self.settings.source_dir, filename), 'r')
            html = f.read()
            models = self.extractor.extract_from_source(html)
            if models is not None:
                self.extractor._Extractor__merge_into_extractedmap(
                    all_models, models)
        print 'Total found DEBUG  %s items.' % len(all_models)

        # part 2
        pubs = pubdao.getPublicationByPerson(person_id,
                                             self.settings.generation)

        printout = False
        if printout:
            for key, models in all_models.items():
                print key, " --> ", models
            print '==================='
            for pub in pubs:
                print pub

        (pubs_matched, pubs_not_matched) = self.matchPub(pubs, all_models)
        print '- test done -', len(pubs_matched), len(pubs_not_matched)
        return pubs_not_matched

예제 #2

파일 보기

파일: _________test_extractor.py 프로젝트: yinonbaron/aminer-spider

 def test_getNodesByPersonName(self):
     '''Test method getNodesByPersonName.'''
     print '-TEST-:', self.test_extractFromPage.__doc__.strip()
     e = Extractor()
     models = e.getNodesByPersonName('jie tang')
     for model in models:
         print model
     print '-END TEST-'

예제 #3

파일 보기

    def test_fetchByPubs(self, pubs):
        '''Test use a list of pubs that not found in person search'''
        print '-- test fetchByPubs %s pubs', len(pubs)
        new_pubs = []
        for pub in pubs:
            new_pubs.append((pub, 'jie tang'))

        extractor = Extractor()
        extractor.getNodesByPubs(new_pubs)
        print '- test done -'

예제 #4

파일 보기

파일: _________test_extractor.py 프로젝트: yinonbaron/aminer-spider

 def __init__(self):
     self.extractor = Extractor().getInstance()

예제 #5

파일 보기

 def __init__(self):
     self.extractor = Extractor().getInstance()
     self.settings = Settings.getInstance()