Python get_web_text 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: urlannotator.tools.web_extractors

메소드/함수: get_web_text

hotexamples.com에서의 예제들: 3

Python get_web_text - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 urlannotator.tools.web_extractors.get_web_text에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: tests.py 프로젝트: dkoleda/urlannotator

    def testWebTextExtractor(self):
        text = get_web_text('http://google.com')
        self.assertTrue('google' in text)

        # Bad url should raise an exception
        with self.assertRaises(subprocess.CalledProcessError):
            get_web_text('weeeeeeeeeeeeeeeeeeeeeee')

예제 #2

파일 보기

파일: tests.py 프로젝트: dkoleda/urlannotator

    def testWebTextExtractor(self):
        text = get_web_text('http://google.com')
        self.assertTrue('google' in text)

        # Bad url should raise an exception
        with self.assertRaises(subprocess.CalledProcessError):
            get_web_text('weeeeeeeeeeeeeeeeeeeeeee')

예제 #3

파일 보기

파일: tasks.py 프로젝트: dkoleda/urlannotator

def web_content_extraction(sample_id, url=None, *args, **kwargs):
    """ Links/lynx required. Generates html output from those browsers.
    """
    if url is None:
        url = Sample.objects.get(id=sample_id).url

    if not is_proper_url(url):
        return False

    sample = Sample.objects.get(id=sample_id)

    try:
        text = get_web_text(url)

        Sample.objects.filter(id=sample_id).update(text=text)
        send_event(
            "EventSampleContentDone",
            sample_id=sample_id,
            sample_url=sample.url,
            job_id=sample.job_id,
        )
    except subprocess.CalledProcessError, e:
        # Something wrong has happened to links. Couldn't find documentation on
        # error codes - assume bad stuff has happened that retrying won't fix.
        send_event(
            'EventSampleContentFail',
            sample_id=sample_id,
            sample_url=sample.url,
            job_id=sample.job_id,
            error_code=e.returncode
        )
        return False