Python url2content 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: tools

메소드/함수: url2content

hotexamples.com에서의 예제들: 6

Python url2content - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 tools.url2content에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: lib_style_sheet.py 프로젝트: BGCX261/zone-align-svn-to-git

def construct_css(content,subdirectory,date,id_doc_xml,lg) : 
  list_css_filename = create_css_list(content)
  (dd,mm,yyyy) = date
  filename = '%d-%0.2d-%0.2d_celex_%s.%s.css'%(int(yyyy),int(mm),int(dd),id_doc_xml,lg)  
  path_css = os.path.join(subdirectory,filename)
  f = open(path_css,'w')
  style = get_style_balise_content(content)
  print >>f, style
  for url_css in list_css_filename :
    content_css = tools.url2content(url_css)
    print >>f, content_css
  f.close()
  return filename

예제 #2

파일 보기

파일: aspirateur_europa.py 프로젝트: BGCX261/zone-align-svn-to-git

def crawl(options):
    list_lg = options.languages
    start_date, end_date = starting_ending_date(options.period)
    directory = options.output_dir
    nb_pages = init_crawl(start_date, end_date, list_lg)

    cpt_done = 0
    for nb in xrange(1, nb_pages + 1):
        url = construct_urlpage(start_date, end_date, list_lg, nb)
        content = tools.url2content(url)
        list_entry = get_entry(content)
        for e in list_entry:
            cpt_done += 1
            cpt_done = check_sleep(cpt_done)
            (code_url, code_document) = e['ip']
            for lg in list_lg:
                if lg not in e['lg']:
                    continue
                if options.verbose:
                    print '/'.join(e['date']), code_document, lg
                url = e['lg'][lg]
                content = tools.url2content(url)
                process(content, code_url, directory, lg, e['date'], options)

예제 #3

파일 보기

파일: aspirateur_europa.py 프로젝트: BGCX261/zone-align-svn-to-git

def crawl(options) :
  list_lg = options.languages
  start_date, end_date = starting_ending_date(options.period)
  directory = options.output_dir
  nb_pages = init_crawl(start_date, end_date, list_lg)

  cpt_done = 0
  for nb in xrange(1, nb_pages+1) :
    url = construct_urlpage(start_date, end_date, list_lg, nb)
    content = tools.url2content(url)
    list_entry = get_entry(content)
    for e in list_entry :
      cpt_done += 1
      cpt_done = check_sleep(cpt_done)
      (code_url, code_document) = e['ip']
      for lg in list_lg :
        if lg not in e['lg'] :
          continue
        if options.verbose :
          print '/'.join(e['date']), code_document, lg 
        url = e['lg'][lg]
        content = tools.url2content(url)          
        process(content, code_url, directory, lg, e['date'], options)

예제 #4

파일 보기

def construct_css(content, subdirectory, date, id_doc_xml, lg):
    list_css_filename = create_css_list(content)
    (dd, mm, yyyy) = date
    filename = '%d-%0.2d-%0.2d_celex_%s.%s.css' % (int(yyyy), int(mm), int(dd),
                                                   id_doc_xml, lg)
    path_css = os.path.join(subdirectory, filename)
    f = open(path_css, 'w')
    style = get_style_balise_content(content)
    print >> f, style
    for url_css in list_css_filename:
        content_css = tools.url2content(url_css)
        print >> f, content_css
    f.close()
    return filename

예제 #5

파일 보기

파일: aspirateur_europa.py 프로젝트: BGCX261/zone-align-svn-to-git

def init_crawl(start_date, end_date, list_lg):
    url = construct_urlpage(start_date, end_date, list_lg, 1)
    content = tools.url2content(url)
    nb_pages = compute_nbpage(content)
    return int(nb_pages)

예제 #6

파일 보기

파일: aspirateur_europa.py 프로젝트: BGCX261/zone-align-svn-to-git

def init_crawl(start_date, end_date, list_lg) :
  url = construct_urlpage(start_date, end_date, list_lg, 1)
  content = tools.url2content(url)
  nb_pages = compute_nbpage(content)
  return int(nb_pages)