コード例 #1
0
	def __init__(self) :
	
		Mall.__init__(self)

		self.SITE_HOME = 'https://www.wconcept.co.kr/Life/008'
		#self.SITE_HOME = 'https://www.wconcept.co.kr/Life/001014'
		
		self.SITE_ORG_HOME = 'https://www.wconcept.co.kr'
		
		self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

		
		
		self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
		self.C_CATEGORY_TYPE = ''
		
		#container > div > div.lnb_wrap.lnb_depth > dl > dd > a
		
		#self.C_CATEGORY_VALUE = '#container > div > div.filter_wrap > div.filter_con > ul.depth.depth4.category > li > p > button'
		self.C_CATEGORY_VALUE = '#container > div > div.lnb_wrap.lnb_depth > dl > dd > a'
		self.C_CATEGORY_IGNORE_STR = ['VIEW ALL PET']
		self.C_CATEGORY_STRIP_STR = ''

		
		
		self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
		self.C_PAGE_TYPE = ''
		self.C_PAGE_VALUE = '#container > div > ul.pagination > li > a'
		self.C_PAGE_STRIP_STR = ''
		
		self.C_PAGE_IGNORE_STR = []			# 페이지 중에 무시해야 하는 스트링
		self.C_PAGE_COUNT_PER_DISPLAY = 10	# 화면당 페이지 갯수
		
		
		self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
		self.C_PRODUCT_TYPE = ''
	
		self.C_PRODUCT_VALUE = '#container > div > div.thumbnail_list > ul > li'
		self.C_PRODUCT_STRIP_STR = ''
		
		# self.PAGE_LAST_LINK = True 일때 사용
		self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
		self.C_LAST_PAGE_TYPE = ''
		self.C_LAST_PAGE_VALUE = '#container > div > ul.pagination > li.last > a'
		
		self.PAGE_SPLIT_STR = '?page='		# 페이지 링크에서 page를 구분할수 있는 구분자
		self.PAGE_LAST_VALUE = 0		# 페이지 맨끝 링크의 값
		
		self.PAGE_LAST_LINK = True		# 페이지에서 맨끝 링크 존재 여부

		
		
		self.BASIC_CATEGORY_URL = self.SITE_ORG_HOME
		self.BASIC_PAGE_URL = self.SITE_ORG_HOME
		self.BASIC_PRODUCT_URL = self.SITE_ORG_HOME
		self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #2
0
    def __init__(self):

        Mall.__init__(self)

        #self.SITE_HOME = 'https://www.smallstuff.kr/shop/big_section.php?cno1=1001'

        self.SITE_HOME = 'https://www.smallstuff.kr'
        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        self.DETAIL_CATEGORY_ACTION = True
        self.C_DETAIL_CATEGORY_VALUE = '#big_section > ul.sub_category > li > a'
        self.BASIC_DETAIL_CATEGORY_URL = self.SITE_HOME
        self.C_DETAIL_CATEGORY_STRIP_STR = ''

        self.C_CATEGORY_VALUE = '#header > div.inner > div.gnb > div > ul > li:nth-child(3) > ul > li > a'
        # self.C_CATEGORY_VALUE = 'div.category > ul > li.sub > div.sub_menu > ul > li > a'
        self.C_CATEGORY_IGNORE_STR = [
            'Private', 'Notice', 'Flim', 'Review', 'Q&A'
        ]
        self.C_CATEGORY_STRIP_STR = ''

        self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_PAGE_TYPE = ''

        self.C_PAGE_VALUE = '#big_section > ul.paging > li > a'
        self.C_PAGE_STRIP_STR = ''

        self.C_PAGE_IGNORE_STR = ['1']  # 페이지 중에 무시해야 하는 스트링
        self.C_PAGE_COUNT_PER_DISPLAY = 10  # 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = '#big_section > ul.prd_basic > li > div '
        self.C_PRODUCT_STRIP_STR = ''

        # self.PAGE_LAST_LINK = True 일때 사용
        self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_LAST_PAGE_TYPE = ''

        self.C_LAST_PAGE_VALUE = ''

        self.PAGE_SPLIT_STR = '?page='  # 페이지 링크에서 page를 구분할수 있는 구분자

        self.PAGE_LAST_LINK = False  # 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_HOME
        self.BASIC_PAGE_URL = self.SITE_HOME + '/shop/big_section.php'
        self.BASIC_PRODUCT_URL = self.SITE_HOME
        self.BASIC_IMAGE_URL = self.SITE_HOME
コード例 #3
0
ファイル: gubas.py プロジェクト: hiadone/python_crawl
	def __init__(self) :
	
		Mall.__init__(self)
			
		self.SITE_HOME = 'https://gubas.co.kr'
		
		self.SITE_ORG_HOME = self.SITE_HOME
		
		self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

		self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
		self.C_CATEGORY_TYPE = ''
		

		self.C_CATEGORY_VALUE = '#layout_topBar > div.wrap_inner.relative > ul > li > div > ul > li > div > ul > li > a'
		self.C_CATEGORY_VALUE_2 = '#layout_topBar > div.wrap_inner.relative > ul > li > div > ul > li > a'
		self.C_CATEGORY_IGNORE_STR = ['50% 반값 할인!','단종 제품 할인','촬영용/B급상품']
		self.C_CATEGORY_STRIP_STR = ''

		
		self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
		self.C_PAGE_TYPE = ''
		self.C_PAGE_VALUE = '#layout_config_full > div.paging_navigation.mt0 > a'
		self.C_PAGE_STRIP_STR = '../'
		
		self.C_PAGE_IGNORE_STR = []			# 페이지 중에 무시해야 하는 스트링
		self.C_PAGE_COUNT_PER_DISPLAY = 10	# 화면당 페이지 갯수
		
		
		self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
		self.C_PRODUCT_TYPE = ''


		self.C_PRODUCT_VALUE = '#layout_config_full > div > div.displayTabContentsContainer.displayTabContentsA > ul > li > div'
		self.C_PRODUCT_STRIP_STR = './'
		
		# self.PAGE_LAST_LINK = True 일때 사용
		self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
		self.C_LAST_PAGE_TYPE = ''
		
		self.C_LAST_PAGE_VALUE = ''
		
		self.PAGE_SPLIT_STR = '?page='		# 페이지 링크에서 page를 구분할수 있는 구분자
		self.PAGE_LAST_VALUE = 0		# 페이지 맨끝 링크의 값
		
		self.PAGE_LAST_LINK = False		# 페이지에서 맨끝 링크 존재 여부

		
		
		self.BASIC_CATEGORY_URL = self.SITE_ORG_HOME
		self.BASIC_PAGE_URL = self.SITE_ORG_HOME
		self.BASIC_PRODUCT_URL = self.SITE_ORG_HOME
		self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #4
0
    def __init__(self):

        Mall.__init__(self)

        self.EUC_ENCODING = True

        self.SITE_HOME = 'http://www.queenpuppy.co.kr'

        self.SITE_ORG_HOME = self.SITE_HOME

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        #cate > span > a
        #header_wrap > div.box3 > div > div > div > div > div > ul > li > a
        #self.C_CATEGORY_VALUE = '#header_wrap > div.box3 > div > div > div > div > div > ul > li.title > a'
        #header_wrap > div.box3 > div > div > div > div > div > ul > li > a
        self.C_CATEGORY_VALUE = '#header_wrap > div.box3 > div > div > div > div > div > ul > li.item > a'
        self.C_CATEGORY_IGNORE_STR = ['이달의 한정할인']
        self.C_CATEGORY_STRIP_STR = ''

        #layout_body > table > tr > td > table > tr > td > div > a
        #self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        #self.C_PAGE_TYPE = ''
        #self.C_PAGE_VALUE = '#layout_body > table > tr > td > table > tr > td > div > a'
        #self.C_PAGE_STRIP_STR = '../'

        #self.C_PAGE_IGNORE_STR = []			# 페이지 중에 무시해야 하는 스트링
        #self.C_PAGE_COUNT_PER_DISPLAY = 10	# 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = 'body > div.body_wrap > div.content_wrap > div > div.product_wrap > div'
        self.C_PRODUCT_STRIP_STR = './'

        # self.PAGE_LAST_LINK = True 일때 사용
        #self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        #self.C_LAST_PAGE_TYPE = ''

        #self.C_LAST_PAGE_VALUE = ''

        #self.PAGE_SPLIT_STR = '?page='		# 페이지 링크에서 page를 구분할수 있는 구분자
        #self.PAGE_LAST_VALUE = 0		# 페이지 맨끝 링크의 값

        #self.PAGE_LAST_LINK = False		# 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_ORG_HOME
        self.BASIC_PAGE_URL = self.SITE_ORG_HOME
        self.BASIC_PRODUCT_URL = self.SITE_ORG_HOME
        self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #5
0
ファイル: dog114.py プロジェクト: hiadone/python_crawl
    def __init__(self):

        Mall.__init__(self)

        self.SITE_HOME = 'https://dog114.kr'

        self.SITE_ORG_HOME = self.SITE_HOME

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        #cate > span > a

        self.C_CATEGORY_VALUE = '#cate > table > tr > td > a'
        #self.C_CATEGORY_VALUE_2 = '#cate > span > a'
        self.C_CATEGORY_IGNORE_STR = []
        self.C_CATEGORY_STRIP_STR = ''

        #layout_body > table > tr > td > table > tr > td > div > a
        self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_PAGE_TYPE = ''
        self.C_PAGE_VALUE = '#layout_body > table > tr > td > table > tr > td > div > a'

        self.C_PAGE_STRIP_STR = '../'

        self.C_PAGE_IGNORE_STR = []  # 페이지 중에 무시해야 하는 스트링
        self.C_PAGE_COUNT_PER_DISPLAY = 10  # 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = '#layout_body > table > tr > td > div.designCategoryGoodsDisplay > table > tr > td'
        self.C_PRODUCT_STRIP_STR = ''

        # self.PAGE_LAST_LINK = True 일때 사용
        self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_LAST_PAGE_TYPE = ''

        self.C_LAST_PAGE_VALUE = ''

        self.PAGE_SPLIT_STR = '?page='  # 페이지 링크에서 page를 구분할수 있는 구분자
        self.PAGE_LAST_VALUE = 0  # 페이지 맨끝 링크의 값

        self.PAGE_LAST_LINK = False  # 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_ORG_HOME
        self.BASIC_PAGE_URL = self.SITE_ORG_HOME
        self.BASIC_PRODUCT_URL = self.SITE_ORG_HOME
        self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #6
0
ファイル: dhuman.py プロジェクト: hiadone/python_crawl
    def __init__(self):

        Mall.__init__(self)

        self.SITE_HOME = 'http://www.dhuman.co.kr'

        self.SITE_ORG_HOME = self.SITE_HOME

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        #gnb > div > ul.sub_ctg_dep > li > ul > li > a
        #gnb > div > ul.sub_ctg_dep > li > a

        #self.C_CATEGORY_VALUE = '#gnb > div > ul.gnb > li > a.gnbDep1'
        self.C_CATEGORY_VALUE = '#gnb > div > ul.sub_ctg_dep > li > ul > li > a'
        #self.C_CATEGORY_VALUE_2 = '#gnb > div > ul.sub_ctg_dep > li > a'

        self.C_CATEGORY_IGNORE_STR = ['듀먼 후기', '이벤트/혜택', '브랜드 스토리']
        self.C_CATEGORY_STRIP_STR = ''

        #self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        #self.C_PAGE_TYPE = ''
        #self.C_PAGE_VALUE = '#container > div > ul.pagination > li > a'
        #self.C_PAGE_STRIP_STR = '../'

        #self.C_PAGE_IGNORE_STR = []			# 페이지 중에 무시해야 하는 스트링
        #self.C_PAGE_COUNT_PER_DISPLAY = 10	# 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = '#contents > div > ul > li'
        self.C_PRODUCT_STRIP_STR = ''

        # self.PAGE_LAST_LINK = True 일때 사용
        #self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        #self.C_LAST_PAGE_TYPE = ''
        #self.C_LAST_PAGE_VALUE = '#container > div > ul.pagination > li.last > a'

        #self.PAGE_SPLIT_STR = '&page='		# 페이지 링크에서 page를 구분할수 있는 구분자
        #self.PAGE_LAST_VALUE = 0		# 페이지 맨끝 링크의 값

        #self.PAGE_LAST_LINK = False		# 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_HOME
        self.BASIC_PAGE_URL = self.SITE_HOME
        self.BASIC_PRODUCT_URL = self.SITE_HOME
        self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #7
0
ファイル: howlpot.py プロジェクト: hiadone/python_crawl
    def __init__(self):

        Mall.__init__(self)

        self.SITE_HOME = 'https://www.howlpot.com'

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        self.DETAIL_CATEGORY_ACTION = True
        self.C_DETAIL_CATEGORY_VALUE = '#big_section > ul.sub_category > li > a'
        self.BASIC_DETAIL_CATEGORY_URL = self.SITE_HOME
        self.C_DETAIL_CATEGORY_STRIP_STR = ''

        self.C_CATEGORY_VALUE = '#header > div.lnb_wrap > div > div.inner > div.category > div.shop_hover > div > div'
        #self.C_CATEGORY_VALUE = '#header > div.lnb_wrap > div > div.inner > div.category > div.shop_hover > div > div > ul > li > a'
        self.C_CATEGORY_IGNORE_STR = []
        self.C_CATEGORY_STRIP_STR = ''

        self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_PAGE_TYPE = ''

        self.C_PAGE_VALUE = '#big_section > ul.paging > li > a'
        self.C_PAGE_STRIP_STR = ''

        self.C_PAGE_IGNORE_STR = ['1']  # 페이지 중에 무시해야 하는 스트링
        self.C_PAGE_COUNT_PER_DISPLAY = 10  # 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = '#big_section > ul.prd_basic.col4 > li > div'
        self.C_PRODUCT_STRIP_STR = ''

        # self.PAGE_LAST_LINK = True 일때 사용
        self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_LAST_PAGE_TYPE = ''

        self.C_LAST_PAGE_VALUE = ''

        self.PAGE_SPLIT_STR = '?page='  # 페이지 링크에서 page를 구분할수 있는 구분자

        self.PAGE_LAST_LINK = False  # 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_HOME
        self.BASIC_PAGE_URL = self.SITE_HOME + '/shop/big_section.php'
        self.BASIC_PRODUCT_URL = self.SITE_HOME
        self.BASIC_IMAGE_URL = self.SITE_HOME
コード例 #8
0
    def __init__(self):

        Mall.__init__(self)

        self.SITE_HOME = 'https://www.bodeum.co.kr/html/shop/index.php'

        self.SITE_ORG_HOME = 'https://www.bodeum.co.kr'

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        #cate > span > a
        #header > div > div.hd-menu > div > ul > li > ol > li > a

        self.C_CATEGORY_VALUE = '#header > div > div.hd-menu > div > ul > li > ol > li > a'
        #self.C_CATEGORY_VALUE_2 = '#header > div > div.hd-menu > div > ul > li > a'
        self.C_CATEGORY_IGNORE_STR = []
        self.C_CATEGORY_STRIP_STR = ''

        self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_PAGE_TYPE = ''
        self.C_PAGE_VALUE = '#wrapper > div > div.content > div > div > div.paging > ol > li > a'
        self.C_PAGE_STRIP_STR = '../'

        self.C_PAGE_IGNORE_STR = []  # 페이지 중에 무시해야 하는 스트링
        self.C_PAGE_COUNT_PER_DISPLAY = 10  # 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = '#wrapper > div > div.content > div > div > div.prd-list-wrap > div > div > div > div'
        self.C_PRODUCT_STRIP_STR = './'

        # self.PAGE_LAST_LINK = True 일때 사용
        self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_LAST_PAGE_TYPE = ''

        self.C_LAST_PAGE_VALUE = '#wrapper > div > div.content > div > div > div.paging > p.last > a'

        self.PAGE_SPLIT_STR = '&PageNumber='  # 페이지 링크에서 page를 구분할수 있는 구분자
        self.PAGE_LAST_VALUE = 0  # 페이지 맨끝 링크의 값

        self.PAGE_LAST_LINK = True  # 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_ORG_HOME + '/html/shop/'
        self.BASIC_PAGE_URL = self.SITE_ORG_HOME + '/html/shop/list.php'
        self.BASIC_PRODUCT_URL = self.SITE_ORG_HOME + '/html/shop/'
        self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #9
0
ファイル: GodoMall.py プロジェクト: hiadone/python_crawl
    def __init__(self):

        Mall.__init__(self)

        #
        # - 물품 리스트
        # 	카테고리를 추출시 추출하는 타입이 select 일때 True 이며
        # 	h1/h2 에서 추출할때는 False 이다.
        self.SET_PRODUCT_DATA_CATEGORY_CLASS_SELECT_TYPE = True

        #
        # - 물품 리스트
        # 	카테고리를 추출시 CLASS NAME

        self.SET_PRODUCT_DATA_CATEGORY_DIV_SELECTOR = 'div'
        self.SET_PRODUCT_DATA_CATEGORY_CLASS_NAME = ''

        #
        # - 물품 리스트
        # 	카테고리를 추출시 HTML 요소
        # self.SET_PRODUCT_DATA_CATEGORY_CLASS_SELECT_TYPE = FALSE 일때 사용
        self.SET_PRODUCT_DATA_CATEGORY_TEXT_SELECTOR = ''

        #
        # - 물품 상세 페이지
        # 	상품기본 정보 DL SELECTOR
        # DL/DT 타입 : self.SET_PRODUCT_DETAIL_DATA_DL = True
        # LI 타입 : self.SET_PRODUCT_DETAIL_DATA_DL = False
        #
        self.SET_PRODUCT_DETAIL_DATA_DL = True

        self.SET_PRODUCT_DETAIL_DATA_DL_SELECTOR = ''

        #
        # - 물품 상세 페이지
        # 	물품 상세 설명에서 이미지와 글이 포함된 DIV SELECTOR
        self.SET_PRODUCT_DETAIL_DATA_DIV_SELECTOR = ''

        #
        # - 물품 상세 페이지
        # 	self.SET_PRODUCT_DETAIL_DATA_DIV_SELECTOR 안에 글자에 세부 HTML 요소
        self.SET_PRODUCT_DETAIL_DATA_TEXT_SELECTOR = ''

        #
        # - 물품 상세 페이지
        # 	상세설명에 테이블 형태로 제조사/브랜드 명이 들어가 있을때
        self.SET_PRODUCT_DETAIL_DATA_TABLE = False

        self.SET_PRODUCT_DETAIL_DATA_TABLE_SELECTOR = ''
コード例 #10
0
ファイル: purplestore.py プロジェクト: hiadone/python_crawl
    def __init__(self):

        Mall.__init__(self)

        self.SITE_HOME = 'https://www.purplestore.co.kr'

        self.SITE_ORG_HOME = self.SITE_HOME

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        self.C_CATEGORY_VALUE = '#allCategoryContainer > div'
        #self.C_CATEGORY_VALUE = '#allCategoryContainer > div > ul > li > button'
        self.C_CATEGORY_IGNORE_STR = ['주식 전체', '간식 전체', '용품 전체']
        self.C_CATEGORY_STRIP_STR = '..'

        #self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        #self.C_PAGE_TYPE = ''
        #self.C_PAGE_VALUE = '#contents > div > div > div > div.paging_no > div > a'
        #self.C_PAGE_STRIP_STR = '..'

        #self.C_PAGE_IGNORE_STR = []			# 페이지 중에 무시해야 하는 스트링
        #self.C_PAGE_COUNT_PER_DISPLAY = 10	# 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        #self.C_PRODUCT_VALUE = 'body > li'				# 2020-07-07 삭제
        self.C_PRODUCT_VALUE = '#saleListContainer > li'  # 2020-07-07 변경
        self.C_PRODUCT_STRIP_STR = '..'

        # self.PAGE_LAST_LINK = True 일때 사용
        #self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        #self.C_LAST_PAGE_TYPE = ''

        #self.C_LAST_PAGE_VALUE = '#contents > div > div > div > div.paging_btn > div > a'

        #self.PAGE_SPLIT_STR = '&page='		# 페이지 링크에서 page를 구분할수 있는 구분자
        #self.PAGE_LAST_VALUE = 0		# 페이지 맨끝 링크의 값

        #self.PAGE_LAST_LINK = True		# 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_ORG_HOME
        self.BASIC_PAGE_URL = self.SITE_ORG_HOME
        self.BASIC_PRODUCT_URL = self.SITE_ORG_HOME
        self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #11
0
ファイル: i_avec.py プロジェクト: hiadone/python_crawl
    def __init__(self):

        Mall.__init__(self)

        self.SITE_HOME = 'http://shop.i-avec.com'

        self.SITE_ORG_HOME = self.SITE_HOME

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        self.C_CATEGORY_VALUE = '#gnb_1dul > li > ul > li > a'
        self.C_CATEGORY_VALUE_2 = '#gnb_1dul > li > a'
        self.C_CATEGORY_IGNORE_STR = ['렌탈 서비스']
        self.C_CATEGORY_STRIP_STR = ''

        self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_PAGE_TYPE = ''
        self.C_PAGE_VALUE = '#sct > nav > span > a'
        self.C_PAGE_STRIP_STR = '../'

        self.C_PAGE_IGNORE_STR = []  # 페이지 중에 무시해야 하는 스트링
        self.C_PAGE_COUNT_PER_DISPLAY = 10  # 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = '#sct > ul > li.sct_li'
        self.C_PRODUCT_STRIP_STR = './'

        # self.PAGE_LAST_LINK = True 일때 사용
        self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_LAST_PAGE_TYPE = ''

        self.C_LAST_PAGE_VALUE = '#sct > nav > span > a'

        self.PAGE_SPLIT_STR = '&page='  # 페이지 링크에서 page를 구분할수 있는 구분자
        self.PAGE_LAST_VALUE = 0  # 페이지 맨끝 링크의 값

        self.PAGE_LAST_LINK = True  # 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_ORG_HOME
        self.BASIC_PAGE_URL = self.SITE_ORG_HOME
        self.BASIC_PRODUCT_URL = self.SITE_ORG_HOME
        self.BASIC_IMAGE_URL = self.SITE_ORG_HOME
コード例 #12
0
    def __init__(self):

        Mall.__init__(self)

        #self.SITE_HOME = 'http://www.montraum.com/common/process/shopmain.asp?iniCategory=2&thisCategory=22'

        self.SITE_HOME = 'http://www.montraum.com'

        self.SEARCH_MODE = __DEFINE__.__CATEGORY_ALL__

        self.C_CATEGORY_CASE = __DEFINE__.__C_SELECT__
        self.C_CATEGORY_TYPE = ''

        self.C_CATEGORY_VALUE = '#pc-sub-category > div > ul > li > a'
        self.C_CATEGORY_VALUE_2 = '#pc-nav > li > a'
        self.C_CATEGORY_IGNORE_STR = ['듀먼 후기', '이벤트/혜택', '브랜드 스토리', '체험특가체험특가']

        self.C_CATEGORY_STRIP_STR = ''

        self.C_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_PAGE_TYPE = ''
        self.C_PAGE_VALUE = '#page-item-list > div.items > div.pagination1.only-pc > span > a'
        self.C_PAGE_STRIP_STR = '../'

        self.C_PAGE_IGNORE_STR = []  # 페이지 중에 무시해야 하는 스트링
        self.C_PAGE_COUNT_PER_DISPLAY = 10  # 화면당 페이지 갯수

        self.C_PRODUCT_CASE = __DEFINE__.__C_SELECT__
        self.C_PRODUCT_TYPE = ''

        self.C_PRODUCT_VALUE = '#page-item-list > div.items > div.item-list-type3 > div'
        self.C_PRODUCT_STRIP_STR = ''

        # self.PAGE_LAST_LINK = True 일때 사용
        self.C_LAST_PAGE_CASE = __DEFINE__.__C_SELECT__
        self.C_LAST_PAGE_TYPE = ''
        self.C_LAST_PAGE_VALUE = ''

        self.PAGE_SPLIT_STR = '&page='  # 페이지 링크에서 page를 구분할수 있는 구분자
        self.PAGE_LAST_VALUE = 0  # 페이지 맨끝 링크의 값

        self.PAGE_LAST_LINK = False  # 페이지에서 맨끝 링크 존재 여부

        self.BASIC_CATEGORY_URL = self.SITE_HOME
        self.BASIC_PAGE_URL = self.SITE_HOME
        self.BASIC_PRODUCT_URL = self.SITE_HOME
        self.BASIC_IMAGE_URL = self.SITE_HOME
コード例 #13
0
    def __init__(self):

        Mall.__init__(self)
コード例 #14
0
    def __init__(self):

        Mall.__init__(self)

        self.SITE_ORG_HOME = ''  # 처음 접속하는 사이트 URL