Python split Examples

Programming Language: Python

Namespace/Package Name: channel_extract.channel

Method/Function: split

Examples at hotexamples.com: 6

Python split - 6 examples found. These are the top rated real world Python examples of channel_extract.channel.split extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

File: main.py Project: zhukai2015/Plan-for-combating

def get_all_links_from(channel):
    for num in range(1, 3):
        if channel.split('/')[-2] == 'shoujihaoma':  #不爬取手机号码商品信息
            pass
        else:
            page_parsing.get_links_from(channel, num, 'a1')  #爬取个人卖家
            page_parsing.get_links_from(channel, num, 'a2')  #爬取商城卖家

Example #2

Show file

File: main.py Project: MarchHu/Plan-for-combating

def get_all_links_from(channel):
    for num in range(1,3):
        if channel.split('/')[-2] == 'shoujihaoma':#不爬取手机号码商品信息
            pass
        else:
            page_parsing.get_links_from(channel,num,'a1')#爬取个人卖家
            page_parsing.get_links_from(channel,num,'a2')#爬取商城卖家

Example #3

Show file

File: main.py Project: MarchHu/Plan-for-combating

def get_all_links_from(channel):
    for num in range(1,5):
        if channel.split('/')[-2] == 'shoujihaoma':
             page_parsing.get_plink_from(channel, num, 'a1')
             print('crawling url')
             page_parsing.get_plink_from(channel, num, 'a2')
             print('crawling url')
        else:
             page_parsing.get_link_from(channel, num, 'a1')
             print('crawling url')
             page_parsing.get_link_from(channel, num, 'a2')
             print('crawling url')

Example #4

Show file

def get_all_links_from(channel):
    for num in range(1, 5):
        if channel.split('/')[-2] == 'shoujihaoma':
            page_parsing.get_plink_from(channel, num, 'a1')
            print('crawling url')
            page_parsing.get_plink_from(channel, num, 'a2')
            print('crawling url')
        else:
            page_parsing.get_link_from(channel, num, 'a1')
            print('crawling url')
            page_parsing.get_link_from(channel, num, 'a2')
            print('crawling url')

Example #5

Show file

File: main.py Project: zhukai2015/Plan-for-combating

from channel_extract import channel
import pymongo
from page_parsing import ganji_links

client = pymongo.MongoClient('localhost', 27017)  #建立与mongoDB联系
ganji = client['ganji']
ganji_links = ganji['ganji_links']  #建立数据表,存储商品链接
ganji_item = ganji['ganji_itme']  #建立数据表,存储商品信息


def get_all_links_from(channel):
    for num in range(1, 3):
        if channel.split('/')[-2] == 'shoujihaoma':  #不爬取手机号码商品信息
            pass
        else:
            page_parsing.get_links_from(channel, num, 'a1')  #爬取个人卖家
            page_parsing.get_links_from(channel, num, 'a2')  #爬取商城卖家


def get_all_item_info(url):
    page_parsing.get_item_info(url)


if __name__ == '__main__':
    pool = Pool()
    urls = []
    pool.map(get_all_links_from, channel.split())
    for url in ganji['ganji_links'].find():  #依次读取链接数据库中链接，供map函数使用
        page = url['url'].split()
        pool.map(get_all_item_info, page)

Example #6

Show file

File: main.py Project: MarchHu/Plan-for-combating

url_list = ganji['url_list']
item_info = ganji['item_info']
def get_all_links_from(channel):
    for num in range(1,5):
        if channel.split('/')[-2] == 'shoujihaoma':
             page_parsing.get_plink_from(channel, num, 'a1')
             print('crawling url')
             page_parsing.get_plink_from(channel, num, 'a2')
             print('crawling url')
        else:
             page_parsing.get_link_from(channel, num, 'a1')
             print('crawling url')
             page_parsing.get_link_from(channel, num, 'a2')
             print('crawling url')

def get_all_info_from(url):
    key = url.split('/')
    if key[3] == 'shoujihaoma':
        page_parsing.get_pnumber_info(url)
    else:
        page_parsing.get_item_info(url)



if __name__ == '__main__':
    pool = Pool()
    pool.map(get_all_links_from, channel.split())
    for url in ganji['url_list'].find():
        url = url['url']
        print('crawling item info')
        pool.map(get_all_info_from, url.split())