Python ConfigUtil примеры использования

Язык программирования: Python

Пространство имен/Пакет: whaledataspider.util

Класс/Тип: ConfigUtil

Примеров на hotexamples.com: 20

Python ConfigUtil - 20 примеров найдено. Это лучшие примеры Python кода для whaledataspider.util.ConfigUtil, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

getJsonStr(7)

getMd5(2)

getLocalIp(1)

Пример #1

Показать файл

Файл: SougouSpiders.py Проект: Veterun/SpiderDistributed

    def __init__(self, **kwargs):
        super(SougouWeixinFilterSpider,self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("sougou.json").get("sougou").get("sougou_weixin")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #2

Показать файл

Файл: BaiduSpider.py Проект: Veterun/SpiderDistributed

    def __init__(self, **kwargs):
        super(BaiduSinaNewsFilterSpider,self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("baidu.json").get("baidu").get("sina_news")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #3

Показать файл

Файл: DatabasePipelines.py Проект: Veterun/SpiderDistributed

 def _process_item(self, item, spider):
     cols,vals,key = self.item_key(item, spider)
     print cols
     print vals
     print key
     mutations = [Mutation(column=col, value=val) for col,val in zip(cols,vals)]
     self.client.mutateRow(self.tableName,confUtil.getMd5(key),mutations,None)
     return item

Пример #4

Показать файл

Файл: BaiduSpider.py Проект: Veterun/SpiderDistributed

    def __init__(self, **kwargs):
        super(BaiduSearchBySiteKeywordSpider,self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("baidu.json").get("baidu").get("search_conf")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #5

Показать файл

Файл: WeiboSpiders.py Проект: Veterun/SpiderDistributed

    def __init__(self, **kwargs):
        super(WeiboSearchStartSpider,self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weibo.json").get("weibo_com").get(self.spider_type)
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #6

Показать файл

    def __init__(self, **kwargs):
        super(SougouWeixinFilterSpider, self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("sougou.json").get("sougou").get(
            "sougou_weixin")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #7

Показать файл

Файл: BaiduSpider.py Проект: xiaokangzailushang/distributed-spider

    def __init__(self, **kwargs):
        super(BaiduSearchBySiteKeywordSpider, self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("baidu.json").get("baidu").get(
            "search_conf")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #8

Показать файл

Файл: WeiboSpiders.py Проект: xiaokangzailushang/distributed-spider

    def __init__(self, **kwargs):
        super(WeiboSearchStartSpider, self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weibo.json").get(
            "weibo_com").get(self.spider_type)
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #9

Показать файл

Файл: BaiduSpider.py Проект: xiaokangzailushang/distributed-spider

    def __init__(self, **kwargs):
        super(BaiduSinaNewsFilterSpider, self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("baidu.json").get("baidu").get(
            "sina_news")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #10

Показать файл

Файл: WeixinSpiders.py Проект: Veterun/SpiderDistributed

    def __init__(self,**kwargs):
        super(WeixinContentSpider,self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weixin.json").get(self.siteName).get(self.spider_type)
        self.Wait_Element = self.xpathConf.get("wait_element")

        self.itemKeys.append("title")

Пример #11

Показать файл

Файл: DatabasePipelines.py Проект: Veterun/SpiderDistributed

    def hbase_tables(self):

        tables = self.client.getTableNames()
        print tables

        cols =['detail:publish_time', 'detail:site_source', 'detail:site_type', 'detail:site_url', 'detail:task_id',
               'detail:author',
               'detail:catch_date'
        ]
        vals = ['2015-03-10 02:39', 'news.sina.com.cn', 'news', 'http://news.sina.com.cn/c/2015-03-10/023931587440.shtml', '-1',
                u'\u4eac\u534e\u65f6\u62a5'.encode("utf-8"),
                '2015-03-27'
        ]
        key = "http://news.sina.com.cn/c/2015-03-10/023931587440.shtml"
        print confUtil.getMd5(key)


        mutations = [Mutation(column=col, value=val) for col,val in zip(cols,vals)]
        self.client.mutateRow(self.tableName,confUtil.getMd5(key),mutations,None)

Пример #12

Показать файл

Файл: WeiboSpiders.py Проект: Veterun/SpiderDistributed

    def __init__(self, **kwargs):
        super(WeiboComUserInfoContentSpider,self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")
        #爬去结果输出到Redist的Key。
        self.out_key=self.name[0:self.name.index(":")]

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weibo.json").get("weibo_cn").get("user_info")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #13

Показать файл

    def __init__(self, **kwargs):
        super(WeixinContentSpider, self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weixin.json").get(
            self.siteName).get(self.spider_type)
        self.Wait_Element = self.xpathConf.get("wait_element")

        self.itemKeys.append("title")

Пример #14

Показать файл

Файл: WeiboSpiders.py Проект: xiaokangzailushang/distributed-spider

    def __init__(self, **kwargs):
        super(WeiboComUserInfoContentSpider, self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")
        #爬去结果输出到Redist的Key。
        self.out_key = self.name[0:self.name.index(":")]

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weibo.json").get("weibo_cn").get(
            "user_info")
        self.Wait_Element = self.xpathConf.get("wait_element")

Пример #15

Показать файл

Файл: DatabasePipelines.py Проект: xiaokangzailushang/distributed-spider

 def _process_item(self, item, spider):
     cols, vals, key = self.item_key(item, spider)
     print cols
     print vals
     print key
     mutations = [
         Mutation(column=col, value=val) for col, val in zip(cols, vals)
     ]
     self.client.mutateRow(self.tableName, confUtil.getMd5(key), mutations,
                           None)
     return item

Пример #16

Показать файл

Файл: WeiboSpiders.py Проект: Veterun/SpiderDistributed

    def __init__(self, **kwargs):
        super(WeiboComSearchSpider,self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weibo.json").get("weibo_com").get("search_conf")
        self.Wait_Element = self.xpathConf.get("wait_element")

        self.itemKeys.append('attitude')
        self.itemKeys.append('comments')
        self.itemKeys.append('repost')
        self.itemKeys.append('user_url')

Пример #17

Показать файл

Файл: WeiboSpiders.py Проект: xiaokangzailushang/distributed-spider

    def __init__(self, **kwargs):
        super(WeiboComSearchSpider, self).__init__(**kwargs)
        self.name = kwargs.get("name")
        self.redis_key = kwargs.get("redis_key")

        #获取微博的XPath配置
        self.xpathConf = confUtil.getJsonStr("weibo.json").get(
            "weibo_com").get("search_conf")
        self.Wait_Element = self.xpathConf.get("wait_element")

        self.itemKeys.append('attitude')
        self.itemKeys.append('comments')
        self.itemKeys.append('repost')
        self.itemKeys.append('user_url')

Пример #18

Показать файл

Файл: DatabasePipelines.py Проект: xiaokangzailushang/distributed-spider

    def hbase_tables(self):

        tables = self.client.getTableNames()
        print tables

        cols = [
            'detail:publish_time', 'detail:site_source', 'detail:site_type',
            'detail:site_url', 'detail:task_id', 'detail:author',
            'detail:catch_date'
        ]
        vals = [
            '2015-03-10 02:39', 'news.sina.com.cn', 'news',
            'http://news.sina.com.cn/c/2015-03-10/023931587440.shtml', '-1',
            u'\u4eac\u534e\u65f6\u62a5'.encode("utf-8"), '2015-03-27'
        ]
        key = "http://news.sina.com.cn/c/2015-03-10/023931587440.shtml"
        print confUtil.getMd5(key)

        mutations = [
            Mutation(column=col, value=val) for col, val in zip(cols, vals)
        ]
        self.client.mutateRow(self.tableName, confUtil.getMd5(key), mutations,
                              None)

Пример #19

Показать файл

Файл: RunSpider.py Проект: Veterun/SpiderDistributed

 def __init__(self):
     self.local_ip = confUtil.getLocalIp()
     self.redisConfUtil = RedisConfUtil()

Пример #20

Показать файл

 def __init__(self):
     self.local_ip = confUtil.getLocalIp()
     self.redisConfUtil = RedisConfUtil()