Python BaseRedisCli.get Beispiele

Programmiersprache: Python

Namespace / Paketname: fzutils.sql_utils

Klasse / Typ: BaseRedisCli

Methode / Funktion: get

Beispiele auf hotexamples.com: 3

Python BaseRedisCli.get - 3 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die fzutils.sql_utils.BaseRedisCli.get, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

BaseRedisCli(5)

get(3)

set(1)

Häufig verwendete Methoden

BaseRedisCli (5)

get (3)

set (1)

Beispiel #1

Datei anzeigen

class IpPoolsObj(object):
    def __init__(self):
        self.redis_cli = BaseRedisCli()
        # self._k = get_uuid3('proxy_tasks')
        self._k = get_uuid3(high_proxy_list_key_name)

    def _get_all_ip_proxy(self) -> list:
        '''得到所有ip proxy'''
        _ = deserializate_pickle_object(self.redis_cli.get(name=self._k) or dumps([]))

        return _

    def _get_random_ip_proxy(self) -> str:
        '''
        随机获取一个代理
        :return: 格式: 'http://175.6.2.174:8088'
        '''
        _ = self._get_all_ip_proxy()
        if _ == []:
            return ''
        random_porxy = choice(_)

        return 'http://{}:{}'.format(
            random_porxy.get('ip'),
            random_porxy.get('port'))

    def __del__(self):
        try:
            del self.redis_cli
        except:
            pass
        collect()

Beispiel #2

Datei anzeigen

# coding:utf-8
'''
@author = super_fazai
@File    : utils.py
@connect : [email protected]
'''

from fzutils.sql_utils import BaseRedisCli
from fzutils.safe_utils import get_uuid3
from fzutils.data.pickle_utils import deserializate_pickle_object
from fzutils.linux_utils import kill_process_by_name
from fzutils.time_utils import get_shanghai_time
from fzutils.common_utils import get_random_int_number
from fzutils.common_utils import retry
from pprint import pprint
from pickle import dumps
from time import sleep
from random import choice
from settings import high_proxy_list_key_name

# print(get_uuid3('proxy_tasks'))
# print(get_uuid3(high_proxy_list_key_name))
_ = BaseRedisCli()
pprint(
    deserializate_pickle_object(
        _.get('5e421d78-a394-3b44-aae1-fd86aa127255') or dumps([])))

# 清除celery workers
kill_process_by_name(process_name='celery')

Beispiel #3

Datei anzeigen

Datei: sesame_ip_pool.py Projekt: yfeng2018/python-1

class SesameIpPool(object):
    """芝麻http"""
    def __init__(self):
        self.ip_list = []
        self.loop = get_event_loop()
        self.redis_cli = BaseRedisCli()
        self._k = get_uuid3('sesame_ip_pool')
        self.sleep_time = 1. * 60

    async def _get_all_ip_proxy(self) -> list:
        '''
        得到redis中所有ip proxy
        :return:
        '''
        return json_2_dict(self.redis_cli.get(name=self._k) or dumps([]), default_res=[])

    async def _get_phone_headers(self):
        return {
            'Connection': 'keep-alive',
            'Cache-Control': 'max-age=0',
            'Upgrade-Insecure-Requests': '1',
            'User-Agent': get_random_phone_ua(),
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
            'Accept-Encoding': 'gzip, deflate',
            'Accept-Language': 'zh-CN,zh;q=0.9',
        }

    async def _get_proxies(self):
        if self.ip_list == []:
            self.ip_list = await self._get_all_ip_proxy() or []
            if self.ip_list == []:
                return {}
            else:
                pass

        one = choice(self.ip_list)
        expire_time = one.get('expire_time')
        if one.get('expire_time') is None or datetime_to_timestamp(string_to_datetime(expire_time)) < datetime_to_timestamp(get_shanghai_time()):
            return {}

        proxy = 'http://' + one.get('ip', '') + ':' + str(one.get('port', ''))

        return {
            # 'http': proxy,
            'https': proxy,
        }

    async def _request(self, url, method='get', headers=None, params=None, cookies=None, timeout=12, encoding='utf-8') -> str:
        body = ''
        proxies = await self._get_proxies()
        if proxies == {}:
            print('[-] 未使用代理!!')
        else:
            print('[+] {}'.format(proxies.get('https', '')))

        with session() as s:
            try:
                response = s.request(method=method, url=url, headers=headers, params=params, cookies=cookies, timeout=timeout, proxies=proxies)
                try:
                    body = response.content.decode(encoding)
                except:
                    body = response.text

            except Exception as e:
                print(e)

            return body

    async def _delete_expire_time_ip(self, data) -> list:
        '''
        删除过期ip
        :return:
        '''
        new = []
        for item in self.ip_list:
            expire_time = item.get('expire_time', '')
            if datetime_to_timestamp(string_to_datetime(expire_time)) > datetime_to_timestamp(get_shanghai_time()) + 2 * 60:
                # 过期时间戳 > 当前时间戳 + 2*60
                new.append(item)

        self.ip_list = new + data

        return self.ip_list

    async def _get_ip_proxy_list(self, ip_num=200) -> list:
        '''
        获取一个proxy
        :return:
        '''
        # http://webapi.http.zhimacangku.com/getip?num=200&type=2&pro=&city=0&yys=0&port=1&time=1&ts=1&ys=0&cs=0&lb=1&sb=0&pb=4&mr=1&regions=
        params = (
            ('num', str(ip_num)),   # 提取ip数
            ('type', '2'),          # 数据格式：1:TXT 2:JSON 3:html
            ('pro', ''),            # 省份, 默认全国
            ('city', '0'),          # 城市, 默认全国
            ('yys', '0'),           # 0:不限 100026:联通 100017:电信
            ('port', '1'),          # IP协议 1:HTTP 2:SOCK5 11:HTTPS
            ('time', '1'),          # 稳定时长, 最小的是1, 提取数量多
            ('ts', '1'),            # 是否显示IP过期时间: 1显示 2不显示
            ('ys', '0'),            # 是否显示IP运营商: 1显示
            ('cs', '0'),            # 是否显示位置: 1显示
            ('lb', '1'),            # 分隔符(1:\r\n 2:/br 3:\r 4:\n 5:\t 6 :自定义)
            ('sb', '0'),
            ('pb', '4'),            # 端口位数（4:4位端口 5:5位端口）
            ('mr', '1'),            # 去重选择（1:360天去重 2:单日去重 3:不去重）
            ('regions', ''),        # 全国混拨地区
        )
        url = 'http://webapi.http.zhimacangku.com/getip'
        ori = json_2_dict(await self._request(url=url, headers=await self._get_phone_headers(), params=params))
        data = ori.get('data', [])
        # pprint(data)
        if data != []:
            self.ip_list = await self._delete_expire_time_ip(data=data)
            self.ip_list = list_remove_repeat_dict(target=self.ip_list, repeat_key='ip')
            self.redis_cli.set(name=self._k, value=dumps(self.ip_list))    # 先转换为json再存入

        msg = ori.get('msg', '')
        if '设置为白名单' in msg:
            try:
                _ip = re.compile('(\d+\.\d+\.\d+\.\d+)').findall(msg)[0]
                await self._add_local_ip_to_white_list(local_ip=_ip)
                print('已将{}设置为白名单!'.format(_ip))
            except IndexError:
                pass

        return data

    async def _test(self) -> str:
        '''
        测试代理是否高匿
        :return:
        '''
        # 用httpbin.org检测发现还是暴露原始ip, 但是能处理其他本身自己ip池无法采集的接口
        # url = 'http://httpbin.org/get'
        # body = await self._request(url=url, headers=await self._get_phone_headers())
        # print(body)

        url = 'https://www.whatismybrowser.com/'
        body = await self._request(url=url, headers=await self._get_phone_headers())
        now_ip = Selector(text=body).css('div#ip-address:nth-child(2) .detected-column a:nth-child(1) ::text').extract_first() or ''
        print('当前真实ip: {}'.format(now_ip))

        return now_ip

    async def _add_local_ip_to_white_list(self, local_ip):
        '''
        长期爬取，需要定时将本地ip设置进白名单, 否则获取不到ip_list
        :return:
        '''
        url = 'http://web.http.cnapi.cc/index/index/save_white?neek=55393&appkey=71988e7028eb9587fac0eea29a5150fa&white={}'.format(local_ip)
        await self._request(url=url, headers=await self._get_phone_headers())

        return None

    async def _fck_run(self):
        print('芝麻http ip pool'.center(30, '@'))
        while True:
            res = await self._get_ip_proxy_list()
            # pprint(res)
            print('{} 新获取到可用ip个数: {}'.format(get_shanghai_time(), len(res)))
            print('休眠 {}s ...'.format(self.sleep_time))
            await async_sleep(self.sleep_time)

    def __del__(self):
        try:
            del self.redis_cli
        except Exception:
            pass
        collect()