Exemple #1
0
def daodao_city(city_id, param, config):
    time_lag = str(datetime.now())[:10].replace('-', '')
    task_name = 'city_attr_daodao_{}{}'.format(time_lag, param)
    with InsertTask(worker='proj.total_tasks.poi_list_task',
                    queue='poi_list',
                    routine_key='poi_list',
                    task_name=task_name,
                    source='Daodao',
                    _type='PoiList',
                    priority=3,
                    task_type=TaskType.CITY_TASK) as it:
        temp_config = copy.deepcopy(config)
        temp_config['database'] = temp_config['db']
        del temp_config['db']
        del temp_config['charset']
        for line in get_tasks(city_id=city_id, config=temp_config):
            # args = {
            #     'city_id': line['city_id'],
            #     'country_id': line['country_id'],
            #     'source': line['source'],
            #     'city_url': line['suggest']
            # }

            args = {
                'source': 'daodao',
                'url': urllib.parse.urlparse(line['suggest']).path,
                'city_id': line['city_id'],
                'country_id': line['country_id'],
                'poi_type': 'attr',
                'task_id': 'inner_{0}'.format(param)
            }

            it.insert_task(args)

        return it.generate_collection_name(), task_name
Exemple #2
0
def insert_tuniu_task():
    with InsertTask(worker='proj.total_tasks.GT_list_task',
                    queue='grouptravel',
                    routine_key='grouptravel',
                    task_name='city_total_GT_20180314a',
                    source='GT',
                    _type='GTList',
                    priority=3,
                    task_type=TaskType.CITY_TASK) as it:
        for co in get_tuniu_dept():
            for c in get_tuniu_tasks():
                args = {
                    "dept_info": {
                        "id": co['pid'],
                        "name": co['name'],
                        "name_en": co['name_en']
                    },
                    "dest_info": {
                        "id": str(c['id']),
                        "name": c['name'],
                        "name_en": 'tour'
                    },
                    "vacation_type": "grouptravel",
                    'source': 'tuniu'
                }
                it.insert_task(args)
Exemple #3
0
def insert_ctrip_task():
    args = []
    for co in get_ctrip_dept():
        for c in get_ctrip_tasks():
            if c['len_id'] != 1:
                continue
            args.append({
                "dept_info": {
                    "id": str(co['City']),
                    "name": co['Name'],
                    "name_en": co['Ename']
                },
                "dest_info": {
                    "id": str(c['id']),
                    "name": c['name'],
                    "name_en": 'tour'
                },
                "vacation_type": "grouptravel",
                'source': 'ctrip'
            })
    with InsertTask(worker='proj.total_tasks.GT_list_task',
                    queue='grouptravel',
                    routine_key='grouptravel',
                    task_name='city_total_GT_20180312a',
                    source='GT',
                    _type='GTList',
                    priority=3,
                    task_type=TaskType.CITY_TASK) as it:
        for line in args:

            it.insert_task(line)
Exemple #4
0
def start_task():
    logger.info('[step8][%s]======== start =======' % (param, ))
    try:
        return_result = defaultdict(dict)
        return_result['data'] = {}
        return_result['error']['error_id'] = 0
        return_result['error']['error_str'] = ''
        task_name = 'merge_hotel_image_' + datetime.datetime.now().strftime(
            '%Y%m%d_') + param
        with InsertTask(worker='proj.total_tasks.hotel_img_merge_task',
                        queue='merge_task',
                        routine_key='merge_task',
                        task_name=task_name,
                        source='Any',
                        _type='HotelImgMerge',
                        priority=11) as it:
            for uid in get_tasks():
                args = {
                    'uid': uid,
                    'min_pixels': '200000',
                    'target_table': 'hotel'
                }
                it.insert_task(args)
            save_collection_names = it.generate_collection_name(), task_name

        tasks = modify_status('step8', param, save_collection_names)
        logger.info('[step8][%s] tasks: %s' % (param, str(tasks)))

        # update_step_report('', param, 1, 0)
        logger.info('[step8][%s]======== success =======' % (param, ))
    except Exception as e:
        return_result['error']['error_id'] = 1
        return_result['error']['error_str'] = traceback.format_exc()
        return_result = json.dumps(return_result)
        logger.info('[step8][%s]======== failed =======' % (return_result, ))
Exemple #5
0
def ctripPoiImage_task():
    attr = {1: '2', 2: '5', 3: '3'}
    URL = 'http://you.ctrip.com/Destinationsite/TTDSecond/Photo/AjaxPhotoDetailList?districtId={}&type={}&pindex={}&resource={}'
    datas = get_data_from_db(
        'select poi_id,poi_type, image_num,image_url from ctrip_poi_detail WHERE image_num>=1'
    )
    all_task = []
    with InsertTask(worker='proj.total_tasks.ctripPoi_image_task',
                    queue='supplement_field',
                    routine_key='supplement_field',
                    task_name='ctripPoi_img_20180314a',
                    source='ctripPoi',
                    _type='CityInfo',
                    priority=3,
                    task_type=TaskType.NORMAL) as it:
        for data in datas:
            poi_id = data[0].decode()
            poi_type = attr[data[1]]
            image_num = int(data[2])
            try:
                districtId = re.findall('([0-9]+)',
                                        data[-1].decode().split('/')[-2])[0]
            except Exception as e:
                print(e)
                continue
            length = image_num / 40
            if image_num % 40 > 0:
                length += 1
            for l in range(1, int(length + 1)):
                url = URL.format(districtId, poi_type, str(l), poi_id)
                args = {'url': url}
                it.insert_task(args)
Exemple #6
0
def google_driver(
    city_id,
    param,
    config,
):
    res = city_pair(city_id, config)
    # todo 需要修改 task_name (最好按照工单 id 生成),添加特殊标记,例如 inter city,别和城市内重复
    time_tag = str(datetime.now())[:10].replace('-', '')

    task_name = 'google_drive_{0}_{1}'.format(param, time_tag)

    with InsertTask(worker='proj.total_tasks.google_drive_task',
                    queue='file_downloader',
                    routine_key='file_downloader',
                    task_name=task_name,
                    source='Google',
                    _type='GoogleDriveTask',
                    priority=11) as it:
        for s_cid, d_cid, google_url in res:
            it.insert_task({
                'url': google_url,
                'task_id': 'inter_{0}'.format(param),
                's_cid': s_cid,
                'd_cid': d_cid
            })
            pass
        return it.generate_collection_name(), task_name
Exemple #7
0
def qyer_city(city_id, param, config):
    task_name = "city_total_qyer_{}{}"
    time_lag = str(datetime.now())[:10].replace('-', '')
    task_name = task_name.format(time_lag, param)
    with InsertTask(worker='proj.total_tasks.qyer_list_task',
                    queue='poi_list',
                    routine_key='poi_list',
                    task_name=task_name,
                    source='Qyer',
                    _type='QyerList',
                    priority=3,
                    task_type=TaskType.CITY_TASK) as it:
        temp_config = copy.deepcopy(config)
        temp_config['database'] = temp_config['db']
        del temp_config['db']
        del temp_config['charset']
        for line in get_tasks(city_id, temp_config):
            args = {
                'city_id': line['city_id'],
                'country_id': line['country_id'],
                'source': line['source'],
                'city_url': line['suggest'],
                'task_id': 'inner_{0}'.format(param)
            }
            it.insert_task(args)
        return it.generate_collection_name(), task_name
Exemple #8
0
def send_tasks(tasks_data, tag):
    source = tasks_data[0]['source']
    task_name = source + '_mapinfo_' + tag
    with InsertTask(worker='proj.total_tasks.supplement_map_info', queue='supplement_field', routine_key='supplement_field',
                    task_name=task_name, source=source.capitalize(), _type='CityInfo',
                    priority=3) as it:
        for line in tasks_data:
            args = line
            it.insert_task(args)

        return it.generate_collection_name(), task_name
Exemple #9
0
def hotel_city(city_id, param, sources, config):
    source_list = sources
    collections_name = []
    for source in source_list:
        time_lag = str(datetime.now())[:10].replace('-', '')
        task_name = 'city_hotel_{}_{}{}'.format(source, time_lag, param)
        with InsertTask(worker='proj.total_tasks.hotel_list_task',
                        queue='hotel_list',
                        routine_key='hotel_list',
                        task_name=task_name,
                        source=source.title(),
                        _type='HotelList',
                        priority=3,
                        task_type=TaskType.CITY_TASK) as it:
            temp_config = copy.deepcopy(config)
            temp_config['database'] = temp_config['db']
            del temp_config['db']
            del temp_config['charset']
            for line in get_tasks(source=source,
                                  city_id=city_id,
                                  config=temp_config):
                suggest = line['suggest']
                line['suggest_type'] = str(line['suggest_type'])
                if line['suggest_type'] == '2':
                    if line["source"] != "ctrip":
                        try:
                            tmp_sug = json.loads(suggest)
                        except Exception as exc:
                            tmp_sug = eval(suggest)
                            suggest = json.dumps(tmp_sug)
                    else:
                        pass

                args = {
                    'source': source,
                    'city_id': line['city_id'],
                    'country_id': line['country_id'],
                    'part': task_name.split('_')[-1],
                    'is_new_type': 1,
                    'suggest_type': line['suggest_type'],
                    'suggest': suggest,
                    'task_id': 'inner_{0}'.format(param)
                }

                it.insert_task(args)
            collections_name.append((it.generate_collection_name(), task_name))
    return collections_name
Exemple #10
0
def city_inter_google_driver(urls, param):
    time_tag = str(datetime.now())[:10].replace('-', '')
    task_name = 'google_drivein_{0}_{1}'.format(param, time_tag)

    with InsertTask(worker='proj.total_tasks.google_drive_task',
                    queue='file_downloader',
                    routine_key='file_downloader',
                    task_name=task_name,
                    source='Google',
                    _type='GoogleDriveTask',
                    priority=11) as it:
        for google_url in urls:
            it.insert_task({
                'url': google_url,
                'task_id': 'inner_{0}'.format(param)
            })
        return it.generate_collection_name(), task_name
def insert_task():
    with InsertTask(worker='proj.total_tasks.images_task',
                    queue='file_downloader',
                    routine_key='file_downloader',
                    task_name='image_wanle_huantaoyou',
                    source='huantaoyou',
                    _type='FileDownloader',
                    priority=11) as it:
        for sid, url in get_tasks():
            args = {
                'source': "huantaoyou",
                'source_id': sid,
                'target_url': url,
                'bucket_name': 'mioji-wanle',
                'file_prefix': 'huantaoyou',
                'is_poi_task': True,
                'need_insert_db': True,
            }
            it.insert_task(args)
Exemple #12
0
def insert_ctripGT_task():
    #--- ctrip GT
    with InsertTask(worker='proj.total_tasks.images_task',
                    queue='file_downloader',
                    routine_key='file_downloader',
                    task_name='image_GT_ctrip',
                    source='ctripGT',
                    _type='FileDownloader',
                    priority=11) as it:
        for sid, url in get_GT_tasks():
            args = {
                'source': "ctripGT",
                'source_id': sid,
                'target_url': url,
                'bucket_name': 'mioji-grouptravel',
                'file_prefix': 'ctripGT',
                'is_poi_task': True,
                'need_insert_db': True,
            }
            it.insert_task(args)
def create_task(city_path, path, database_name, param):
    task_name = get_task_name(param)

    with InsertTask(worker='proj.total_tasks.allhotel_city_suggest',
                    queue='supplement_field',
                    routine_key='supplement_field',
                    task_name=task_name,
                    source='sources',
                    _type='SourceSuggest',
                    priority=11) as it:
        citys = add_city_suggest(city_path)
        for source, citys in citys.items():
            for city in citys:
                args = {
                    'source': source,
                    'keyword': city[0],
                    'country_id': str(city[1]),
                    'map_info': city[2],
                    'city_id': None,
                    'database_name': database_name
                }
                it.insert_task(args)
        collection_name = it.generate_collection_name()
        return collection_name, task_name
Exemple #14
0
    #    except:
    #        pass
    #    if len(tasks)==10:
    #        break
    #print(len(tasks))
    tasks = []
    for co in collections.find({}):
        tasks.append(co)

    return tasks


if __name__ == '__main__':

    with InsertTask(worker='proj.total_tasks.PoiSource_list_task',
                    queue='poi_list',
                    routine_key='poi_list',
                    task_name='city_total_ctripPoi_20180312a',
                    source='PoiS',
                    _type='PoiSList',
                    priority=3,
                    task_type=TaskType.CITY_TASK) as it:
        for line in get_tasks():
            args = {
                "city_id": line['city_id'],
                "country_id": "",
                "source": "ctripPoi",
                'city_url': line['task']
            }
            #print(line['task'])
            it.insert_task(args)
WHERE s_city REGEXP '[a-z]' = 1 AND s_region = 'NULL';'''

    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])

    query_sql = '''SELECT s_region
FROM ota_location
WHERE s_region REGEXP '[a-z]' = 1 AND s_region != 'NULL';'''

    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])


if __name__ == '__main__':
    # _count = 0
    # for c_name in get_tasks():
    #     _count += 1
    #     if _count % 1000 == 0:
    #         print(c_name)
    with InsertTask(worker='proj.total_tasks.ihg_city_suggest',
                    queue='supplement_field',
                    routine_key='supplement_field',
                    task_name='igh_search_20171219a',
                    source='Ihg',
                    _type='CityInfo',
                    priority=3,
                    task_type=TaskType.NORMAL) as it:
        for c_name in get_tasks():
            args = {'keyword': c_name}
            it.insert_task(args)
Exemple #16
0

def get_tasks():
    query_sql = '''SELECT uid
FROM hotel
ORDER BY uid;'''

    for _l in MysqlSource(db_config=spider_data_base_data_config,
                          table_or_query=query_sql,
                          size=10000,
                          is_table=False,
                          is_dict_cursor=False):
        yield _l[0]


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.hotel_img_merge_task',
                    queue='merge_task',
                    routine_key='merge_task',
                    task_name='merge_hotel_image_20180114_20',
                    source='Any',
                    _type='HotelImgMerge',
                    priority=11) as it:
        for uid in get_tasks():
            args = {
                'uid': uid,
                'min_pixels': '200000',
                'target_table': 'hotel'
            }
            it.insert_task(args)
Exemple #17
0
# @Time    : 2017/12/18 上午10:30
# @Author  : Hou Rong
# @Site    :
# @File    : google_address.py
# @Software: PyCharm
from MongoTask.MongoTaskInsert import InsertTask
from service_platform_conn_pool import source_info_pool, fetchall


def get_tasks():
    sql = '''SELECT concat('https://maps.googleapis.com/maps/api/geocode/json?address=', s_country, ',', s_city)
FROM ota_location_for_european_trail;'''
    for line in fetchall(source_info_pool, sql=sql):
        yield line[0]


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.crawl_json',
                    queue='file_downloader',
                    routine_key='file_downloader',
                    task_name='google_drive_task_20171215',
                    source='Google',
                    _type='GoogleDriveTask',
                    priority=11) as it:
        for target_url in get_tasks():
            it.insert_task({
                'url': target_url,
                'flag': it.task_name,
                'table_name': 'new_crawled_html_605'
            })
#     for line in fetchall(verify_info_new_pool, query_sql):
#         yield from generate_key(line[0])

# char_a = '''啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊澳芭捌扒叭吧笆八疤巴拔跋靶把耙坝霸罢爸白柏百摆佰败拜稗斑班搬扳般颁板版扮拌伴瓣半办绊邦帮梆榜膀绑棒磅蚌镑傍谤苞胞包褒剥薄雹保堡饱宝抱报暴豹鲍爆杯碑悲卑北辈背贝钡倍狈备惫焙被奔苯本笨崩绷甭泵蹦迸逼鼻比鄙笔彼碧蓖蔽毕毙毖币庇痹闭敝弊必辟壁臂避陛鞭边编贬扁便变卞辨辩辫遍标彪膘表鳖憋别瘪彬斌濒滨宾摈兵冰柄丙秉饼炳病并玻菠播拨钵波博勃搏铂箔伯帛舶脖膊渤泊驳捕卜哺补埠不布步簿部怖擦猜裁材才财睬踩采彩菜蔡餐参蚕残惭惨灿苍舱仓沧藏操糙槽曹草厕策侧册测层蹭插叉茬茶查碴搽察岔差诧拆柴豺搀掺蝉馋谗缠铲产阐颤昌猖场尝常长偿肠厂敞畅唱倡超抄钞朝嘲潮巢吵炒车扯撤掣彻澈郴臣辰尘晨忱沉陈趁衬撑称城橙成呈乘程惩澄诚承逞骋秤吃痴持匙池迟弛驰耻齿侈尺赤翅斥炽充冲虫崇宠抽酬畴踌稠愁筹仇绸瞅丑臭初出橱厨躇锄雏滁除楚础储矗搐触处揣川穿椽传船喘串疮窗幢床闯创吹炊捶锤垂春椿醇唇淳纯蠢戳绰疵茨磁雌辞慈瓷词此刺赐次聪葱囱匆从丛凑粗醋簇促蹿篡窜摧崔催脆瘁粹淬翠村存寸磋撮搓措挫错搭达答瘩打大呆歹傣戴带殆代贷袋待逮怠耽担丹单郸掸胆旦氮但惮淡诞弹蛋当挡党荡档刀捣蹈倒岛祷导到稻悼道盗德得的蹬灯登等瞪凳邓堤低滴迪敌笛狄涤翟嫡抵底地蒂第帝弟递缔颠掂滇碘点典靛垫电佃甸店惦奠淀殿碉叼雕凋刁掉吊钓调跌爹碟蝶迭谍叠丁盯叮钉顶鼎锭定订丢东冬董懂动栋侗恫冻洞兜抖斗陡豆逗痘都督毒犊独读堵睹赌杜镀肚度渡妒端短锻段断缎堆兑队对墩吨蹲敦顿囤钝盾遁掇哆多夺垛躲朵跺舵剁惰堕蛾峨鹅俄额讹娥恶厄扼遏鄂饿恩而儿耳尔饵洱二贰发罚筏伐乏阀法珐藩帆番翻樊矾钒繁凡烦反返范贩犯饭泛坊芳方肪房防妨仿访纺放菲非啡飞肥匪诽吠肺废沸费芬酚吩氛分纷坟焚汾粉奋份忿愤粪丰封枫蜂峰锋风疯烽逢冯缝讽奉凤佛否夫敷肤孵扶拂辐幅氟符伏俘服浮涪福袱弗甫抚辅俯釜斧脯腑府腐赴副覆赋复傅付阜父腹负富讣附妇缚咐噶嘎该改概钙盖溉干甘杆柑竿肝赶感秆敢赣冈刚钢缸肛纲岗港杠篙皋高膏羔糕搞镐稿告哥歌搁戈鸽胳疙割革葛格蛤阁隔铬个各给根跟耕更庚羹埂耿梗工攻功恭龚供躬公宫弓巩汞拱贡共钩勾沟苟狗垢构购够辜菇咕箍估沽孤姑鼓古蛊骨谷股故顾固雇刮瓜剐寡挂褂乖拐怪棺关官冠观管馆罐惯灌贯光广逛瑰规圭硅归龟闺轨鬼诡癸桂柜跪贵刽辊滚棍锅郭国果裹过哈骸孩海氦亥害骇酣憨邯韩含涵寒函喊罕翰撼捍旱憾悍焊汗汉夯杭航壕嚎豪毫郝好耗号浩呵喝荷菏核禾和何合盒貉阂河涸赫褐鹤贺嘿黑痕很狠恨哼亨横衡恒轰哄烘虹鸿洪宏弘红喉侯猴吼厚候后呼乎忽瑚壶葫胡蝴狐糊湖弧虎唬护互沪户花哗华猾滑画划化话槐徊怀淮坏欢环桓还缓换患唤痪豢焕涣宦幻荒慌黄磺蝗簧皇凰惶煌晃幌恍谎灰挥辉徽恢蛔回毁悔慧卉惠晦贿秽会烩汇讳诲绘荤昏婚魂浑混豁活伙火获或惑霍货祸击圾基机畸稽积箕肌饥迹激讥鸡姬绩缉吉极棘辑籍集及急疾汲即嫉级挤几脊己蓟技冀季伎祭剂悸济寄寂计记既忌际妓继纪嘉枷夹佳家加荚颊贾甲钾假稼价架驾嫁歼监坚尖笺间煎兼肩艰奸缄茧检柬碱碱拣捡简俭剪减荐槛鉴践贱见键箭件健舰剑饯渐溅涧建僵姜将浆江疆蒋桨奖讲匠酱降蕉椒礁焦胶交郊浇骄娇嚼搅铰矫侥脚狡角饺缴绞剿教酵轿较叫窖揭接皆秸街阶截劫节桔杰捷睫竭洁结解姐戒藉芥界借介疥诫届巾筋斤金今津襟紧锦仅谨进靳晋禁近烬浸尽劲荆兢茎睛晶鲸京惊精粳经井警景颈静境敬镜径痉靖竟竞净炯窘揪究纠玖韭久灸九酒厩救旧臼舅咎就疚鞠拘狙疽居驹菊局咀矩举沮聚拒据巨具距踞锯俱句惧炬剧捐鹃娟倦眷卷绢撅攫抉掘倔爵觉决诀绝均菌钧军君峻俊竣浚郡骏喀咖卡咯开揩楷凯慨刊堪勘坎砍看康慷糠扛抗亢炕考拷烤靠坷苛柯棵磕颗科壳咳可渴克刻客课肯啃垦恳坑吭空恐孔控抠口扣寇枯哭窟苦酷库裤夸垮挎跨胯块筷侩快宽款匡筐狂框矿眶旷况亏盔岿窥葵奎魁傀馈愧溃坤昆捆困括扩廓阔垃拉喇蜡腊辣啦莱来赖蓝婪栏拦篮阑兰澜谰揽览懒缆烂滥琅榔狼廊郎朗浪捞劳牢老佬姥酪烙涝勒乐雷镭蕾磊累儡垒擂肋类泪棱楞冷厘梨犁黎篱狸离漓理李里鲤礼莉荔吏栗丽厉励砾历利僳例俐痢立粒沥隶力璃哩俩联莲连镰廉怜涟帘敛脸链恋炼练粮凉梁粱良两辆量晾亮谅撩聊僚疗燎寥辽潦了撂镣廖料列裂烈劣猎琳林磷霖临邻鳞淋凛赁吝拎玲菱零龄铃伶羚凌灵陵岭领另令溜琉榴硫馏留刘瘤流柳六龙聋咙笼窿隆垄拢陇楼娄搂篓漏陋芦卢颅庐炉掳卤虏鲁麓碌露路赂鹿潞禄录陆戮驴吕铝侣旅履屡缕虑氯律率滤绿峦挛孪滦卵乱掠略抡轮伦仑沦纶论萝螺罗逻锣箩骡裸落洛骆络妈麻玛码蚂马骂嘛吗埋买麦卖迈脉瞒馒蛮满蔓曼慢漫谩芒茫盲氓忙莽猫茅锚毛矛铆卯茂冒帽貌贸么玫枚梅酶霉煤没眉媒镁每美昧寐妹媚门闷们萌蒙檬盟锰猛梦孟眯醚靡糜迷谜弥米秘觅泌蜜密幂棉眠绵冕免勉娩缅面苗描瞄藐秒渺庙妙蔑灭民抿皿敏悯闽明螟鸣铭名命谬摸摹蘑模膜磨摩魔抹末莫墨默沫漠寞陌谋牟某拇牡亩姆母墓暮幕募慕木目睦牧穆拿哪呐钠那娜纳氖乃奶耐奈南男难囊挠脑恼闹淖呢馁内嫩能妮霓倪泥尼拟你匿腻逆溺蔫拈年碾撵捻念娘酿鸟尿捏聂孽啮镊镍涅您柠狞凝宁拧泞牛扭钮纽脓浓农弄奴努怒女暖虐疟挪懦糯诺哦欧鸥殴藕呕偶沤啪趴爬帕怕琶拍排牌徘湃派攀潘盘磐盼畔判叛乓庞旁耪胖抛咆刨炮袍跑泡呸胚培裴赔陪配佩沛喷盆砰抨烹澎彭蓬棚硼篷膨朋鹏捧碰坯砒霹批披劈琵毗啤脾疲皮匹痞僻屁譬篇偏片骗飘漂瓢票撇瞥拼频贫品聘乒坪苹萍平凭瓶评屏坡泼颇婆破魄迫粕剖扑铺仆莆葡菩蒲埔朴圃普浦谱曝瀑期欺栖戚妻七凄漆柒沏其棋奇歧畦崎脐齐旗祈祁骑起岂乞企启契砌器气迄弃汽泣讫掐洽牵扦钎铅千迁签仟谦乾黔钱钳前潜遣浅谴堑嵌欠歉枪呛腔羌墙蔷强抢橇锹敲悄桥瞧乔侨巧鞘撬翘峭俏窍切茄且怯窃钦侵亲秦琴勤芹擒禽寝沁青轻氢倾卿清擎晴氰情顷请庆琼穷秋丘邱球求囚酋泅趋区蛆曲躯屈驱渠取娶龋趣去圈颧权醛泉全痊拳犬券劝缺炔瘸却鹊榷确雀裙群然燃冉染瓤壤攘嚷让饶扰绕惹热壬仁人忍韧任认刃妊纫扔仍日戎茸蓉荣融熔溶容绒冗揉柔肉茹蠕儒孺如辱乳汝入褥软阮蕊瑞锐闰润若弱撒洒萨腮鳃塞赛三叁伞散桑嗓丧搔骚扫嫂瑟色涩森僧莎砂杀刹沙纱傻啥煞筛晒珊苫杉山删煽衫闪陕擅赡膳善汕扇缮墒伤商赏晌上尚裳梢捎稍烧芍勺韶少哨邵绍奢赊蛇舌舍赦摄射慑涉社设砷申呻伸身深娠绅神沈审婶甚肾慎渗声生甥牲升绳省盛剩胜圣师失狮施湿诗尸虱十石拾时什食蚀实识史矢使屎驶始式示士世柿事拭誓逝势是嗜噬适仕侍释饰氏市恃室视试收手首守寿授售受瘦兽蔬枢梳殊抒输叔舒淑疏书赎孰熟薯暑曙署蜀黍鼠属术述树束戍竖墅庶数漱恕刷耍摔衰甩帅栓拴霜双爽谁水睡税吮瞬顺舜说硕朔烁斯撕嘶思私司丝死肆寺嗣四伺似饲巳松耸怂颂送宋讼诵搜艘擞嗽苏酥俗素速粟僳塑溯宿诉肃酸蒜算虽隋随绥髓碎岁穗遂隧祟孙损笋蓑梭唆缩琐索锁所塌他它她塔獭挞蹋踏胎苔抬台泰酞太态汰坍摊贪瘫滩坛檀痰潭谭谈坦毯袒碳探叹炭汤塘搪堂棠膛唐糖倘躺淌趟烫掏涛滔绦萄桃逃淘陶讨套特藤腾疼誊梯剔踢锑提题蹄啼体替嚏惕涕剃屉天添填田甜恬舔腆挑条迢眺跳贴铁帖厅听烃汀廷停亭庭艇通桐酮瞳同铜彤童桶捅筒统痛偷投头透凸秃突图徒途涂屠土吐兔湍团推颓腿蜕褪退吞屯臀拖托脱鸵陀驮驼椭妥拓唾挖哇蛙洼娃瓦袜歪外豌弯湾玩顽丸烷完碗挽晚皖惋宛婉万腕汪王亡枉网往旺望忘妄威巍微危韦违桅围唯惟为潍维苇萎委伟伪尾纬未蔚味畏胃喂魏位渭谓尉慰卫瘟温蚊文闻纹吻稳紊问嗡翁瓮挝蜗涡窝我斡卧握沃巫呜钨乌污诬屋无芜梧吾吴毋武五捂午舞伍侮坞戊雾晤物勿务悟误昔熙析西硒矽晰嘻吸锡牺稀息希悉膝夕惜熄烯溪汐犀檄袭席习媳喜铣洗系隙戏细瞎虾匣霞辖暇峡侠狭下厦夏吓掀锨先仙鲜纤咸贤衔舷闲涎弦嫌显险现献县腺馅羡宪陷限线相厢镶香箱襄湘乡翔祥详想响享项巷橡像向象萧硝霄削哮嚣销消宵淆晓小孝校肖啸笑效楔些歇蝎鞋协挟携邪斜胁谐写械卸蟹懈泄泻谢屑薪芯锌欣辛新忻心信衅星腥猩惺兴刑型形邢行醒幸杏性姓兄凶胸匈汹雄熊休修羞朽嗅锈秀袖绣墟戌需虚嘘须徐许蓄酗叙旭序畜恤絮婿绪续轩喧宣悬旋玄选癣眩绚靴薛学穴雪血勋熏循旬询寻驯巡殉汛训讯逊迅压押鸦鸭呀丫芽牙蚜崖衙涯雅哑亚讶焉咽阉烟淹盐严研蜒岩延言颜阎炎沿奄掩眼衍演艳堰燕厌砚雁唁彦焰宴谚验殃央鸯秧杨扬佯疡羊洋阳氧仰痒养样漾邀腰妖瑶摇尧遥窑谣姚咬舀药要耀椰噎耶爷野冶也页掖业叶曳腋夜液一壹医揖铱依伊衣颐夷遗移仪胰疑沂宜姨彝椅蚁倚已乙矣以艺抑易邑屹亿役臆逸肄疫亦裔意毅忆义益溢诣议谊译异翼翌绎茵荫因殷音阴姻吟银淫寅饮尹引隐印英樱婴鹰应缨莹萤营荧蝇迎赢盈影颖硬映哟拥佣臃痈庸雍踊蛹咏泳涌永恿勇用幽优悠忧尤由邮铀犹油游酉有友右佑釉诱又幼迂淤于盂榆虞愚舆余俞逾鱼愉渝渔隅予娱雨与屿禹宇语羽玉域芋郁吁遇喻峪御愈欲狱育誉浴寓裕预豫驭鸳渊冤元垣袁原援辕园员圆猿源缘远苑愿怨院曰约越跃钥岳粤月悦阅耘云郧匀陨允运蕴酝晕韵孕匝砸杂栽哉灾宰载再在咱攒暂赞赃脏葬遭糟凿藻枣早澡蚤躁噪造皂灶燥责择则泽贼怎增憎曾赠扎喳渣札轧铡闸眨栅榨咋乍炸诈摘斋宅窄债寨瞻毡詹粘沾盏斩辗崭展蘸栈占战站湛绽樟章彰漳张掌涨杖丈帐账仗胀瘴障招昭找沼赵照罩兆肇召遮折哲蛰辙者锗蔗这浙珍斟真甄砧臻贞针侦枕疹诊震振镇阵蒸挣睁征狰争怔整拯正政帧症郑证芝枝支吱蜘知肢脂汁之织职直植殖执值侄址指止趾只旨纸志挚掷至致置帜峙制智秩稚质炙痔滞治窒中盅忠钟衷终种肿重仲众舟周州洲诌粥轴肘帚咒皱宙昼骤珠株蛛朱猪诸诛逐竹烛煮拄瞩嘱主著柱助蛀贮铸筑住注祝驻抓爪拽专砖转撰赚篆桩庄装妆撞壮状椎锥追赘坠缀谆准捉拙卓桌琢茁酌啄着灼浊兹咨资姿滋淄孜紫仔籽滓子自渍字鬃棕踪宗综总纵邹走奏揍租足卒族祖诅阻组钻纂嘴醉最罪尊遵昨左佐柞做作坐座'''
#
# char_b = '''一 乙 二 十 丁 厂 七 卜 人 入 八 九 几 儿 了 力 乃 刀 又 三 于 干 亏 士 工 土 才 寸 下 大 丈 与 万 上 小 口 巾 山 千 乞 川 亿 个 勺 久 凡 及 夕 丸 么 广 亡 门 义 之 尸 弓 己 已 子 卫 也 女 飞 刃 习 叉 马 乡 丰 王 井 开 夫 天 无 元 专 云 扎 艺 木 五 支 厅 不 太 犬 区 历 尤 友 匹 车 巨 牙 屯 比 互 切 瓦 止 少 日 中 冈 贝 内 水 见 午 牛 手 毛 气 升 长 仁 什 片 仆 化 仇 币 仍 仅 斤 爪 反 介 父 从 今 凶 分 乏 公 仓 月 氏 勿 欠 风 丹 匀 乌 凤 勾 文 六 方 火 为 斗 忆 订 计 户 认 心 尺 引 丑 巴 孔 队 办 以 允 予 劝 双 书 幻 玉 刊 示 末 未 击 打 巧 正 扑 扒 功 扔 去 甘 世 古 节 本 术 可 丙 左 厉 右 石 布 龙 平 灭 轧 东 卡 北 占 业 旧 帅 归 且 旦 目 叶 甲 申 叮 电 号 田 由 史 只 央 兄 叼 叫 另 叨 叹 四 生 失 禾 丘 付 仗 代 仙 们 仪 白 仔 他 斥 瓜 乎 丛 令 用 甩 印 乐 句 匆 册 犯 外 处 冬 鸟 务 包 饥 主 市 立 闪 兰 半 汁 汇 头 汉 宁 穴 它 讨 写 让 礼 训 必 议 讯 记 永 司 尼 民 出 辽 奶 奴 加 召 皮 边 发 孕 圣 对 台 矛 纠 母 幼 丝 式 刑 动 扛 寺 吉 扣 考 托 老 执 巩 圾 扩 扫 地 扬 场 耳 共 芒 亚 芝 朽 朴 机 权 过 臣 再 协 西 压 厌 在 有 百 存 而 页 匠 夸 夺 灰 达 列 死 成 夹 轨 邪 划 迈 毕 至 此 贞 师 尘 尖 劣 光 当 早 吐 吓 虫 曲 团 同 吊 吃 因 吸 吗 屿 帆 岁 回 岂 刚 则 肉 网 年 朱 先 丢 舌 竹 迁 乔 伟 传 乒 乓 休 伍 伏 优 伐 延 件 任 伤 价 份 华 仰 仿 伙 伪 自 血 向 似 后 行 舟 全 会 杀 合 兆 企 众 爷 伞 创 肌 朵 杂 危 旬 旨 负 各 名 多 争 色 壮 冲 冰 庄 庆 亦 刘 齐 交 次 衣 产 决 充 妄 闭 问 闯 羊 并 关 米 灯 州 汗 污 江 池 汤 忙 兴 宇 守 宅 字 安 讲 军 许 论 农 讽 设 访 寻 那 迅 尽 导 异 孙 阵 阳 收 阶 阴 防 奸 如 妇 好 她 妈 戏 羽 观 欢 买 红 纤 级 约 纪 驰 巡 寿 弄 麦 形 进 戒 吞 远 违 运 扶 抚 坛 技 坏 扰 拒 找 批 扯 址 走 抄 坝 贡 攻 赤 折 抓 扮 抢 孝 均 抛 投 坟 抗 坑 坊 抖 护 壳 志 扭 块 声 把 报 却 劫 芽 花 芹 芬 苍 芳 严 芦 劳 克 苏 杆 杠 杜 材 村 杏 极 李 杨 求 更 束 豆 两 丽 医 辰 励 否 还 歼 来 连 步 坚 旱 盯 呈 时 吴 助 县 里 呆 园 旷 围 呀 吨 足 邮 男 困 吵 串 员 听 吩 吹 呜 吧 吼 别 岗 帐 财 针 钉 告 我 乱 利 秃 秀 私 每 兵 估 体 何 但 伸 作 伯 伶 佣 低 你 住 位 伴 身 皂 佛 近 彻 役 返 余 希 坐 谷 妥 含 邻 岔 肝 肚 肠 龟 免 狂 犹 角 删 条 卵 岛 迎 饭 饮 系 言 冻 状 亩 况 床 库 疗 应 冷 这 序 辛 弃 冶 忘 闲 间 闷 判 灶 灿 弟 汪 沙 汽 沃 泛 沟 没 沈 沉 怀 忧 快 完 宋 宏 牢 究 穷 灾 良 证 启 评 补 初 社 识 诉 诊 词 译 君 灵 即 层 尿 尾 迟 局 改 张 忌 际 陆 阿 陈 阻 附 妙 妖 妨 努 忍 劲 鸡 驱 纯 纱 纳 纲 驳 纵 纷 纸 纹 纺 驴 纽 奉 玩 环 武 青 责 现 表 规 抹 拢 拔 拣 担 坦 押 抽 拐 拖 拍 者 顶 拆 拥 抵 拘 势 抱 垃 拉 拦 拌 幸 招 坡 披 拨 择 抬 其 取 苦 若 茂 苹 苗 英 范 直 茄 茎 茅 林 枝 杯 柜 析 板 松 枪 构 杰 述 枕 丧 或 画 卧 事 刺 枣 雨 卖 矿 码 厕 奔 奇 奋 态 欧 垄 妻 轰 顷 转 斩 轮 软 到 非 叔 肯 齿 些 虎 虏 肾 贤 尚 旺 具 果 味 昆 国 昌 畅 明 易 昂 典 固 忠 咐 呼 鸣 咏 呢 岸 岩 帖 罗 帜 岭 凯 败 贩 购 图 钓 制 知 垂 牧 物 乖 刮 秆 和 季 委 佳 侍 供 使 例 版 侄 侦 侧 凭 侨 佩 货 依 的 迫 质 欣 征 往 爬 彼 径 所 舍 金 命 斧 爸 采 受 乳 贪 念 贫 肤 肺 肢 肿 胀 朋 股 肥 服 胁 周 昏 鱼 兔 狐 忽 狗 备 饰 饱 饲 变 京 享 店 夜 庙 府 底 剂 郊 废 净 盲 放 刻 育 闸 闹 郑 券 卷 单 炒 炊 炕 炎 炉 沫 浅 法 泄 河 沾 泪 油 泊 沿 泡 注 泻 泳 泥 沸 波 泼 泽 治 怖 性 怕 怜 怪 学 宝 宗 定 宜 审 宙 官 空 帘 实 试 郎 诗 肩 房 诚 衬 衫 视 话 诞 询 该 详 建 肃 录 隶 居 届 刷 屈 弦 承 孟 孤 陕 降 限 妹 姑 姐 姓 始 驾 参 艰 线 练 组 细 驶 织 终 驻 驼 绍 经 贯 奏 春 帮 珍 玻 毒 型 挂 封 持 项 垮 挎 城 挠 政 赴 赵 挡 挺 括 拴 拾 挑 指 垫 挣 挤 拼 挖 按 挥 挪 某 甚 革 荐 巷 带 草 茧 茶 荒 茫 荡 荣 故 胡 南 药 标 枯 柄 栋 相 查 柏 柳 柱 柿 栏 树 要 咸 威 歪 研 砖 厘 厚 砌 砍 面 耐 耍 牵 残 殃 轻 鸦 皆 背 战 点 临 览 竖 省 削 尝 是 盼 眨 哄 显 哑 冒 映 星 昨 畏 趴 胃 贵 界 虹 虾 蚁 思 蚂 虽 品 咽 骂 哗 咱 响 哈 咬 咳 哪 炭 峡 罚 贱 贴 骨 钞 钟 钢 钥 钩 卸 缸 拜 看 矩 怎 牲 选 适 秒 香 种 秋 科 重 复 竿 段 便 俩 贷 顺 修 保 促 侮 俭 俗 俘 信 皇 泉 鬼 侵 追 俊 盾 待 律 很 须 叙 剑 逃 食 盆 胆 胜 胞 胖 脉 勉 狭 狮 独 狡 狱 狠 贸 怨 急 饶 蚀 饺 饼 弯 将 奖 哀 亭 亮 度 迹 庭 疮 疯 疫 疤 姿 亲 音 帝 施 闻 阀 阁 差 养 美 姜 叛 送 类 迷 前 首 逆 总 炼 炸 炮 烂 剃 洁 洪 洒 浇 浊 洞 测 洗 活 派 洽 染 济 洋 洲 浑 浓 津 恒 恢 恰 恼 恨 举 觉 宣 室 宫 宪 突 穿 窃 客 冠 语 扁 袄 祖 神 祝 误 诱 说 诵 垦 退 既 屋 昼 费 陡 眉 孩 除 险 院 娃 姥 姨 姻 娇 怒 架 贺 盈 勇 怠 柔 垒 绑 绒 结 绕 骄 绘 给 络 骆 绝 绞 统 耕 耗 艳 泰 珠 班 素 蚕 顽 盏 匪 捞 栽 捕 振 载 赶 起 盐 捎 捏 埋 捉 捆 捐 损 都 哲 逝 捡 换 挽 热 恐 壶 挨 耻 耽 恭 莲 莫 荷 获 晋 恶 真 框 桂 档 桐 株 桥 桃 格 校 核 样 根 索 哥 速 逗 栗 配 翅 辱 唇 夏 础 破 原 套 逐 烈 殊 顾 轿 较 顿 毙 致 柴 桌 虑 监 紧 党 晒 眠 晓 鸭 晃 晌 晕 蚊 哨 哭 恩 唤 啊 唉 罢 峰 圆 贼 贿 钱 钳 钻 铁 铃 铅 缺 氧 特 牺 造 乘 敌 秤 租 积 秧 秩 称 秘 透 笔 笑 笋 债 借 值 倚 倾 倒 倘 俱 倡 候 俯 倍 倦 健 臭 射 躬 息 徒 徐 舰 舱 般 航 途 拿 爹 爱 颂 翁 脆 脂 胸 胳 脏 胶 脑 狸 狼 逢 留 皱 饿 恋 桨 浆 衰 高 席 准 座 脊 症 病 疾 疼 疲 效 离 唐 资 凉 站 剖 竞 部 旁 旅 畜 阅 羞 瓶 拳 粉 料 益 兼 烤 烘 烦 烧 烛 烟 递 涛 浙 涝 酒 涉 消 浩 海 涂 浴 浮 流 润 浪 浸 涨 烫 涌 悟 悄 悔 悦 害 宽 家 宵 宴 宾 窄 容 宰 案 请 朗 诸 读 扇 袜 袖 袍 被 祥 课 谁 调 冤 谅 谈 谊 剥 恳 展 剧 屑 弱 陵 陶 陷 陪 娱 娘 通 能 难 预 桑 绢 绣 验 继 球 理 捧 堵 描 域 掩 捷 排 掉 堆 推 掀 授 教 掏 掠 培 接 控 探 据 掘 职 基 著 勒 黄 萌 萝 菌 菜 萄 菊 萍 菠 营 械 梦 梢 梅 检 梳 梯 桶 救 副 票 戚 爽 聋 袭 盛 雪 辅 辆 虚 雀 堂 常 匙 晨 睁 眯 眼 悬 野 啦 晚 啄 距 跃 略 蛇 累 唱 患 唯 崖 崭 崇 圈 铜 铲 银 甜 梨 犁 移 笨 笼 笛 符 第 敏 做 袋 悠 偿 偶 偷 您 售 停 偏 假 得 衔 盘 船 斜 盒 鸽 悉 欲 彩 领 脚 脖 脸 脱 象 够 猜 猪 猎 猫 猛 馅 馆 凑 减 毫 麻 痒 痕 廊 康 庸 鹿 盗 章 竟 商 族 旋 望 率 着 盖 粘 粗 粒 断 剪 兽 清 添 淋 淹 渠 渐 混 渔 淘 液 淡 深 婆 梁 渗 情 惜 惭 悼 惧 惕 惊 惨 惯 寇 寄 宿 窑 密 谋 谎 祸 谜 逮 敢 屠 弹 随 蛋 隆 隐 婚 婶 颈 绩 绪 续 骑 绳 维 绵 绸 绿 琴 斑 替 款 堪 搭 塔 越 趁 趋 超 提 堤 博 揭 喜 插 揪 搜 煮 援 裁 搁 搂 搅 握 揉 斯 期 欺 联 散 惹 葬 葛 董 葡 敬 葱 落 朝 辜 葵 棒 棋 植 森 椅 椒 棵 棍 棉 棚 棕 惠 惑 逼 厨 厦 硬 确 雁 殖 裂 雄 暂 雅 辈 悲 紫 辉 敞 赏 掌 晴 暑 最 量 喷 晶 喇 遇 喊 景 践 跌 跑 遗 蛙 蛛 蜓 喝 喂 喘 喉 幅 帽 赌 赔 黑 铸 铺 链 销 锁 锄 锅 锈 锋 锐 短 智 毯 鹅 剩 稍 程 稀 税 筐 等 筑 策 筛 筒 答 筋 筝 傲 傅 牌 堡 集 焦 傍 储 奥 街 惩 御 循 艇 舒 番 释 禽 腊 脾 腔 鲁 猾 猴 然 馋 装 蛮 就 痛 童 阔 善 羡 普 粪 尊 道 曾 焰 港 湖 渣 湿 温 渴 滑 湾 渡 游 滋 溉 愤 慌 惰 愧 愉 慨 割 寒 富 窜 窝 窗 遍 裕 裤 裙 谢 谣 谦 属 屡 强 粥 疏 隔 隙 絮 嫂 登 缎 缓 编 骗 缘 瑞 魂 肆 摄 摸 填 搏 塌 鼓 摆 携 搬 摇 搞 塘 摊 蒜 勤 鹊 蓝 墓 幕 蓬 蓄 蒙 蒸 献 禁 楚 想 槐 榆 楼 概 赖 酬 感 碍 碑 碎 碰 碗 碌 雷 零 雾 雹 输 督 龄 鉴 睛 睡 睬 鄙 愚 暖 盟 歇 暗 照 跨 跳 跪 路 跟 遣 蛾 蜂 嗓 置 罪 罩 错 锡 锣 锤 锦 键 锯 矮 辞 稠 愁 筹 签 简 毁 舅 鼠 催 傻 像 躲 微 愈 遥 腰 腥 腹 腾 腿 触 解 酱 痰 廉 新 韵 意 粮 数 煎 塑 慈 煤 煌 满 漠 源 滤 滥 滔 溪 溜 滚 滨 粱 滩 慎 誉 塞 谨 福 群 殿 辟 障 嫌 嫁 叠 缝 缠 静 碧 璃 墙 撇 嘉 摧 截 誓 境 摘 摔 聚 蔽 慕 暮 蔑 模 榴 榜 榨 歌 遭 酷 酿 酸 磁 愿 需 弊 裳 颗 嗽 蜻 蜡 蝇 蜘 赚 锹 锻 舞 稳 算 箩 管 僚 鼻 魄 貌 膜 膊 膀 鲜 疑 馒 裹 敲 豪 膏 遮 腐 瘦 辣 竭 端 旗 精 歉 熄 熔 漆 漂 漫 滴 演 漏 慢 寨 赛 察 蜜 谱 嫩 翠 熊 凳 骡 缩 慧 撕 撒 趣 趟 撑 播 撞 撤 增 聪 鞋 蕉 蔬 横 槽 樱 橡 飘 醋 醉 震 霉 瞒 题 暴 瞎 影 踢 踏 踩 踪 蝶 蝴 嘱 墨 镇 靠 稻 黎 稿 稼 箱 箭 篇 僵 躺 僻 德 艘 膝 膛 熟 摩 颜 毅 糊 遵 潜 潮 懂 额 慰 劈 操 燕 薯 薪 薄 颠 橘 整 融 醒 餐 嘴 蹄 器 赠 默 镜 赞 篮 邀 衡 膨 雕 磨 凝 辨 辩 糖 糕 燃 澡 激 懒 壁 避 缴 戴 擦 鞠 藏 霜 霞 瞧 蹈 螺 穗 繁 辫 赢 糟 糠 燥 臂 翼 骤 鞭 覆 蹦 镰 翻 鹰 警 攀 蹲 颤 瓣 爆 疆 壤 耀 躁 嚼 嚷 籍 魔 灌 蠢 霸 露 囊 罐'''

char_c = '''的 一 是 了 我 不 人 在 他 有 这 个 上 们 来 到 时 大 地 为 子 中 你 说 生 国 年 着 就 那 和 要 她 出 也 得 里 后 自 以 会 家 可 下 而 过 天 去 能 对 小 多 然 于 心 学 么 之 都 好 看 起 发 当 没 成 只 如 事 把 还 用 第 样 道 想 作 种 开 美 总 从 无 情 己 面 最 女 但 现 前 些 所 同 日 手 又 行 意 动 方 期 它 头 经 长 儿 回 位 分 爱 老 因 很 给 名 法 间 斯 知 世 什 两 次 使 身 者 被 高 已 亲 其 进 此 话 常 与 活 正 感 见 明 问 力 理 尔 点 文 几 定 本 公 特 做 外 孩 相 西 果 走 将 月 十 实 向 声 车 全 信 重 三 机 工 物 气 每 并 别 真 打 太 新 比 才 便 夫 再 书 部 水 像 眼 等 体 却 加 电 主 界 门 利 海 受 听 表 德 少 克 代 员 许 稜 先 口 由 死 安 写 性 马 光 白 或 住 难 望 教 命 花 结 乐 色 更 拉 东 神 记 处 让 母 父 应 直 字 场 帄 报 友 关 放 至 张 认 接 告 入 笑 内 英 军 候 民 岁 往 何 度 山 觉 路 带 万 男 边 风 解 叫 任 金 快 原 吃 妈 变 通 师 立 象 数 四 失 满 战 远 格 士 音 轻 目 条 呢 病 始 达 深 完 今 提 求 清 王 化 空 业 思 切 怎 非 找 片 罗 钱 紶 吗 语 元 喜 曾 离 飞 科 言 干 流 欢 约 各 即 指 合 反 题 必 该 论 交 终 林 请 医 晚 制 球 决 窢 传 画 保 读 运 及 则 房 早 院 量 苦 火 布 品 近 坐 产 答 星 精 视 五 连 司 巴 奇 管 类 未 朋 且 婚 台 夜 青 北 队 久 乎 越 观 落 尽 形 影 红 爸 百 令 周 吧 识 步 希 亚 术 留 市 半 热 送 兴 造 谈 容 极 随 演 收 首 根 讲 整 式 取 照 办 强 石 古 华 諣 拿 计 您 装 似 足 双 妻 尼 转 诉 米 称 丽 客 南 领 节 衣 站 黑 刻 统 断 福 城 故 历 惊 脸 选 包 紧 争 另 建 维 绝 树 系 伤 示 愿 持 千 史 谁 准 联 妇 纪 基 买 志 静 阿 诗 独 复 痛 消 社 算 算 义 竟 确 酒 需 单 治 卡 幸 兰 念 举 仅 钟 怕 共 毛 句 息 功 官 待 究 跟 穿 室 易 游 程 号 居 考 突 皮 哪 费 倒 价 图 具 刚 脑 永 歌 响 商 礼 细 专 黄 块 脚 味 灵 改 据 般 破 引 食 仍 存 众 注 笔 甚 某 沉 血 备 习 校 默 务 土 微 娘 须 试 怀 料 调 广 蜖 苏 显 赛 查 密 议 底 列 富 梦 错 座 参 八 除 跑 亮 假 印 设 线 温 虽 掉 京 初 养 香 停 际 致 阳 纸 李 纳 验 助 激 够 严 证 帝 饭 忘 趣 支 春 集 丈 木 研 班 普 导 顿 睡 展 跳 获 艺 六 波 察 群 皇 段 急 庭 创 区 奥 器 谢 弟 店 否 害 草 排 背 止 组 州 朝 封 睛 板 角 况 曲 馆 育 忙 质 河 续 哥 呼 若 推 境 遇 雨 标 姐 充 围 案 伦 护 冷 警 贝 著 雪 索 剧 啊 船 险 烟 依 斗 值 帮 汉 慢 佛 肯 闻 唱 沙 局 伯 族 低 玩 资 屋 击 速 顾 泪 洲 团 圣 旁 堂 兵 七 露 园 牛 哭 旅 街 劳 型 烈 姑 陈 莫 鱼 异 抱 宝 权 鲁 简 态 级 票 怪 寻 杀 律 胜 份 汽 右 洋 范 床 舞 秘 午 登 楼 贵 吸 责 例 追 较 职 属 渐 左 录 丝 牙 党 继 托 赶 章 智 冲 叶 胡 吉 卖 坚 喝 肉 遗 救 修 松 临 藏 担 戏 善 卫 药 悲 敢 靠 伊 村 戴 词 森 耳 差 短 祖 云 规 窗 散 迷 油 旧 适 乡 架 恩 投 弹 铁 博 雷 府 压 超 负 勒 杂 醒 洗 采 毫 嘴 毕 九 冰 既 状 乱 景 席 珍 童 顶 派 素 脱 农 疑 练 野 按 犯 拍 征 坏 骨 余 承 置 臓 彩 灯 巨 琴 免 环 姆 暗 换 技 翻 束 增 忍 餐 洛 塞 缺 忆 判 欧 层 付 阵 玛 批 岛 项 狗 休 懂 武 革 良 恶 恋 委 拥 娜 妙 探 呀 营 退 摇 弄 桌 熟 诺 宣 银 势 奖 宫 忽 套 康 供 优 课 鸟 喊 降 夏 困 刘 罪 亡 鞋 健 模 败 伴 守 挥 鲜 财 孤 枪 禁 恐 伙 杰 迹 妹 藸 遍 盖 副 坦 牌 江 顺 秋 萨 菜 划 授 归 浪 听 凡 预 奶 雄 升 碃 编 典 袋 莱 含 盛 济 蒙 棋 端 腿 招 释 介 烧 误'''


def get_tasks():
    c_set = set(char_c.split(' '))
    # c_set = set()
    # c_set.update(list(char_a))
    # c_set.update(char_b.split(' '))
    yield from map(lambda x: ''.join(x), itertools.product(c_set, repeat=2))


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.qyer_city_task',
                    queue='supplement_field',
                    routine_key='supplement_field',
                    task_name='qyer_city_info_20171211a',
                    source='Qyer',
                    _type='CityInfo',
                    priority=3,
                    task_type=TaskType.NORMAL) as it:
        for c_name in get_tasks():
            args = {'keyword': c_name}
            it.insert_task(args)
Exemple #19
0
logger = get_logger("insert_mongo_task")


def get_tasks():
    query_sql = '''SELECT *
FROM ota_location
WHERE source = 'qyer' AND
      (json_extract(others_info, '$.from') IS NOT NULL OR json_extract(others_info, '$.form') IS NOT NULL) limit 10;'''

    for _l in MysqlSource(db_config=source_info_config,
                          table_or_query=query_sql,
                          size=10000, is_table=False,
                          is_dict_cursor=True):
        yield _l


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.qyer_list_task', queue='poi_list', routine_key='poi_list',
                    task_name='city_total_qyer_20180119a', source='Qyer', _type='QyerList',
                    priority=3, task_type=TaskType.CITY_TASK) as it:
        for line in get_tasks():
            args = {
                'city_id': line['city_id'],
                'country_id': line['country_id'],
                'source': line['source'],
                'city_url': line['suggest']
            }
            it.insert_task(args)

Exemple #20
0
# @Time    : 2017/12/4 下午1:13
# @Author  : Hou Rong
# @Site    :
# @File    : new_qyer_detail_task.py
# @Software: PyCharm
import pandas
from MongoTask.MongoTaskInsert import InsertTask

# f = open('/Users/hourong/Downloads/google_drive_url.txt')
# f = open('/search/hourong/task/target_url_1128')
table = pandas.read_csv("/tmp/qyer_result.csv")
_count = 0
with InsertTask(worker='proj.total_tasks.qyer_detail_task',
                queue='poi_detail',
                routine_key='poi_detail',
                task_name='detail_total_qyer_20171201a',
                source='Qyer',
                _type='QyerDetail',
                priority=11) as it:
    for i in range(len(table)):
        line = table.iloc[i]
        map_info = line['map_info']
        if map_info == '0.000000,0.000000':
            continue
        args = {
            'target_url': line['url'],
            'part': 'detail_total_qyer_20171201a',
            'city_id': 'NULL'
        }
        it.insert_task(args=args)
        _count += 1
FROM ota_location
WHERE source = 'daodao' AND city_id in ('11444','60177','12344','60178','10436','60179','60180','30118','30140','50053','60181','10648','11424','60182','60183','50117','20096');'''

    for _l in MysqlSource(db_config=source_info_config,
                          table_or_query=query_sql,
                          size=10000,
                          is_table=False,
                          is_dict_cursor=True):
        yield _l


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.poi_list_task',
                    queue='poi_list',
                    routine_key='poi_list',
                    task_name='city_attr_daodao_20171222a',
                    source='Daodao',
                    _type='PoiList',
                    priority=3,
                    task_type=TaskType.CITY_TASK) as it:
        for line in get_tasks():
            # args = {
            #     'city_id': line['city_id'],
            #     'country_id': line['country_id'],
            #     'source': line['source'],
            #     'city_url': line['suggest']
            # }

            args = {
                'source': 'daodao',
                'url': urllib.parse.urlparse(line['suggest']).path,
                'city_id': line['city_id'],
Exemple #22
0
# @File    : insert_move_img_task.py
# @Software: PyCharm
from my_logger import get_logger
from MongoTask.MongoTaskInsert import InsertTask, TaskType
from UpdateTable.ImgErrorMd5Search import used_file_name

logger = get_logger("insert_mongo_task")


def get_tasks():
    s = used_file_name()
    yield from s


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.ks_move_task',
                    queue='file_downloader',
                    routine_key='file_downloader',
                    task_name='ks_move_task_20171212a',
                    source='KinSoft',
                    _type='MoveImg',
                    priority=3,
                    task_type=TaskType.NORMAL) as it:
        for f_name in get_tasks():
            args = {
                'from_bucket': 'mioji-attr',
                'to_bucket': 'mioji-shop',
                'file_name': f_name
            }
            it.insert_task(args)
    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])

    query_sql = '''SELECT DISTINCT s_city
FROM ota_location
WHERE  s_city REGEXP '[\\u0391-\\uFFE5]' = 0;'''

    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])

    query_sql = '''SELECT DISTINCT s_region
FROM ota_location
WHERE s_region REGEXP '[\\u0391-\\uFFE5]' = 0;'''

    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.baidu_search_task',
                    queue='supplement_field',
                    routine_key='supplement_field',
                    task_name='baidu_search_20171211a',
                    source='Baidu',
                    _type='CityInfo',
                    priority=3,
                    task_type=TaskType.NORMAL) as it:
        for c_name in get_tasks():
            args = {'keyword': 'site:place.qyer.com {}'.format(c_name)}
            it.insert_task(args)
Exemple #24
0
    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])

    query_sql = '''SELECT DISTINCT s_city
FROM ota_location
WHERE s_city REGEXP '[a-z]' = 1 AND s_region = 'NULL';'''

    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])

    query_sql = '''SELECT s_region
FROM ota_location
WHERE s_region REGEXP '[a-z]' = 1 AND s_region != 'NULL';'''

    for line in fetchall(verify_info_new_pool, query_sql):
        yield from generate_key(line[0])


if __name__ == '__main__':
    with InsertTask(worker='proj.total_tasks.Accor_city_suggest',
                    queue='supplement_field',
                    routine_key='supplement_field',
                    task_name='Accor_sugg_20171222a',
                    source='Accor',
                    _type='CityInfo',
                    priority=3,
                    task_type=TaskType.NORMAL) as it:
        for c_name in get_tasks():
            args = {'keyword': '{}'.format(c_name)}
            it.insert_task(args)
# FROM city;'''
#     for line in fetchall(verify_info_new_pool, query_sql):
#         yield from generate_key(line[0])
#
#     query_sql = '''SELECT DISTINCT s_city
# FROM ota_location
# WHERE s_city REGEXP '[a-z]' = 1 AND s_region = 'NULL';'''
#
#     for line in fetchall(verify_info_new_pool, query_sql):
#         yield from generate_key(line[0])
#
#     query_sql = '''SELECT s_region
# FROM ota_location
# WHERE s_region REGEXP '[a-z]' = 1 AND s_region != 'NULL';'''
#
#     for line in fetchall(verify_info_new_pool, query_sql):
#         yield from generate_key(line[0])


if __name__ == '__main__':

    with InsertTask(worker='proj.total_tasks.normal_city_task', queue='supplement_field',
                    routine_key='supplement_field',
                    task_name='Tuniu_sugg_20180125a', source='tuniu', _type='CityInfo',
                    priority=3, task_type=TaskType.NORMAL) as it:
        for c_name in get_tasks():
            args = {
                'keyword': '{}'.format(c_name)
            }
            it.insert_task(args)
Exemple #26
0
if __name__ == '__main__':
    # source_list = ['booking', 'agoda', 'ctrip', 'hotels', 'expedia', 'elong']
    # source_list = ['expedia']
    # source_list = ['elong']
    # source_list = ['agoda', 'hotels', 'expedia', 'elong']
    # source_list = ['ctrip']
    # source_list = ['expedia']
    # source_list = ['hotels']
    source_list = ['ihg']

    for source in source_list:
        task_name = 'city_hotel_{}_20171222a'.format(source)
        with InsertTask(worker='proj.total_tasks.hotel_list_task',
                        queue='hotel_list',
                        routine_key='hotel_list',
                        task_name=task_name,
                        source=source.title(),
                        _type='HotelList',
                        priority=3,
                        task_type=TaskType.CITY_TASK) as it:
            for line in get_tasks(source=source):
                suggest = line['suggest']
                line['suggest_type'] = str(line['suggest_type'])
                if line['suggest_type'] == '2':
                    if line["source"] != "ctrip":
                        try:
                            tmp_sug = json.loads(suggest)
                        except Exception as exc:
                            tmp_sug = eval(suggest)
                            suggest = json.dumps(tmp_sug)
                    else:
                        pass
Exemple #27
0
    db.close()


if __name__ == '__main__':
    # for g in get_tasks():
    #     print({
    #         'city_code': g[0],
    #         'city_name': g[1],
    #         'country_code': g[2],
    #         'city_id': g[3],
    #         'country_id': g[4],
    #         'inventory': json.loads(g[5])["Inventory"]
    #     })
    with InsertTask(worker='proj.total_tasks.european_trail_task',
                    queue='file_downloader',
                    routine_key='file_downloader',
                    task_name='european_trail_20171226a',
                    source='European',
                    _type='Trail',
                    priority=3) as it:
        for g in get_tasks():
            it.insert_task(
                args={
                    'city_code': g[0],
                    'city_name': g[1],
                    'country_code': g[2],
                    'city_id': g[3],
                    'country_id': g[4],
                    'inventory': json.loads(g[5])["Inventory"]
                })