示例#1
0
 def stop_execute_job(exec_id):
     """
     中止执行任务
     1.修改调度主表状态为[中断]
     2.获取正在执行任务
     3.rpc分发-停止任务
     4.修改执行详情表为[失败], 修改执行任务流状态[中断]
     """
     msg = []
     for item in exec_id:
         # 修改数据库, 分布式锁
         with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
             # 修改调度主表状态为[中断]
             stop_num = ExecuteModel.update_execute_stop(db.etl_db, item, 2)
         # 是否成功中断判断
         if not stop_num:
             msg.append('执行ID: [%s]状态为非执行中, 中断失败' % item)
             continue
         # 获取正在执行任务, 分布式锁
         with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
             result = ExecuteModel.get_execute_detail_by_status(
                 db.etl_db, item, 'running')
         # 去重
         result = {item['job_id']: item for item in result}
         for _, execute in result.items():
             try:
                 # 获取进程id
                 if execute['pid']:
                     # rpc分发-停止任务
                     client = Connection(execute['server_host'],
                                         config.exec.port)
                     client.rpc.stop(exec_id=item,
                                     job_id=execute['job_id'],
                                     pid=execute['pid'])
                     client.disconnect()
                     log.info('rpc分发-停止任务: 执行id: %s, 任务id: %s' %
                              (item, execute['job_id']))
                 # 修改数据库, 分布式锁
                 with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
                     # 修改执行详情表为[失败]
                     ScheduleModel.update_exec_job_status(
                         db.etl_db, item, execute['interface_id'],
                         execute['job_id'], 'failed')
                     # 修改执行任务流状态[中断]
                     ExecuteModel.update_exec_interface_status(
                         db.etl_db, item, execute['interface_id'], 2)
                     log.info(
                         '修改执行详情表为[失败]: [%s, %s, %s]' %
                         (item, execute['interface_id'], execute['job_id']))
             except:
                 err_msg = 'rpc分发-停止任务异常: host: %s, port: %s, 执行id: %s, 任务id: %s' % (
                     execute['server_host'], config.exec.port, item,
                     execute['job_id'])
                 log.error(err_msg, exc_info=True)
                 msg.append(err_msg)
     return Response(msg=msg)
示例#2
0
def rpc_push_job(exec_id, interface_id, job_id, server_host, port, params_value, server_dir, server_script, return_code,
                 status, date_format='%Y%m%d', run_date=''):
    """
    RPC分发任务
    1.替换$date变量
    :param exec_id: 执行id
    :param interface_id: 任务流id
    :param job_id: 任务id
    :param server_host: RPC执行服务器域名
    :param port: RPC执行服务器端口
    :param params_value: 参数值字符串
    :param server_dir: 脚本目录
    :param server_script: 运行脚本
    :param return_code: 状态返回码
    :param status: 任务状态
    :param date_format: 日期格式
    :param run_date: 数据日期
    :return: 
    """""
    try:
        # rpc分发任务
        client = Connection(server_host, port)
        # 任务参数中数据日期变量为T-1
        if not run_date:
            run_time = (date.today() + timedelta(days=-1)).strftime(date_format)
        else:
            run_time = run_date
        params = params_value.split(',') if params_value else []
        client.rpc.event_execute(
            exec_id=exec_id,
            interface_id=interface_id,
            job_id=job_id,
            server_dir=server_dir,
            server_script=server_script,
            return_code=return_code,
            params=[item if item != '$date' else run_time for item in params],
            status=status
        )
        client.disconnect()
        return ''
    except:
        err_msg = 'rpc连接异常: host: %s, port: %s' % (server_host, port)
        # 添加执行任务详情日志
        EventModel.add_event_exec_detail_job(db.etl_db, exec_id, interface_id, job_id, 'ERROR', server_dir,
                                             server_script, err_msg, 3)
        # 修改数据库, 分布式锁
        with MysqlLock(config.mysql.etl, 'event_lock_%s' % exec_id):
            # 修改执行详情表状态[失败]
            EventModel.update_event_exec_job_status(db.etl_db, exec_id, interface_id, job_id, 'failed')
            # 修改执行任务流状态[失败]
            EventModel.update_event_exec_interface_status(db.etl_db, exec_id, interface_id, -1)
            # 修改执行主表状态[失败]
            EventModel.update_event_execute_status(db.etl_db, exec_id, -1)
        log.error(err_msg, exc_info=True)
        return err_msg
示例#3
0
def get_dispatch_job(dispatch_id, exec_type=1, run_date='', date_format='%Y%m%d', is_after=1):
    """
    调度执行开始方法
    1.生成所有任务流依赖(根据is_after参数, 确定递归深度), 生成任务流所有任务详情
    2.添加执行主表[运行中], 执行任务流[就绪], 修改执行详情表[待运行]
    3.获取初始任务流如果执行任务流为空, 则修改执行任务状态[成功](修改执行流账期, 修改执行任务流表记录);
      执行任务流非空, 执行任务流状态[运行中], 修改执行详情表状态[运行中]
    4.RPC分发初始任务流中level=0的执行任务, 替换参数变量$date为T-1日期;
      如果RPC异常, 修改执行详情表状态[失败], 执行任务流状态[失败], 执行主表状态[失败]
    5.如果存在执行任务流为空, 获取下一个可执行任务流
    :param dispatch_id: 调度id
    :param exec_type: 执行类型: 1.自动, 2.手动
    :param run_date: 手动传入$date日期
    :param date_format: $date日期格式
    :param is_after: 是否触发后置任务流
    :return: None
    """
    # 传入日期
    if run_date and date_format:
        run_time = time.strftime(date_format, time.strptime(run_date, '%Y-%m-%d'))
    # 默认值为前一天
    else:
        run_time = (date.today() + timedelta(days=-1)).strftime(date_format)
    # 获取执行任务流前后依赖关系
    interface_dag_nodes = generate_interface_dag_by_dispatch(dispatch_id, is_after)
    interface_tree_nodes = generate_interface_tree_by_dispatch(dispatch_id)
    tree_nodes = [_ for _ in interface_tree_nodes.keys()]
    # 填充树形节点
    for key in set(tree_nodes):
        interface_dag_nodes[key]['is_tree'] = 1
    if not interface_dag_nodes:
        return
    # 获取所有任务流的任务详情
    job_nodes = {}
    for _, item in interface_tree_nodes.items():
        jobs = generate_job_dag_by_interface(item['id'])
        job_nodes[item['id']] = jobs
    # 添加执行主表, 任务流表, 任务表至数据库
    exec_id = add_exec_record(dispatch_id, interface_dag_nodes, job_nodes, exec_type, run_time, is_after, date_format)
    # 初始任务流
    start_interface = [_ for _, item in interface_dag_nodes.items() if item['level'] == 0 and item.get('is_tree', 0) == 1]
    # 开始执行初始任务流中的任务
    flag = False
    null_interface = []
    for curr_interface in start_interface:
        start_jobs = job_nodes[curr_interface]
        # 任务流中任务为空, 则视调度已完成
        if not start_jobs:
            flag = True
            null_interface.append(curr_interface)
            # 数据日期改成当天日期, 手动调度时可以再优化
            new_date = time.strftime('%Y-%m-%d', time.localtime())
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                ExecuteModel.update_interface_run_time(db.etl_db, curr_interface, new_date)
            log.info('任务流中任务为空: 调度id: %s, 执行id: %s, 任务流id: %s' % (dispatch_id, exec_id, curr_interface))
            # 修改执行任务流[成功]
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                ExecuteModel.update_exec_interface_status(db.etl_db, exec_id, curr_interface, 0)
        else:
            # 修改执行任务流[运行中]
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                ExecuteModel.update_exec_interface_status(db.etl_db, exec_id, curr_interface, 1)
            # rpc分发任务
            for job in start_jobs:
                if job['level'] == 0:
                    # 修改执行详情表状态[运行中]
                    with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                        ScheduleModel.update_exec_job_status(db.etl_db, exec_id, curr_interface, job['id'], 'running')
                    log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' % (exec_id, curr_interface, job['id']))
                    rpc_push_job(exec_id, curr_interface, job['id'], job['server_host'], config.exec.port,
                                 ','.join(job['params_value']), job['server_dir'], job['server_script'],
                                 job['return_code'], job['status'], run_date=run_time)
    # 继续下一个任务流
    if flag:
        for interface_item in null_interface:
            next_jobs = continue_execute_interface(exec_id, interface_item, exec_type=exec_type, run_date=run_time)
            if not next_jobs:
                return
            for interface_id, item in next_jobs.items():
                for job_id in set(item['job_id']):
                    log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' % (exec_id, interface_id, job_id))
                    nodes = item['nodes']
                    rpc_push_job(exec_id, interface_id, job_id, nodes[job_id]['server_host'],
                                 config.exec.port, nodes[job_id]['params_value'],
                                 nodes[job_id]['server_dir'], nodes[job_id]['server_script'],
                                 nodes[job_id]['return_code'], nodes[job_id]['status'], run_date=run_time)
示例#4
0
 def start_execute_job(exec_id):
     """
     启动执行任务
     1.获取调度详情
     2.修改执行主表状态为[运行中]
     3.获取起始任务流(默认任务流状态为3: 就绪), 获取所有起始任务流下所有任务
     4.开始执行初始任务流中的任务,
       任务流中任务为空, 则视调度已完成,修改调度执行表账期, 修改执行任务流[成功]
       否则修改执行任务流[运行中], rpc分发任务, 修改执行详情表状态[运行中]
       5.如果存在空任务流, 继续下一个任务流
     """
     for item in exec_id:
         # 获取调度详情
         dispatch = ExecuteModel.get_exec_dispatch_id(db.etl_db, item)
         # 修改数据库, 分布式锁
         with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
             # 修改执行主表状态为[运行中]
             ExecuteModel.update_execute_status(db.etl_db, item, 1)
         # 推进流程
         interface_dict = get_interface_dag_by_exec_id(item)
         # 起始任务流(默认任务流状态为3: 就绪)
         start_interface = [
             _ for _, item in interface_dict.items() if item['level'] == 0
         ]
         # 任务流的任务详情
         job_nodes = {}
         for interface_id in start_interface:
             # 获取起始任务流下所有任务
             jobs = get_all_jobs_dag_by_exec_id(item, interface_id)
             job_nodes[interface_id] = jobs['source']
         # 开始执行初始任务流中的任务
         flag = False
         null_interface = []
         for curr_interface in start_interface:
             start_jobs = job_nodes[curr_interface]
             # 任务流中任务为空, 则视调度已完成
             if not start_jobs:
                 flag = True
                 null_interface.append(curr_interface)
                 # 数据日期改成当天日期, 手动调度时可以再优化
                 new_date = time.strftime('%Y-%m-%d', time.localtime())
                 with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
                     ExecuteModel.update_interface_run_time(
                         db.etl_db, curr_interface, new_date)
                 log.info('任务流中任务为空: 调度id: %s, 执行id: %s, 任务流id: %s' %
                          (dispatch['dispatch_id'], item, curr_interface))
                 # 修改执行任务流[成功]
                 with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
                     ExecuteModel.update_exec_interface_status(
                         db.etl_db, item, curr_interface, 0)
             else:
                 # 修改执行任务流[运行中]
                 with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
                     ExecuteModel.update_exec_interface_status(
                         db.etl_db, item, curr_interface, 1)
                 # rpc分发任务
                 for job in start_jobs:
                     if job['level'] == 0:
                         # 修改执行详情表状态[运行中]
                         with MysqlLock(config.mysql.etl,
                                        'exec_lock_%s' % item):
                             ScheduleModel.update_exec_job_status(
                                 db.etl_db, item, curr_interface,
                                 job['job_id'], 'running')
                         log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' %
                                  (item, curr_interface, job['job_id']))
                         rpc_push_job(item,
                                      curr_interface,
                                      job['job_id'],
                                      job['server_host'],
                                      config.exec.port,
                                      job['params_value'],
                                      job['server_dir'],
                                      job['server_script'],
                                      job['return_code'],
                                      job['status'],
                                      run_date=dispatch['run_date'])
         # 继续下一个任务流
         if flag:
             for interface_item in null_interface:
                 next_jobs = continue_execute_interface(
                     item,
                     interface_item,
                     exec_type=dispatch['exec_type'],
                     run_date=dispatch['run_date'])
                 for interface_id, val in next_jobs.items():
                     for job_id in set(val['job_id']):
                         log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' %
                                  (item, interface_id, job_id))
                         nodes = val['nodes']
                         rpc_push_job(item,
                                      interface_id,
                                      job_id,
                                      nodes[job_id]['server_host'],
                                      config.exec.port,
                                      nodes[job_id]['params_value'],
                                      nodes[job_id]['server_dir'],
                                      nodes[job_id]['server_script'],
                                      nodes[job_id]['return_code'],
                                      nodes[job_id]['status'],
                                      run_date=dispatch['run_date'])
     return Response(exec_id=exec_id)
示例#5
0
 def restart_execute_job(exec_id):
     """
     断点续跑
     1.修改调度主表状态为[运行中]
     2.获取调度任务流参数, 调度信息, 找出[中断/失败]任务流
       如果没有[中断/失败]任务流, 找到满足依赖的[就绪]任务流,
     3.获取调度任务流详情(所有执行任务), 找出失败任务, 重新生成任务流下所有任务详情
     4.重置失败任务参数, 修改执行详情表参数, 状态为[待运行]
     4.重新生成任务流依赖, 修改执行任务流参数, 状态[运行中]
     5.重新获取调度详情, 找到[运行中]任务流, 重新获取调度任务流详情, 找到运行任务(状态[待运行], 入度执行成功)
     6.去重, RPC分发任务
     """
     for item in exec_id:
         # 修改数据库, 分布式锁
         with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
             # 修改调度表状态为[运行中]
             ExecuteModel.update_execute_status(db.etl_db, item, 1)
             # 获取任务流参数
             interface_dict = get_interface_dag_by_exec_id(item)
         # 获取调度信息
         dispatch = ExecuteModel.get_exec_dispatch_id(db.etl_db, item)
         # 中断/失败任务流
         error_interface = [
             _ for _, item in interface_dict.items()
             if item['status'] in (2, -1)
         ]
         # 如果没有中断/失败任务流, 找到满足依赖的就绪任务流
         if not error_interface:
             error_interface = continue_execute_interface_all(
                 item,
                 exec_type=dispatch['exec_type'],
                 run_date=dispatch['run_date'])
             if not error_interface:
                 error_interface = {}
             else:
                 error_interface = error_interface.keys()
         # 获取调度任务流详情
         for interface_id in set(error_interface):
             # 获取所有执行任务
             result = get_all_jobs_dag_by_exec_id(item, interface_id)
             nodes = result['nodes']
             # 找出[失败]任务
             failed_nodes = {
                 job_id: item
                 for job_id, item in nodes.items()
                 if item['status'] == 'failed'
             }
             # 生成任务流下所有任务详情
             job_list = {
                 item['id']: item
                 for item in generate_job_dag_by_interface(interface_id)
             }
             # 重置失败任务参数
             for job_id in set(failed_nodes):
                 log.info('重置任务参数: 执行id: %s, 任务流id: %s, 任务id: %s' %
                          (item, interface_id, job_id))
                 job = job_list[job_id]
                 # 修改数据库, 分布式锁
                 with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
                     # 修改执行详情表参数, 状态为[待运行]
                     ScheduleModel.update_exec_job_reset(
                         db.etl_db, item, interface_id, job_id, 'preparing',
                         job)
             # 重新生成任务流依赖
             interface_list = generate_interface_dag_by_dispatch(
                 dispatch['dispatch_id'], dispatch['is_after'])
             interface = interface_list[str(interface_id)]
             # 修改数据库, 分布式锁
             with MysqlLock(config.mysql.etl, 'exec_lock_%s' % item):
                 # 修改执行任务流参数, 状态[运行中]
                 log.info('重置任务流参数: 执行id: %s, 任务流id: %s' %
                          (item, interface_id))
                 ScheduleModel.update_exec_interface_reset(
                     db.etl_db, item, interface['id'], 1, interface)
         # 重新获取调度详情
         interface_list = get_interface_dag_by_exec_id(item)
         # 找到[运行中]任务流
         running_nodes = {
             _: interface
             for _, interface in interface_list.items()
             if interface['status'] == 1
         }
         for interface_id, node in running_nodes.items():
             # 重新获取调度任务流详情
             result = get_all_jobs_dag_by_exec_id(item, interface_id)
             nodes = result['nodes']
             # 找到[待运行]任务
             preparing_nodes = {
                 _: job
                 for _, job in nodes.items() if job['status'] == 'preparing'
             }
             rerun_job = []
             for job_id in preparing_nodes:
                 flag = True
                 # 入度
                 for in_id in nodes[job_id]['in_degree']:
                     # 节点的入度是否全部成功
                     if nodes[in_id]['status'] != 'succeeded':
                         flag = False
                         break
                 if flag:
                     rerun_job.append(job_id)
             # 去重, 分发任务
             for job_id in set(rerun_job):
                 log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' %
                          (item, interface_id, job_id))
                 push_msg = rpc_push_job(item,
                                         interface_id,
                                         job_id,
                                         nodes[job_id]['server_host'],
                                         config.exec.port,
                                         nodes[job_id]['params_value'],
                                         nodes[job_id]['server_dir'],
                                         nodes[job_id]['server_script'],
                                         nodes[job_id]['return_code'],
                                         nodes[job_id]['status'],
                                         run_date=dispatch['run_date'])
                 if push_msg:
                     return Response(msg=push_msg)
     return Response(msg='成功')
示例#6
0
def continue_execute_interface_all(exec_id,
                                   result=None,
                                   exec_type=1,
                                   run_date=''):
    """
    获取可执行任务流
    1.如果所有执行任务流都完成, 修改执行主表状态[成功]
    2.所有任务流都完成, 修改执行主表状态[成功], 返回退出
    3.获取当前执行id下的任务流, 遍历任务流
    3.自动调度下(exec_type=1)当前节点出度的所有入度成功, 出度的所有入度数据日期>=出度的数据日期, 节点出度的状态为待运行;
      手动调度下(exec_type=2)默认所有出度成功.
    4.获取可执行任务流下初始任务, 存在空任务流, 修改执行任务流状态[成功], 修改任务流数据日期, 递归本方法
    5.否则修改执行任务流状态[运行中], 返回结果集
    :param result: 结果集
    :param exec_id: 执行id
    :param exec_type: 执行类型: 1.自动, 2.手动
    :param run_date: 数据日期
    :return:
    """
    if not run_date:
        run_date = time.strftime('%Y-%m-%d', time.localtime())
    # 可执行任务流id
    if result is None:
        result = {}
    next_interface = []
    # {可执行任务流id: {'job_id': [可执行任务id], 'nodes': {'job_id': {任务详情}}}}
    # 推进流程
    with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
        interface_dict = get_interface_dag_by_exec_id(exec_id)
    # 已完成任务流
    complete_interface = [
        _ for _, item in interface_dict.items() if item['status'] == 0
    ]
    # 所有任务流都完成
    if len(complete_interface) == len(interface_dict):
        # 修改执行主表状态[成功]
        with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
            ExecuteModel.update_execute_status(db.etl_db, exec_id, 0)
        return
    # 遍历所有节点
    for interface_id in interface_dict:
        # 自动调度下, 检查出度的入度数据日期和状态是否成功
        if exec_type == 1:
            # 出度任务流的执行详情
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                current_detail = InterfaceModel.get_interface_detail_last_execute(
                    db.etl_db, interface_id)
            for out_id in interface_dict[interface_id]['out_degree']:
                flag = True
                for in_id in interface_dict[out_id]['in_degree']:
                    # 获取出度的入度任务流详情
                    with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                        in_detail = InterfaceModel.get_interface_detail_last_execute(
                            db.etl_db, in_id)
                    # 1.出度的入度本次执行状态不成功, 2.出度的入度没有数据日期, 3.出度的入度数据日期小于出度的数据日期, 4.如果存在出度的上一次执行记录, 上一次执行记录不成功
                    if in_detail['status'] != 0 or not in_detail['run_time'] \
                            or in_detail['run_time'] < current_detail['run_time']:
                        # or (current_detail['last_status'] and current_detail['last_status'] != 0):
                        flag = False
                        break
                if flag and interface_dict[out_id]['status'] == 3:
                    next_interface.append(out_id)
        # 手动调度下, 直接通过
        else:
            for out_id in interface_dict[interface_id]['out_degree']:
                flag = True
                for in_id in interface_dict[out_id]['in_degree']:
                    # 获取出度的入度详情
                    with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                        in_detail = InterfaceModel.get_interface_detail_last_execute(
                            db.etl_db, in_id)
                    # 1.出度的入度本次执行状态不成功
                    if in_detail['status'] != 0:
                        flag = False
                        break
                if flag and interface_dict[out_id]['status'] == 3:
                    next_interface.append(out_id)
        # 获取所有层级可执行任务
        for next_interface_id in set(next_interface):
            nodes = get_job_dag_by_exec_id(exec_id, next_interface_id)
            # 可执行任务流设置默认可执行任务
            result.setdefault(next_interface_id, {
                'nodes': nodes,
                'job_id': []
            })
            # 遍历所有节点
            for job_id in nodes:
                # 初始节点
                if nodes[job_id]['level'] == 0 and nodes[job_id]['status'] in (
                        'preparing', 'ready'):
                    result[next_interface_id]['job_id'].append(job_id)
    # 出度任务流中符合条件的任务为空, 寻找下一个可执行任务流
    flag = False
    result_deep = deepcopy(result)
    for interface_id, item in result_deep.items():
        # 修改执行任务流状态[成功]
        if not item['job_id']:
            flag = True
            result.pop(interface_id)
            log.info('任务流中任务为空: 执行id: %s, 任务流id: %s' % (exec_id, interface_id))
            # 数据日期改成当天日期, 手动调度时可以再优化
            new_date = time.strftime('%Y-%m-%d', time.localtime())
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                ExecuteModel.update_interface_run_time(db.etl_db, interface_id,
                                                       new_date)
                ExecuteModel.update_exec_interface_status(
                    db.etl_db, exec_id, interface_id, 0)
        # 修改执行任务流状态[运行中]
        else:
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                ExecuteModel.update_exec_interface_status(
                    db.etl_db, exec_id, interface_id, 1)
    # 存在空任务流
    if flag:
        return continue_execute_interface_all(exec_id, result, exec_type,
                                              run_date)
    else:
        return result
示例#7
0
    def get_execute_job(exec_id, interface_id, job_id, status):
        """
        执行服务任务回调
        1.修改详情表回调任务执行状态[成功/失败], 如果单独执行任务, 修改执行主表状态[成功/失败], 返回
        2.如果执行任务状态成功, 获取当前任务流下一批执行任务(初始节点状态为'preparing'或'ready', 出度的入度==succeeded)
          如果执行任务状态失败, 修改执行任务流状态[失败], 执行主表状态[失败]
        3.RPC分发当前任务流中可执行的任务, 替换参数变量$date为T-1日期, 修改执行详情表状态[运行中];
          如果RPC异常, 修改执行详情表状态[失败], 执行任务流状态[失败], 执行主表状态[失败]
        4.查看调度任务表中当前执行流的任务状态,
          如果存在失败, exec_status = -1; 如果全部成功, exec_status = 0; else运行中exec_status = 1
        5.查看调度任务表中所有执行流的任务状态,
          如果存在失败, interface_status = -1; 如果全部成功, interface_status = 0; else运行中interface_status = 1
        6.查询执行主表当前状态, 非中断条件下修改调度表状态(允许失败条件下继续执行, master_status != 2)
          修改执行当前任务流状态(exec_status)[成功/失败/运行]
          修改执执行主表状态(interface_status)[成功/失败/运行]
        7.如果当前任务流全部成功(exec_status = 0), 修改账期为T, 获取出度任务流中符合条件的任务
          (出度的入度状态为1或3, 出度的入度数据日期>=出度任务流数据日期)
        8.如果出度任务流中符合条件的任务为空, 修改执行任务流状态[成功], 寻找下一个可执行任务流
          如果没有可执行任务流, 修改执行主表状态[成功/失败]
        9.RPC分发出度任务流中符合条件的任务, 替换参数变量$date为T-1日期, 修改执行详情表状态[运行中];
          如果RPC异常, 修改执行任务状态[失败], 执行任务流状态[失败], 执行主表状态[失败]
        :param exec_id: 执行id
        :param interface_id: 任务流id
        :param job_id: 任务id
        :param status: 执行任务状态
        :return:
        """
        # 修改详情表执行状态
        with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
            ScheduleModel.update_exec_job_status(db.etl_db, exec_id,
                                                 interface_id, job_id, status)
            # 获取执行主表详情
            execute_detail = ExecuteModel.get_exec_dispatch_id(
                db.etl_db, exec_id)
        # 单独执行任务
        if interface_id == 0:
            # 修改执行主表状态[成功/失败]
            if status == 'succeeded':
                ExecuteModel.update_execute_status(db.etl_db, exec_id, 0)
            elif status == 'failed':
                ExecuteModel.update_execute_status(db.etl_db, exec_id, -1)
            return Response(msg='成功')
        if status == 'succeeded':
            # 获取下一批执行任务
            distribute_job, nodes = continue_execute_job(exec_id, interface_id)
            # 去重, 分发任务
            for job_id in set(distribute_job):
                # 修改执行详情表状态[运行中]
                with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                    ScheduleModel.update_exec_job_status(
                        db.etl_db, exec_id, interface_id, job_id, 'running')
                log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' %
                         (exec_id, interface_id, job_id))
                # RPC分发任务
                push_msg = rpc_push_job(exec_id,
                                        interface_id,
                                        job_id,
                                        nodes[job_id]['server_host'],
                                        config.exec.port,
                                        nodes[job_id]['params_value'],
                                        nodes[job_id]['server_dir'],
                                        nodes[job_id]['server_script'],
                                        nodes[job_id]['return_code'],
                                        nodes[job_id]['status'],
                                        run_date=execute_detail['run_date'])
                if push_msg:
                    return Response(msg=push_msg)
        elif status == 'failed':
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                # 修改执行任务流状态[失败]
                ExecuteModel.update_exec_interface_status(
                    db.etl_db, exec_id, interface_id, -1)
                # 修改执行主表状态[失败]
                ExecuteModel.update_execute_status(db.etl_db, exec_id, -1)

        # 查看调度执行表中当前执行流的状态
        with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
            status_list = ExecuteModel.get_execute_detail_status(
                db.etl_db, interface_id, exec_id)
        # 存在失败
        if 'failed' in status_list:
            exec_status = -1
        # 全部成功
        elif set(status_list) == {'succeeded'}:
            exec_status = 0
        # 运行中
        else:
            exec_status = 1
        # # 查询执行任务流状态
        # with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
        #     status_list = ExecuteModel.get_execute_interface_status(db.etl_db, exec_id)
        # # 存在失败
        # if -1 in status_list:
        #     interface_status = -1
        # # 全部成功
        # elif set(status_list) == {0}:
        #     interface_status = 0
        # # 运行中
        # else:
        #     interface_status = 1
        # 查询执行主表当前状态
        with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
            master_status = ExecuteModel.get_execute_status(db.etl_db, exec_id)
        # 非中断条件下修改调度表状态(允许失败条件下继续执行)
        if master_status != 2:
            # 修改数据库, 分布式锁
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                # 修改执行任务流状态[成功/失败/运行]
                ExecuteModel.update_exec_interface_status(
                    db.etl_db, exec_id, interface_id, exec_status)
            # TODO 调度的任务流成功时修改主表状态
            if execute_detail['interface_id'] == interface_id:
                # 修改数据库, 分布式锁
                with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                    # 修改执行主表状态[成功/失败/运行]
                    ExecuteModel.update_execute_status(db.etl_db, exec_id,
                                                       exec_status)
        # 当前任务流成功时修改账期, 运行后置任务流
        if exec_status == 0:
            # 数据日期改成当天日期, 手动调度时可以再优化
            new_date = time.strftime('%Y-%m-%d', time.localtime())
            with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                ExecuteModel.update_interface_run_time(db.etl_db, interface_id,
                                                       new_date)
            # 获取可执行任务流
            next_jobs = continue_execute_interface(
                exec_id,
                interface_id,
                exec_type=execute_detail['exec_type'],
                run_date=execute_detail['run_date'])
            if not next_jobs:
                return Response(msg='成功')
            for interface_id, item in next_jobs.items():
                for job_id in set(item['job_id']):
                    # 修改执行详情表状态[运行中]
                    with MysqlLock(config.mysql.etl, 'exec_lock_%s' % exec_id):
                        ScheduleModel.update_exec_job_status(
                            db.etl_db, exec_id, interface_id, job_id,
                            'running')
                    log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' %
                             (exec_id, interface_id, job_id))
                    nodes = item['nodes']
                    # RPC分发任务
                    push_msg = rpc_push_job(
                        exec_id,
                        interface_id,
                        job_id,
                        nodes[job_id]['server_host'],
                        config.exec.port,
                        nodes[job_id]['params_value'],
                        nodes[job_id]['server_dir'],
                        nodes[job_id]['server_script'],
                        nodes[job_id]['return_code'],
                        nodes[job_id]['status'],
                        run_date=execute_detail['run_date'])
                    if push_msg:
                        return Response(msg=push_msg)

        return Response(msg='成功')
示例#8
0
def get_event_job(event_id, exec_type=1, run_date='', date_format='%Y%m%d'):
    """
    事件执行开始方法
    1.传入事件id(ftp_event_id)
    2.获取事件详情(任务流id, 任务流名称, 数据日期)
    3.获取FTP服务器配置(传入ftp_event_id)
    4.FTP服务器不存在抛出异常
    5.检测FTP服务器连接, 将数据日期替换文件名, 查询文件是否存在
    6.不存在退出
    7.条件一: 文件存在; 条件二: 未存在当前数据日期的成功执行记录(调度id查询), 执行任务流
    8.构造任务流, for任务流列表, return任务流依赖数据结构, 每个dict遍历一遍, 是否存在未for的key,
    如果存在(该任务流在之前任务流的数据结构中), 跳过该任务流, 写入数据库, 执行部分同调度触发, 执行成功时修改数据日期到当天
    :param event_id: 事件id
    :param exec_type: 执行类型: 1.自动, 2.手动
    :param run_date: 手动传入$date日期
    :param date_format: $date日期格式
    :return: None
    """
    # 传入日期
    if run_date and date_format:
        run_time = time.strftime(date_format, time.strptime(run_date, '%Y-%m-%d'))
    else:
        event_detail = FtpEventModel.get_ftp_event_detail(db.etl_db, event_id)
        if event_detail and event_detail['date_time']:
            run_time = time.strftime(date_format, time.strptime(event_detail['date_time'], '%Y-%m-%d'))
        else:
            run_time = time.strftime(date_format, time.localtime())
    # 任务流详情
    detail_list = EventModel.get_interface_detail_by_ftp_event_id(db.etl_db, event_id)
    # 检测是否执行
    # 获取FTP服务器配置
    ftp_detail = FtpEventModel.get_ftp_detail_by_event_id(db.etl_db, event_id)
    # 检测FTP服务器文件是否存在
    if isinstance(ftp_detail['ftp_passwd'], bytes):
        ftp_detail['ftp_passwd'] = ftp_detail['ftp_passwd'].decode('utf-8', 'ignore')
    try:
        # FTP连接
        if ftp_detail['ftp_type'] == 1:
            ftp = FtpLink(ftp_detail['ftp_host'], ftp_detail['ftp_port'], ftp_detail['ftp_user'], ftp_detail['ftp_passwd'])
            FtpModel.update_ftp_status(db.etl_db, ftp_detail['ftp_id'], 0)
            # 文件名
            file_name = time.strftime(ftp_detail['file_name'], time.strptime(ftp_detail['date_time'], '%Y-%m-%d'))
            result = ftp.test_file(ftp_detail['data_path'], file_name)
            ftp.close()
        # SFTP连接
        elif ftp_detail['ftp_type'] == 2:
            ftp = SftpLink(ftp_detail['ftp_host'], ftp_detail['ftp_port'], ftp_detail['ftp_user'], ftp_detail['ftp_passwd'])
            FtpModel.update_ftp_status(db.etl_db, ftp_detail['ftp_id'], 0)
            # 文件名
            file_name = time.strftime(ftp_detail['file_name'], time.strptime(ftp_detail['date_time'], '%Y-%m-%d'))
            result = ftp.test_file(ftp_detail['data_path'], file_name)
            ftp.close()
        else:
            FtpModel.update_ftp_status(db.etl_db, ftp_detail['ftp_id'], 1)
            return Response(status=400, msg='FTP服务器类型未知')
    except:
        FtpModel.update_ftp_status(db.etl_db, ftp_detail['ftp_id'], 1)
        return Response(status=400, msg='FTP连接异常')
    # 当前数据日期的成功执行记录
    success_detail = EventModel.get_event_exec_detail_success(db.etl_db, event_id, ftp_detail['date_time'])
    # 文件存在, 未存在当前数据日期的成功执行记录(调度id查询)
    if result and not success_detail:
        # 执行任务流
        pass
    else:
        return Response(status=400, msg='FTP文件目录不存在')
    interface_dag_nodes = {}
    # 遍历多个任务流
    for detail in detail_list:
        # 生成执行任务流前后依赖关系
        dag = generate_interface_dag_by_event(detail)
        # 生成执行任务流树形关系
        tree = generate_interface_tree_by_event(detail)
        tree_nodes = [_ for _ in tree.keys()]
        # 填充树形节点
        for key in set(tree_nodes):
            dag[key]['is_tree'] = 1
        # 合并
        interface_dag_nodes.update(dag)

    if not interface_dag_nodes:
        return
    # 需执行任务流
    interface_tree_nodes = {key: value for key, value in interface_dag_nodes.items() if value.get('is_tree', 0) == 1}
    # 获取所有任务流的任务详情
    job_nodes = {}
    for _, item in interface_tree_nodes.items():
        jobs = generate_job_dag_by_interface(item['id'])
        job_nodes[item['id']] = jobs
    # 添加执行主表, 任务流表, 任务表至数据库
    exec_id = add_event_exec_record(event_id, interface_dag_nodes, job_nodes, exec_type, run_time, date_format)
    # 初始任务流
    start_interface = [_ for _, item in interface_tree_nodes.items() if item['level'] == 0]
    # 开始执行初始任务流中的任务
    flag = False
    for curr_interface in start_interface:
        start_jobs = job_nodes[curr_interface]
        # 任务流中任务为空, 则视调度已完成
        if not start_jobs:
            flag = True
            log.info('事件任务流中任务为空: 事件id: %s, 执行id: %s, 任务流id: %s' % (event_id, exec_id, curr_interface))
            # 修改执行任务流[成功]
            with MysqlLock(config.mysql.etl, 'event_lock_%s' % exec_id):
                EventModel.update_event_exec_interface_status(db.etl_db, exec_id, curr_interface, 0)
        else:
            # 修改执行任务流[运行中]
            with MysqlLock(config.mysql.etl, 'event_lock_%s' % exec_id):
                EventModel.update_event_exec_interface_status(db.etl_db, exec_id, curr_interface, 1)
            # rpc分发任务
            for job in start_jobs:
                if job['level'] == 0:
                    # 修改执行详情表状态[运行中]
                    with MysqlLock(config.mysql.etl, 'event_lock_%s' % exec_id):
                        EventModel.update_event_exec_job_status(db.etl_db, exec_id, curr_interface, job['id'],
                                                                'running')
                    log.info('事件分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' % (exec_id, curr_interface, job['id']))
                    rpc_push_job(exec_id, curr_interface, job['id'], job['server_host'], config.exec.port,
                                 ','.join(job['params_value']), job['server_dir'], job['server_script'],
                                 job['return_code'], job['status'], run_date=run_time)
    # 继续下一个任务流
    if flag:
        next_jobs = continue_event_execute_interface(exec_id, exec_type=exec_type, run_date=run_time)
        if not next_jobs:
            return
        for interface_id, item in next_jobs.items():
            for job_id in set(item['job_id']):
                log.info('分发任务: 执行id: %s, 任务流id: %s, 任务id: %s' % (exec_id, interface_id, job_id))
                nodes = item['nodes']
                rpc_push_job(exec_id, interface_id, job_id, nodes[job_id]['server_host'],
                             config.exec.port, nodes[job_id]['params_value'],
                             nodes[job_id]['server_dir'], nodes[job_id]['server_script'],
                             nodes[job_id]['return_code'], nodes[job_id]['status'], run_date=run_time)