Python Prometheus.update_metrics 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: poseidon.helpers.prometheus

클래스/타입: Prometheus

메소드/함수: update_metrics

hotexamples.com에서의 예제들: 2

Python Prometheus.update_metrics - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 poseidon.helpers.prometheus.Prometheus.update_metrics에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

initialize_metrics(5)

Prometheus(3)

start(2)

update_metrics(2)

get_metrics(1)

예제 #1

파일 보기

파일: main.py 프로젝트: x0rzkov/poseidon

class Monitor:
    def __init__(self, skip_rabbit, controller=None):
        self.faucet_event = []
        self.m_queue = queue.Queue()
        self.job_queue = queue.Queue()
        self.skip_rabbit = skip_rabbit
        self.logger = logger
        self.rabbit_channel_connection_local = None
        self.rabbit_channel_connection_local_fa = None

        # get config options
        if controller is None:
            self.controller = Config().get_config()
        else:
            self.controller = controller

        # timer class to call things periodically in own thread
        self.schedule = schedule

        # setup prometheus
        self.prom = Prometheus()
        try:
            self.prom.initialize_metrics()
        except Exception as e:  # pragma: no cover
            self.logger.debug(
                'Prometheus metrics are already initialized: {0}'.format(
                    str(e)))
        Prometheus.start()

        # initialize sdnconnect
        self.s = SDNConnect(self.controller)

        # schedule periodic scan of endpoints thread
        self.schedule.every(self.controller['scan_frequency']).seconds.do(
            self.schedule_job_kickurl)

        # schedule periodic reinvestigations thread
        self.schedule.every(
            self.controller['reinvestigation_frequency']).seconds.do(
                self.schedule_job_reinvestigation)

        # schedule all threads
        self.schedule_thread = threading.Thread(target=partial(
            schedule_thread_worker, schedule=self.schedule),
                                                name='st_worker')

    def _update_metrics(self):
        self.logger.debug('updating metrics')
        try:
            # get current state
            req = requests.get('http://poseidon-api:8000/v1/network_full',
                               timeout=10)
            # send results to prometheus
            hosts = req.json()['dataset']
            self.prom.update_metrics(hosts)
        except (requests.exceptions.ConnectionError,
                Exception) as e:  # pragma: no cover
            self.logger.error(
                'Unable to get current state and send it to Prometheus because: {0}'
                .format(str(e)))

    def job_kickurl(self):
        self.s.check_endpoints(messages=self.faucet_event)
        del self.faucet_event[:]
        self._update_metrics()

    def job_reinvestigation(self):
        ''' put endpoints into the reinvestigation state if possible '''
        def trigger_reinvestigation(candidates):
            # get random order of things that are known
            for _ in range(self.controller['max_concurrent_reinvestigations'] -
                           self.s.investigations):
                if len(candidates) > 0:
                    chosen = candidates.pop()
                    self.logger.info(
                        'Starting reinvestigation on: {0} {1}'.format(
                            chosen.name, chosen.state))
                    chosen.reinvestigate()  # pytype: disable=attribute-error
                    chosen.p_prev_states.append(
                        (chosen.state, int(time.time())))
                    self.s.mirror_endpoint(chosen)

        candidates = [
            endpoint for endpoint in self.s.endpoints.values()
            if endpoint.state in ['queued']
        ]
        if len(candidates) == 0:
            # if no queued endpoints, then known and abnormal are candidates
            candidates = [
                endpoint for endpoint in self.s.endpoints.values()
                if endpoint.state in ['known', 'abnormal']
            ]
            if len(candidates) > 0:
                random.shuffle(candidates)
        if self.s.sdnc:
            trigger_reinvestigation(candidates)

    def queue_job(self, job):
        if self.job_queue.qsize() < 2:
            self.job_queue.put(job)

    def schedule_job_kickurl(self):
        self.queue_job(self.job_kickurl)

    def schedule_job_reinvestigation(self):
        self.queue_job(self.job_reinvestigation)

    def update_routing_key_time(self, routing_key):
        self.prom.prom_metrics['last_rabbitmq_routing_key_time'].labels(
            routing_key=routing_key).set(time.time())

    def format_rabbit_message(self, item):
        '''
        read a message off the rabbit_q
        the message should be item = (routing_key,msg)
        '''
        routing_key, my_obj = item
        self.logger.debug('routing_key: {0} rabbit_message: {1}'.format(
            routing_key, my_obj))
        my_obj = json.loads(my_obj)

        def handler_algos_decider(my_obj):
            self.logger.debug('decider value:{0}'.format(my_obj))
            data = my_obj.get('data', None)
            results = my_obj.get('results', {})
            tool = results.get('tool', None)
            if isinstance(data, dict):
                if tool == 'p0f':
                    if self.s.prc.store_p0f_result(data):
                        return (data, None)
                elif tool == 'networkml':
                    self.s.prc.store_tool_result(my_obj, 'networkml')
                    for name, message in data.items():
                        endpoint = self.s.endpoints.get(name, None)
                        if endpoint:
                            self.logger.debug(
                                'processing networkml results for %s', name)
                            self.s.unmirror_endpoint(endpoint)
                            # pytype: disable=attribute-error
                            endpoint.trigger('unknown')
                            endpoint.p_next_state = None
                            endpoint.p_prev_states.append(
                                (endpoint.state, int(time.time())))
                            if message.get('valid', False):
                                return (data, None)
                            break
                        else:
                            self.logger.debug(
                                'endpoint %s from networkml not found', name)
            return ({}, None)

        def handler_action_ignore(my_obj):
            for name in my_obj:
                endpoint = self.s.endpoints.get(name, None)
                if endpoint:
                    endpoint.ignore = True
            return ({}, None)

        def handler_action_clear_ignored(my_obj):
            for name in my_obj:
                endpoint = self.s.endpoints.get(name, None)
                if endpoint:
                    endpoint.ignore = False
            return ({}, None)

        def handler_action_change(my_obj):
            for name, state in my_obj:
                endpoint = self.s.endpoints.get(name, None)
                if endpoint:
                    try:
                        if (state != 'mirror' and state != 'reinvestigate'
                                and (endpoint.state == 'mirroring'
                                     or endpoint.state == 'reinvestigating')):
                            self.s.unmirror_endpoint(endpoint)
                        # pytype: disable=attribute-error
                        endpoint.trigger(state)
                        endpoint.p_next_state = None
                        endpoint.p_prev_states.append(
                            (endpoint.state, int(time.time())))
                        if endpoint.state == 'mirroring' or endpoint.state == 'reinvestigating':
                            self.s.mirror_endpoint(endpoint)
                    except Exception as e:  # pragma: no cover
                        self.logger.error(
                            'Unable to change endpoint {0} because: {1}'.
                            format(endpoint.name, str(e)))
            return ({}, None)

        def handler_action_update_acls(my_obj):
            for ip in my_obj:
                rules = my_obj[ip]
                endpoints = self.s.endpoints_by_ip(ip)
                if endpoints:
                    endpoint = endpoints[0]
                    try:
                        status = Actions(endpoint, self.s.sdnc).update_acls(
                            rules_file=self.controller['RULES_FILE'],
                            endpoints=endpoints,
                            force_apply_rules=rules)
                        if not status:
                            self.logger.warning(
                                'Unable to apply rules: {0} to endpoint: {1}'.
                                format(rules, endpoint.name))
                    except Exception as e:
                        self.logger.error(
                            'Unable to apply rules: {0} to endpoint: {1} because {2}'
                            .format(rules, endpoint.name, str(e)))
            return ({}, None)

        def handler_action_remove(my_obj):
            remove_list = [name for name in my_obj]
            return ({}, remove_list)

        def handler_action_remove_ignored(_my_obj):
            remove_list = [
                endpoint.name for endpoint in self.s.endpoints.values()
                if endpoint.ignore
            ]
            return ({}, remove_list)

        def handler_action_remove_inactives(_my_obj):
            remove_list = [
                endpoint.name for endpoint in self.s.endpoints.values()
                if endpoint.state == 'inactive'
            ]
            return ({}, remove_list)

        def handler_faucet_event(my_obj):
            if self.s and self.s.sdnc:
                if not self.s.sdnc.ignore_event(my_obj):
                    self.faucet_event.append(my_obj)
                    return (my_obj, None)
            return ({}, None)

        handlers = {
            'poseidon.algos.decider': handler_algos_decider,
            'poseidon.action.ignore': handler_action_ignore,
            'poseidon.action.clear.ignored': handler_action_clear_ignored,
            'poseidon.action.change': handler_action_change,
            'poseidon.action.update_acls': handler_action_update_acls,
            'poseidon.action.remove': handler_action_remove,
            'poseidon.action.remove.ignored': handler_action_remove_ignored,
            'poseidon.action.remove.inactives':
            handler_action_remove_inactives,
            self.controller['FA_RABBIT_ROUTING_KEY']: handler_faucet_event,
        }

        handler = handlers.get(routing_key, None)
        if handler is None:
            self.logger.error(
                'no handler for routing_key {0}'.format(routing_key))
        else:
            ret_val, remove_list = handler(my_obj)
            self.update_routing_key_time(routing_key)
            if remove_list:
                for endpoint_name in remove_list:
                    if endpoint_name in self.s.endpoints:
                        del self.s.endpoints[endpoint_name]
            return (ret_val, True)

        return ({}, False)

    def schedule_mirroring(self):
        queued_endpoints = [
            endpoint for endpoint in self.s.endpoints.values()
            if not endpoint.ignore and endpoint.state == 'queued'
            and endpoint.p_next_state != 'inactive'
        ]
        self.s.investigations = len([
            endpoint for endpoint in self.s.endpoints.values()
            if endpoint.state in ['mirroring', 'reinvestigating']
        ])
        # mirror things in the order they got added to the queue
        queued_endpoints = sorted(queued_endpoints,
                                  key=lambda x: x.p_prev_states[-1][1])

        investigation_budget = max(
            self.controller['max_concurrent_reinvestigations'] -
            self.s.investigations, 0)
        self.logger.debug('investigations {0}, budget {1}, queued {2}'.format(
            str(self.s.investigations), str(investigation_budget),
            str(len(queued_endpoints))))

        for endpoint in queued_endpoints[:investigation_budget]:
            # pytype: disable=attribute-error
            endpoint.trigger(endpoint.p_next_state)
            endpoint.p_next_state = None
            endpoint.p_prev_states.append((endpoint.state, int(time.time())))
            self.s.mirror_endpoint(endpoint)

        for endpoint in self.s.endpoints.values():
            if not endpoint.ignore:
                if self.s.sdnc:
                    if endpoint.state == 'unknown':
                        endpoint.p_next_state = 'mirror'
                        endpoint.queue()  # pytype: disable=attribute-error
                        endpoint.p_prev_states.append(
                            (endpoint.state, int(time.time())))
                    elif endpoint.state in ['mirroring', 'reinvestigating']:
                        cur_time = int(time.time())
                        # timeout after 2 times the reinvestigation frequency
                        # in case something didn't report back, put back in an
                        # unknown state
                        if cur_time - endpoint.p_prev_states[-1][
                                1] > 2 * self.controller[
                                    'reinvestigation_frequency']:
                            self.logger.debug(
                                'timing out: {0} and setting to unknown'.
                                format(endpoint.name))
                            self.s.unmirror_endpoint(endpoint)
                            endpoint.unknown()  # pytype: disable=attribute-error
                            endpoint.p_prev_states.append(
                                (endpoint.state, int(time.time())))
                else:
                    if endpoint.state != 'known':
                        endpoint.known()  # pytype: disable=attribute-error

    def schedule_coprocessing(self):
        queued_endpoints = [
            endpoint for endpoint in self.s.endpoints.values()
            if not endpoint.copro_ignore
            and endpoint.copro_state == 'copro_queued'
        ]  # pytype: disable=attribute-error
        self.s.coprocessing = len([
            endpoint for endpoint in self.s.endpoints.values()
            if endpoint.copro_state in ['copro_coprocessing']
        ])
        # mirror things in the order they got added to the queue
        queued_endpoints = sorted(queued_endpoints,
                                  key=lambda x: x.p_prev_copro_states[-1][1])

        coprocessing_budget = max(
            self.controller['max_concurrent_coprocessing'] -
            self.s.coprocessing, 0)
        self.logger.debug('coprocessing {0}, budget {1}, queued {2}'.format(
            str(self.s.coprocessing), str(coprocessing_budget),
            str(len(queued_endpoints))))

        for endpoint in queued_endpoints[:coprocessing_budget]:
            # pytype: disable=attribute-error
            endpoint.trigger(endpoint.p_next_copro_state)
            endpoint.p_next_copro_state = None  # pytype: disable=attribute-error
            endpoint.p_prev_copro_states.append(  # pytype: disable=attribute-error
                (endpoint.copro_state, int(time.time())))
            self.s.coprocess_endpoint(endpoint)

        for endpoint in self.s.endpoints.values():
            if not endpoint.copro_ignore:  # pytype: disable=attribute-error
                if self.s.sdnc:
                    if endpoint.copro_state == 'copro_unknown':  # pytype: disable=attribute-error
                        endpoint.p_next_copro_state = 'copro_coprocessing'
                        endpoint.copro_queue()  # pytype: disable=attribute-error
                        endpoint.p_prev_copro_states.append(  # pytype: disable=attribute-error
                            (endpoint.copro_state, int(time.time())))
                    # pytype: disable=attribute-error
                    elif endpoint.copro_state in ['copro_coprocessing']:
                        cur_time = int(time.time())
                        # timeout after 2 times the reinvestigation frequency
                        # in case something didn't report back, put back in an
                        # unknown state
                        # pytype: disable=attribute-error
                        if cur_time - endpoint.p_prev_copro_states[-1][
                                1] > 2 * self.controller[
                                    'coprocessing_frequency']:
                            self.logger.debug(
                                'timing out: {0} and setting to unknown'.
                                format(endpoint.name))
                            self.s.uncoprocess_endpoint(endpoint)
                            endpoint.copro_unknown()  # pytype: disable=attribute-error
                            endpoint.p_prev_copro_states.append(  # pytype: disable=attribute-error
                                (endpoint.copro_state, int(time.time())))  # pytype: disable=attribute-error
                else:
                    if endpoint.state != 'copro_nominal':
                        endpoint.copro_nominal()  # pytype: disable=attribute-error

    def process(self):
        global CTRL_C
        signal.signal(signal.SIGINT, partial(self.signal_handler))
        while not CTRL_C['STOP']:
            while True:
                found_work, rabbit_msg = self.get_q_item(self.m_queue,
                                                         timeout=0)
                if not found_work:
                    break
                self.format_rabbit_message(rabbit_msg)
            self.s.refresh_endpoints()
            found_work, schedule_func = self.get_q_item(self.job_queue)
            if found_work and callable(schedule_func):
                self.logger.info('calling %s', schedule_func)
                start_time = time.time()
                schedule_func()
                self.logger.debug('%s done (%.1f sec)' %
                                  (schedule_func, time.time() - start_time))
            self.schedule_mirroring()

        self.s.refresh_endpoints()

    def get_q_item(self, q, timeout=1):
        '''
        attempt to get a work item from the queue
        m_queue -> (routing_key, body)
        a read from get_q_item should be of the form
        (boolean,(routing_key, body))
        '''
        global CTRL_C
        if not CTRL_C['STOP']:
            try:
                if timeout:
                    return (True, q.get(True, timeout=timeout))
                return (True, q.get_nowait())
            except queue.Empty:  # pragma: no cover
                pass

        return (False, None)

    def shutdown(self):
        ''' gracefully shut down. '''
        self.s.clear_filters()
        for job in self.schedule.jobs:
            self.logger.debug('shutdown :{0}'.format(job))
            self.schedule.cancel_job(job)
        if self.rabbit_channel_connection_local:
            self.rabbit_channel_connection_local.close()
        if self.rabbit_channel_connection_local_fa:
            self.rabbit_channel_connection_local_fa.close()
        self.logger.debug('SHUTTING DOWN')
        self.logger.debug('EXITING')
        sys.exit()

    def signal_handler(self, _signal, _frame):
        ''' hopefully eat a CTRL_C and signal system shutdown '''
        global CTRL_C
        CTRL_C['STOP'] = True
        self.logger.debug('CTRL-C: {0}'.format(CTRL_C))
        try:
            self.shutdown()
        except Exception as e:  # pragma: no cover
            self.logger.debug(
                'Failed to handle signal properly because: {0}'.format(str(e)))

예제 #2

파일 보기

def test_Prometheus():
    """
    Tests Prometheus
    """
    p = Prometheus.get_metrics()
    hosts = [{
        'active': 0,
        'source': 'poseidon',
        'role': 'unknown',
        'state': 'unknown',
        'ipv4_os': 'unknown',
        'tenant': 'vlan1',
        'port': 1,
        'segment': 'switch1',
        'ipv4': '123.123.123.123',
        'mac': '00:00:00:00:00:00',
        'id': 'foo1',
        'behavior': 1
    }, {
        'active': 1,
        'source': 'poseidon',
        'role': 'unknown',
        'state': 'unknown',
        'ipv4_os': 'unknown',
        'tenant': 'vlan1',
        'port': 1,
        'segment': 'switch1',
        'ipv4': '123.123.123.123',
        'mac': '00:00:00:00:00:00',
        'id': 'foo2',
        'behavior': 1
    }, {
        'active': 0,
        'source': 'poseidon',
        'role': 'unknown',
        'state': 'unknown',
        'ipv4_os': 'unknown',
        'tenant': 'vlan1',
        'port': 1,
        'segment': 'switch1',
        'ipv4': '123.123.123.123',
        'mac': '00:00:00:00:00:00',
        'id': 'foo3',
        'behavior': 1
    }, {
        'active': 1,
        'source': 'poseidon1',
        'role': 'unknown',
        'state': 'unknown',
        'ipv4_os': 'unknown',
        'tenant': 'vlan1',
        'port': 2,
        'segment': 'switch1',
        'ipv4': '2106::1',
        'mac': '00:00:00:00:00:00',
        'id': 'foo4',
        'behavior': 1
    }, {
        'active': 1,
        'source': 'poseidon',
        'role': 'unknown',
        'state': 'unknown',
        'ipv4_os': 'unknown',
        'tenant': 'vlan1',
        'port': 1,
        'segment': 'switch1',
        'ipv4': '::',
        'mac': '00:00:00:00:00:00',
        'id': 'foo5',
        'behavior': 1
    }]
    p = Prometheus()
    p.update_metrics(hosts)