Esempi in Python per AsyncPipelineTaskGenerator, esempi in Python per tfx.orchestration.experimental.core.async_pipeline_task_gen.AsyncPipelineTaskGenerator

Esempio n. 1

0

Mostra file

 def _generate_and_test(self, use_task_queue, num_initial_executions,
                        num_tasks_generated, num_new_executions,
                        num_active_executions):
     """Generates tasks and tests the effects."""
     with self._mlmd_connection as m:
         executions = m.store.get_executions()
         self.assertLen(
             executions, num_initial_executions,
             'Expected {} execution(s) in MLMD.'.format(
                 num_initial_executions))
         task_gen = asptg.AsyncPipelineTaskGenerator(
             m, self._pipeline, self._task_queue.contains_task_id)
         tasks = task_gen.generate()
         self.assertLen(
             tasks, num_tasks_generated,
             'Expected {} task(s) to be generated.'.format(
                 num_tasks_generated))
         executions = m.store.get_executions()
         num_total_executions = num_initial_executions + num_new_executions
         self.assertLen(
             executions, num_total_executions,
             'Expected {} execution(s) in MLMD.'.format(
                 num_total_executions))
         active_executions = [
             e for e in executions
             if e.last_known_state == metadata_store_pb2.Execution.RUNNING
         ]
         self.assertLen(
             active_executions, num_active_executions,
             'Expected {} active execution(s) in MLMD.'.format(
                 num_active_executions))
         if use_task_queue:
             for task in tasks:
                 self._task_queue.enqueue(task)
         return tasks, active_executions

Esempio n. 2

0

Mostra file

def _get_pipeline_details(mlmd_handle: metadata.Metadata,
                          task_queue: tq.TaskQueue) -> List[_PipelineDetail]:
    """Scans MLMD and returns pipeline details."""
    result = []

    contexts = mlmd_handle.store.get_contexts_by_type(
        _ORCHESTRATOR_RESERVED_ID)

    for context in contexts:
        active_executions = [
            e for e in mlmd_handle.store.get_executions_by_context(context.id)
            if execution_lib.is_execution_active(e)
        ]
        if len(active_executions) > 1:
            raise status_lib.StatusNotOkError(
                code=status_lib.Code.INTERNAL,
                message=(
                    f'Expected 1 but found {len(active_executions)} active '
                    f'executions for context named: {context.name}'))
        if not active_executions:
            continue
        execution = active_executions[0]

        # TODO(goutham): Instead of parsing the pipeline IR each time, we could
        # cache the parsed pipeline IR in `initiate_pipeline_start` and reuse it.
        pipeline_ir_b64 = common_utils.get_metadata_value(
            execution.properties[_PIPELINE_IR])
        pipeline = pipeline_pb2.Pipeline()
        pipeline.ParseFromString(base64.b64decode(pipeline_ir_b64))

        stop_initiated = _is_stop_initiated(execution)

        if stop_initiated:
            generator = None
        else:
            if pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC:
                generator = sync_pipeline_task_gen.SyncPipelineTaskGenerator(
                    mlmd_handle, pipeline, task_queue.contains_task_id)
            elif pipeline.execution_mode == pipeline_pb2.Pipeline.ASYNC:
                generator = async_pipeline_task_gen.AsyncPipelineTaskGenerator(
                    mlmd_handle, pipeline, task_queue.contains_task_id)
            else:
                raise status_lib.StatusNotOkError(
                    code=status_lib.Code.FAILED_PRECONDITION,
                    message=
                    (f'Only SYNC and ASYNC pipeline execution modes supported; '
                     f'found pipeline with execution mode: {pipeline.execution_mode}'
                     ))

        result.append(
            _PipelineDetail(
                context=context,
                execution=execution,
                pipeline=pipeline,
                pipeline_uid=task_lib.PipelineUid.from_pipeline(pipeline),
                stop_initiated=stop_initiated,
                generator=generator))

    return result

Esempio n. 3

0

Mostra file

File: pipeline_ops.py Progetto: sycdesign/tfx

def _process_active_pipelines(
        mlmd_handle: metadata.Metadata, task_queue: tq.TaskQueue,
        service_job_manager: Optional[service_jobs.ServiceJobManager],
        pipeline_states: Sequence[pstate.PipelineState]) -> None:
    """Processes active pipelines."""
    for pipeline_state in pipeline_states:
        pipeline = pipeline_state.pipeline
        execution = pipeline_state.execution
        assert execution.last_known_state in (
            metadata_store_pb2.Execution.NEW,
            metadata_store_pb2.Execution.RUNNING)
        if execution.last_known_state != metadata_store_pb2.Execution.RUNNING:
            updated_execution = copy.deepcopy(execution)
            updated_execution.last_known_state = metadata_store_pb2.Execution.RUNNING
            mlmd_handle.store.put_executions([updated_execution])

        if service_job_manager is not None:
            # Ensure all the required services are running.
            _ensure_services(service_job_manager, pipeline_state)
            pure_service_node_ids = _get_pure_service_node_ids(
                service_job_manager, pipeline_state)
        else:
            pure_service_node_ids = set()

        # Create cancellation tasks for stop-initiated nodes if necessary.
        stop_initiated_nodes = _get_stop_initiated_nodes(pipeline_state)
        for node in stop_initiated_nodes:
            if node.node_info.id not in pure_service_node_ids:
                _maybe_enqueue_cancellation_task(mlmd_handle, pipeline, node,
                                                 task_queue)

        ignore_node_ids = set(
            n.node_info.id
            for n in stop_initiated_nodes) | pure_service_node_ids

        # Initialize task generator for the pipeline.
        if pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC:
            generator = sync_pipeline_task_gen.SyncPipelineTaskGenerator(
                mlmd_handle, pipeline, task_queue.contains_task_id,
                ignore_node_ids)
        elif pipeline.execution_mode == pipeline_pb2.Pipeline.ASYNC:
            generator = async_pipeline_task_gen.AsyncPipelineTaskGenerator(
                mlmd_handle, pipeline, task_queue.contains_task_id,
                ignore_node_ids)
        else:
            raise status_lib.StatusNotOkError(
                code=status_lib.Code.FAILED_PRECONDITION,
                message=
                (f'Only SYNC and ASYNC pipeline execution modes supported; '
                 f'found pipeline with execution mode: {pipeline.execution_mode}'
                 ))

        # TODO(goutham): Consider concurrent task generation.
        tasks = generator.generate()
        for task in tasks:
            task_queue.enqueue(task)

Esempio n. 4

0

Mostra file

File: async_pipeline_task_gen_test.py Progetto: lre/tfx

 def test_no_tasks_generated_when_new(self):
     task_gen = asptg.AsyncPipelineTaskGenerator(self._mlmd_connection,
                                                 self._pipeline)
     tasks = task_gen.generate()
     self.assertEmpty(tasks, 'Expected no task generation when no inputs.')
     with self._mlmd_connection as m:
         self.assertEmpty(
             m.store.get_executions(),
             'There must not be any registered executions since no tasks were '
             'geerated.')

Esempio n. 5

0

Mostra file

  def test_no_tasks_generated_when_no_inputs(self, min_count):
    """Tests no tasks are generated when there are no inputs, regardless of min_count."""
    for node in self._pipeline.nodes:
      for v in node.pipeline_node.inputs.inputs.values():
        v.min_count = min_count

    with self._mlmd_connection as m:
      pipeline_state = test_utils.get_or_create_pipeline_state(
          m, self._pipeline)
      task_gen = asptg.AsyncPipelineTaskGenerator(
          m, lambda _: False, service_jobs.DummyServiceJobManager())
      tasks = task_gen.generate(pipeline_state)
      self.assertEmpty(tasks, 'Expected no task generation when no inputs.')
      self.assertEmpty(
          test_utils.get_non_orchestrator_executions(m),
          'There must not be any registered executions since no tasks were '
          'generated.')

Esempio n. 6

0

Mostra file

 def _generate_and_test(self,
                        use_task_queue,
                        num_initial_executions,
                        num_tasks_generated,
                        num_new_executions,
                        num_active_executions,
                        ignore_node_ids=None):
     """Generates tasks and tests the effects."""
     with self._mlmd_connection as m:
         executions = m.store.get_executions()
         self.assertLen(
             executions, num_initial_executions,
             'Expected {} execution(s) in MLMD.'.format(
                 num_initial_executions))
         pipeline_state = pstate.PipelineState.new(m, self._pipeline)
         task_gen = asptg.AsyncPipelineTaskGenerator(
             m,
             pipeline_state,
             self._task_queue.contains_task_id,
             self._mock_service_job_manager,
             ignore_node_ids=ignore_node_ids or set())
         tasks = task_gen.generate()
         self.assertLen(
             tasks, num_tasks_generated,
             'Expected {} task(s) to be generated.'.format(
                 num_tasks_generated))
         executions = m.store.get_executions()
         num_total_executions = num_initial_executions + num_new_executions
         self.assertLen(
             executions, num_total_executions,
             'Expected {} execution(s) in MLMD.'.format(
                 num_total_executions))
         active_executions = [
             e for e in executions
             if e.last_known_state == metadata_store_pb2.Execution.RUNNING
         ]
         self.assertLen(
             active_executions, num_active_executions,
             'Expected {} active execution(s) in MLMD.'.format(
                 num_active_executions))
         if use_task_queue:
             for task in tasks:
                 if task_lib.is_exec_node_task(task):
                     self._task_queue.enqueue(task)
         return tasks, active_executions

Esempio n. 7

0

Mostra file

    def test_no_tasks_generated_when_no_inputs(self, min_count):
        """Tests no tasks are generated when there are no inputs, regardless of min_count."""
        for node in self._pipeline.nodes:
            for v in node.pipeline_node.inputs.inputs.values():
                v.min_count = min_count

        with self._mlmd_connection as m:
            task_gen = asptg.AsyncPipelineTaskGenerator(
                m,
                self._pipeline,
                lambda _: False,
                ignore_node_ids=self._ignore_node_ids)
            tasks = task_gen.generate()
            self.assertEmpty(tasks,
                             'Expected no task generation when no inputs.')
            self.assertEmpty(
                m.store.get_executions(),
                'There must not be any registered executions since no tasks were '
                'generated.')

Esempio n. 8

0

Mostra file

    def test_no_tasks_generated_when_no_inputs(self, min_count):
        """Tests no tasks are generated when there are no inputs, regardless of min_count."""
        for node in self._pipeline.nodes:
            for v in node.pipeline_node.inputs.inputs.values():
                v.min_count = min_count

        with self._mlmd_connection as m:
            pipeline_state = pstate.PipelineState.new(m, self._pipeline)
            task_gen = asptg.AsyncPipelineTaskGenerator(
                m,
                pipeline_state,
                lambda _: False,
                service_jobs.DummyServiceJobManager(),
                ignore_node_ids=set([self._example_gen.node_info.id]))
            tasks = task_gen.generate()
            self.assertEmpty(tasks,
                             'Expected no task generation when no inputs.')
            self.assertEmpty(
                m.store.get_executions(),
                'There must not be any registered executions since no tasks were '
                'generated.')

Esempio n. 9

0

Mostra file

def _get_pipeline_details(mlmd_handle: metadata.Metadata,
                          task_queue: tq.TaskQueue) -> List[_PipelineDetail]:
  """Scans MLMD and returns pipeline details."""
  result = []

  contexts = pstate.get_orchestrator_contexts(mlmd_handle)

  for context in contexts:
    try:
      pipeline_state = pstate.PipelineState.load_from_orchestrator_context(
          mlmd_handle, context)
    except status_lib.StatusNotOkError as e:
      if e.code == status_lib.Code.NOT_FOUND:
        continue

    if pipeline_state.is_stop_initiated():
      generator = None
    else:
      pipeline = pipeline_state.pipeline
      if pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC:
        generator = sync_pipeline_task_gen.SyncPipelineTaskGenerator(
            mlmd_handle, pipeline, task_queue.contains_task_id)
      elif pipeline.execution_mode == pipeline_pb2.Pipeline.ASYNC:
        generator = async_pipeline_task_gen.AsyncPipelineTaskGenerator(
            mlmd_handle, pipeline, task_queue.contains_task_id)
      else:
        raise status_lib.StatusNotOkError(
            code=status_lib.Code.FAILED_PRECONDITION,
            message=(
                f'Only SYNC and ASYNC pipeline execution modes supported; '
                f'found pipeline with execution mode: {pipeline.execution_mode}'
            ))

    result.append(
        _PipelineDetail(pipeline_state=pipeline_state, generator=generator))

  return result

Esempio n. 10

0

Mostra file

File: task_manager_test.py Progetto: suryaavala/tfx

    def setUp(self):
        super(TaskManagerE2ETest, self).setUp()
        pipeline_root = os.path.join(
            os.environ.get('TEST_UNDECLARED_OUTPUTS_DIR', self.get_temp_dir()),
            self.id())

        # Makes sure multiple connections within a test always connect to the same
        # MLMD instance.
        metadata_path = os.path.join(pipeline_root, 'metadata', 'metadata.db')
        self._metadata_path = metadata_path
        connection_config = metadata.sqlite_metadata_connection_config(
            metadata_path)
        connection_config.sqlite.SetInParent()
        self._mlmd_connection = metadata.Metadata(
            connection_config=connection_config)

        # Sets up the pipeline.
        pipeline = pipeline_pb2.Pipeline()
        self.load_proto_from_text(
            os.path.join(os.path.dirname(__file__), 'testdata',
                         'async_pipeline.pbtxt'), pipeline)

        # Extracts components.
        self._example_gen = pipeline.nodes[0].pipeline_node
        self._transform = pipeline.nodes[1].pipeline_node
        self._trainer = pipeline.nodes[2].pipeline_node

        # Pack deployment config for testing.
        deployment_config = pipeline_pb2.IntermediateDeploymentConfig()
        executor_spec = pipeline_pb2.ExecutorSpec.PythonClassExecutorSpec(
            class_path='fake.ClassPath')
        deployment_config.executor_specs[self._trainer.node_info.id].Pack(
            executor_spec)
        deployment_config.executor_specs[self._transform.node_info.id].Pack(
            executor_spec)
        self._type_url = deployment_config.executor_specs[
            self._trainer.node_info.id].type_url
        pipeline.deployment_config.Pack(deployment_config)
        self._pipeline = pipeline
        self._pipeline_info = pipeline.pipeline_info
        self._pipeline_runtime_spec = pipeline.runtime_spec
        self._pipeline_runtime_spec.pipeline_root.field_value.string_value = (
            pipeline_root)

        ts.TaskSchedulerRegistry.clear()
        self._task_queue = tq.TaskQueue()

        # Run fake example-gen to prepare downstreams component triggers.
        test_utils.fake_example_gen_run(self._mlmd_connection,
                                        self._example_gen, 1, 1)

        # Task generator should produce a task to run transform.
        with self._mlmd_connection as m:
            pipeline_state = pstate.PipelineState(m, self._pipeline, 0)
            tasks = asptg.AsyncPipelineTaskGenerator(
                m, pipeline_state, self._task_queue.contains_task_id,
                service_jobs.DummyServiceJobManager()).generate()
        self.assertLen(tasks, 1)
        task = tasks[0]
        self.assertEqual('my_transform', task.node_uid.node_id)

        # Task generator should produce a task to run transform.
        with self._mlmd_connection as m:
            pipeline_state = pstate.PipelineState(m, self._pipeline, 0)
            tasks = asptg.AsyncPipelineTaskGenerator(
                m, pipeline_state, self._task_queue.contains_task_id,
                service_jobs.DummyServiceJobManager()).generate()
        self.assertLen(tasks, 1)
        self._task = tasks[0]
        self.assertEqual('my_transform', self._task.node_uid.node_id)
        self._task_queue.enqueue(self._task)

        # There should be 1 active execution in MLMD.
        with self._mlmd_connection as m:
            executions = m.store.get_executions()
        active_executions = [
            e for e in executions
            if e.last_known_state == metadata_store_pb2.Execution.RUNNING
        ]
        self.assertLen(active_executions, 1)

        # Active execution id.
        self._execution_id = active_executions[0].id

Esempio n. 11

0

Mostra file

def _orchestrate_active_pipeline(
        mlmd_handle: metadata.Metadata, task_queue: tq.TaskQueue,
        service_job_manager: service_jobs.ServiceJobManager,
        pipeline_state: pstate.PipelineState) -> None:
    """Orchestrates active pipeline."""
    pipeline = pipeline_state.pipeline
    execution = pipeline_state.execution
    assert execution.last_known_state in (metadata_store_pb2.Execution.NEW,
                                          metadata_store_pb2.Execution.RUNNING)
    if execution.last_known_state != metadata_store_pb2.Execution.RUNNING:
        updated_execution = copy.deepcopy(execution)
        updated_execution.last_known_state = metadata_store_pb2.Execution.RUNNING
        mlmd_handle.store.put_executions([updated_execution])

    # Initialize task generator for the pipeline.
    if pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC:
        generator = sync_pipeline_task_gen.SyncPipelineTaskGenerator(
            mlmd_handle, pipeline_state, task_queue.contains_task_id,
            service_job_manager)
    elif pipeline.execution_mode == pipeline_pb2.Pipeline.ASYNC:
        # Create cancellation tasks for stop-initiated nodes if necessary.
        stop_initiated_nodes = _get_stop_initiated_nodes(pipeline_state)
        for node in stop_initiated_nodes:
            if service_job_manager.is_pure_service_node(
                    pipeline_state, node.node_info.id):
                service_job_manager.stop_node_services(pipeline_state,
                                                       node.node_info.id)
            elif _maybe_enqueue_cancellation_task(mlmd_handle, pipeline, node,
                                                  task_queue):
                pass
            elif service_job_manager.is_mixed_service_node(
                    pipeline_state, node.node_info.id):
                service_job_manager.stop_node_services(pipeline_state,
                                                       node.node_info.id)
        generator = async_pipeline_task_gen.AsyncPipelineTaskGenerator(
            mlmd_handle, pipeline_state, task_queue.contains_task_id,
            service_job_manager,
            set(n.node_info.id for n in stop_initiated_nodes))
    else:
        raise status_lib.StatusNotOkError(
            code=status_lib.Code.FAILED_PRECONDITION,
            message=(
                f'Only SYNC and ASYNC pipeline execution modes supported; '
                f'found pipeline with execution mode: {pipeline.execution_mode}'
            ))

    tasks = generator.generate()

    with pipeline_state:
        for task in tasks:
            if task_lib.is_exec_node_task(task):
                task = typing.cast(task_lib.ExecNodeTask, task)
                task_queue.enqueue(task)
            elif task_lib.is_finalize_node_task(task):
                assert pipeline.execution_mode == pipeline_pb2.Pipeline.ASYNC
                task = typing.cast(task_lib.FinalizeNodeTask, task)
                pipeline_state.initiate_node_stop(task.node_uid, task.status)
            else:
                assert task_lib.is_finalize_pipeline_task(task)
                assert pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC
                assert len(tasks) == 1
                task = typing.cast(task_lib.FinalizePipelineTask, task)
                if task.status.code == status_lib.Code.OK:
                    logging.info('Pipeline run successful; pipeline uid: %s',
                                 pipeline_state.pipeline_uid)
                else:
                    logging.info('Pipeline run failed; pipeline uid: %s',
                                 pipeline_state.pipeline_uid)
                pipeline_state.initiate_stop(task.status)

Esempio n. 12

0

Mostra file

    def setUp(self):
        super().setUp()
        pipeline_root = os.path.join(
            os.environ.get('TEST_UNDECLARED_OUTPUTS_DIR', self.get_temp_dir()),
            self.id())

        # Makes sure multiple connections within a test always connect to the same
        # MLMD instance.
        metadata_path = os.path.join(pipeline_root, 'metadata', 'metadata.db')
        self._metadata_path = metadata_path
        connection_config = metadata.sqlite_metadata_connection_config(
            metadata_path)
        connection_config.sqlite.SetInParent()
        self._mlmd_connection = metadata.Metadata(
            connection_config=connection_config)

        # Sets up the pipeline.
        pipeline = test_async_pipeline.create_pipeline()

        # Extracts components.
        self._example_gen = pipeline.nodes[0].pipeline_node
        self._transform = pipeline.nodes[1].pipeline_node
        self._trainer = pipeline.nodes[2].pipeline_node

        # Pack deployment config for testing.
        deployment_config = pipeline_pb2.IntermediateDeploymentConfig()
        executor_spec = pipeline_pb2.ExecutorSpec.PythonClassExecutorSpec(
            class_path='fake.ClassPath')
        deployment_config.executor_specs[self._trainer.node_info.id].Pack(
            executor_spec)
        deployment_config.executor_specs[self._transform.node_info.id].Pack(
            executor_spec)
        self._type_url = deployment_config.executor_specs[
            self._trainer.node_info.id].type_url
        pipeline.deployment_config.Pack(deployment_config)
        self._pipeline = pipeline
        self._pipeline_info = pipeline.pipeline_info
        self._pipeline_runtime_spec = pipeline.runtime_spec
        self._pipeline_runtime_spec.pipeline_root.field_value.string_value = (
            pipeline_root)

        ts.TaskSchedulerRegistry.clear()
        self._task_queue = tq.TaskQueue()

        # Run fake example-gen to prepare downstreams component triggers.
        test_utils.fake_example_gen_run(self._mlmd_connection,
                                        self._example_gen, 1, 1)

        # Task generator should produce two tasks for transform. The first one is
        # UpdateNodeStateTask and the second one is ExecNodeTask.
        with self._mlmd_connection as m:
            pipeline_state = pstate.PipelineState.new(m, self._pipeline)
            tasks = asptg.AsyncPipelineTaskGenerator(
                m, self._task_queue.contains_task_id,
                service_jobs.DummyServiceJobManager()).generate(pipeline_state)
        self.assertLen(tasks, 2)
        self.assertTrue(task_lib.is_update_node_state_task(tasks[0]))
        self.assertEqual(pstate.NodeState.RUNNING, tasks[0].state)
        self.assertEqual('my_transform', tasks[0].node_uid.node_id)
        self.assertTrue(task_lib.is_exec_node_task(tasks[1]))
        self.assertEqual('my_transform', tasks[1].node_uid.node_id)
        self.assertTrue(os.path.exists(tasks[1].stateful_working_dir))
        self.assertTrue(os.path.exists(tasks[1].tmp_dir))
        self._task = tasks[1]
        self._output_artifact_uri = self._task.output_artifacts[
            'transform_graph'][0].uri
        self.assertTrue(os.path.exists(self._output_artifact_uri))
        self._task_queue.enqueue(self._task)

        # There should be 1 active execution in MLMD.
        with self._mlmd_connection as m:
            executions = m.store.get_executions()
        active_executions = [
            e for e in executions
            if e.last_known_state == metadata_store_pb2.Execution.RUNNING
        ]
        self.assertLen(active_executions, 1)

        # Active execution id.
        self._execution_id = active_executions[0].id

Esempio n. 13

0

Mostra file

File: pipeline_ops.py Progetto: jay90099/tfx

def _orchestrate_active_pipeline(
        mlmd_handle: metadata.Metadata, task_queue: tq.TaskQueue,
        service_job_manager: service_jobs.ServiceJobManager,
        pipeline_state: pstate.PipelineState) -> None:
    """Orchestrates active pipeline."""
    pipeline = pipeline_state.pipeline
    with pipeline_state:
        assert pipeline_state.is_active()
        if pipeline_state.get_pipeline_execution_state() != (
                metadata_store_pb2.Execution.RUNNING):
            pipeline_state.set_pipeline_execution_state(
                metadata_store_pb2.Execution.RUNNING)
        orchestration_options = pipeline_state.get_orchestration_options()
        logging.info('Orchestration options: %s', orchestration_options)
        deadline_secs = orchestration_options.deadline_secs
        if (pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC
                and deadline_secs > 0 and time.time() -
                pipeline_state.pipeline_creation_time_secs_since_epoch() >
                deadline_secs):
            logging.error(
                'Aborting pipeline due to exceeding deadline (%s secs); '
                'pipeline uid: %s', deadline_secs, pipeline_state.pipeline_uid)
            pipeline_state.initiate_stop(
                status_lib.Status(
                    code=status_lib.Code.DEADLINE_EXCEEDED,
                    message=('Pipeline aborted due to exceeding deadline '
                             f'({deadline_secs} secs)')))
            return

    def _filter_by_state(node_infos: List[_NodeInfo],
                         state_str: str) -> List[_NodeInfo]:
        return [n for n in node_infos if n.state.state == state_str]

    node_infos = _get_node_infos(pipeline_state)
    stopping_node_infos = _filter_by_state(node_infos,
                                           pstate.NodeState.STOPPING)

    # Tracks nodes stopped in the current iteration.
    stopped_node_infos: List[_NodeInfo] = []

    # Create cancellation tasks for nodes in state STOPPING.
    for node_info in stopping_node_infos:
        if service_job_manager.is_pure_service_node(
                pipeline_state, node_info.node.node_info.id):
            if service_job_manager.stop_node_services(
                    pipeline_state, node_info.node.node_info.id):
                stopped_node_infos.append(node_info)
        elif _maybe_enqueue_cancellation_task(mlmd_handle, pipeline,
                                              node_info.node, task_queue):
            pass
        elif service_job_manager.is_mixed_service_node(
                pipeline_state, node_info.node.node_info.id):
            if service_job_manager.stop_node_services(
                    pipeline_state, node_info.node.node_info.id):
                stopped_node_infos.append(node_info)
        else:
            stopped_node_infos.append(node_info)

    # Change the state of stopped nodes from STOPPING to STOPPED.
    if stopped_node_infos:
        with pipeline_state:
            for node_info in stopped_node_infos:
                node_uid = task_lib.NodeUid.from_pipeline_node(
                    pipeline, node_info.node)
                with pipeline_state.node_state_update_context(
                        node_uid) as node_state:
                    node_state.update(pstate.NodeState.STOPPED,
                                      node_state.status)

    # Initialize task generator for the pipeline.
    if pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC:
        generator = sync_pipeline_task_gen.SyncPipelineTaskGenerator(
            mlmd_handle,
            task_queue.contains_task_id,
            service_job_manager,
            fail_fast=orchestration_options.fail_fast)
    elif pipeline.execution_mode == pipeline_pb2.Pipeline.ASYNC:
        generator = async_pipeline_task_gen.AsyncPipelineTaskGenerator(
            mlmd_handle, task_queue.contains_task_id, service_job_manager)
    else:
        raise status_lib.StatusNotOkError(
            code=status_lib.Code.FAILED_PRECONDITION,
            message=(
                f'Only SYNC and ASYNC pipeline execution modes supported; '
                f'found pipeline with execution mode: {pipeline.execution_mode}'
            ))

    tasks = generator.generate(pipeline_state)

    with pipeline_state:
        # Handle all the UpdateNodeStateTasks by updating node states.
        for task in tasks:
            if task_lib.is_update_node_state_task(task):
                task = typing.cast(task_lib.UpdateNodeStateTask, task)
                with pipeline_state.node_state_update_context(
                        task.node_uid) as node_state:
                    node_state.update(task.state, task.status)

        tasks = [t for t in tasks if not task_lib.is_update_node_state_task(t)]

        # If there are still nodes in state STARTING, change them to STARTED.
        for node in pstate.get_all_pipeline_nodes(pipeline_state.pipeline):
            node_uid = task_lib.NodeUid.from_pipeline_node(
                pipeline_state.pipeline, node)
            with pipeline_state.node_state_update_context(
                    node_uid) as node_state:
                if node_state.state == pstate.NodeState.STARTING:
                    node_state.update(pstate.NodeState.STARTED)

        for task in tasks:
            if task_lib.is_exec_node_task(task):
                task = typing.cast(task_lib.ExecNodeTask, task)
                task_queue.enqueue(task)
            else:
                assert task_lib.is_finalize_pipeline_task(task)
                assert pipeline.execution_mode == pipeline_pb2.Pipeline.SYNC
                assert len(tasks) == 1
                task = typing.cast(task_lib.FinalizePipelineTask, task)
                if task.status.code == status_lib.Code.OK:
                    logging.info('Pipeline run successful; pipeline uid: %s',
                                 pipeline_state.pipeline_uid)
                else:
                    logging.info('Pipeline run failed; pipeline uid: %s',
                                 pipeline_state.pipeline_uid)
                pipeline_state.initiate_stop(task.status)