Python HiveStep 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: boto.emr.step

클래스/타입: HiveStep

hotexamples.com에서의 예제들: 4

Python HiveStep - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 boto.emr.step.HiveStep에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

HiveStep(3)

action_on_failure(1)

자주 사용되는 메소드들

HiveStep (3)

action_on_failure (1)

예제 #1

파일 보기

파일: clusters.py 프로젝트: nagyistge/pyDataCanvas

 def emr_execute_hive(self, job_name, s3_hive_script):
     hive_step = HiveStep(name=job_name, hive_file=s3_hive_script)
     hive_step.action_on_failure = 'CONTINUE'
     ret_steps = self.emr_conn.add_jobflow_steps(self.jobflow_id,
                                                 steps=[hive_step])
     step_ids = [s.value for s in ret_steps.stepids]
     return step_ids

예제 #2

파일 보기

파일: emr.py 프로젝트: JonathanBatten/apiarist

    def run(self):
        """Run the Hive job on EMR cluster
        """
        #  copy the data source to a new object
        #  (Hive deletes/moves the original)
        copy_s3_file(self.input_path, self.data_path)

        # and create the hive script
        self._generate_and_upload_hive_script()

        logger.info("Waiting {} seconds for S3 eventual consistency".format(
            self.s3_sync_wait_time))
        time.sleep(self.s3_sync_wait_time)

        # TODO more options like setting aws region
        conn = EmrConnection(self.aws_access_key_id,
                             self.aws_secret_access_key)

        setup_step = InstallHiveStep(self.hive_version)
        run_step = HiveStep(self.job_name, self.script_path)

        cluster_id = conn.run_jobflow(
            self.job_name,
            self.log_path,
            action_on_failure='CANCEL_AND_WAIT',
            master_instance_type=self.master_instance_type,
            slave_instance_type=self.slave_instance_type,
            ami_version=self.ami_version,
            num_instances=self.num_instances,
            job_flow_role=self.iam_instance_profile,
            service_role=self.iam_service_role)

        conn.add_jobflow_steps(cluster_id, [setup_step, run_step])

        logger.info("Job started on cluster {0}".format(cluster_id))

        self._wait_for_job_to_complete(conn, cluster_id)

        logger.info("Output file is in: {0}".format(self.output_path))

예제 #3

파일 보기

파일: specparser.py 프로젝트: zhangbb757/example-modules

 def emr_execute_hive(self, s3_hive_script):
     from boto.emr.step import HiveStep
     hive_step = HiveStep(name=self.get_emr_job_name(), hive_file=s3_hive_script)
     self.emr_conn.add_jobflow_steps(self.job_flow_id, steps=[hive_step])
     emr_wait_job(self.emr_conn, self.job_flow_id)

예제 #4

파일 보기

파일: clusters.py 프로젝트: dkuner/pyDataCanvas

 def emr_execute_hive(self, job_name, s3_hive_script):
     hive_step = HiveStep(name=job_name, hive_file=s3_hive_script)
     hive_step.action_on_failure = 'CONTINUE'
     ret_steps = self.emr_conn.add_jobflow_steps(self.jobflow_id, steps=[hive_step])
     step_ids = [s.value for s in ret_steps.stepids]
     return step_ids