Python Commandliner 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: yaetos.etl_utils

클래스/타입: Commandliner

hotexamples.com에서의 예제들: 5

Python Commandliner - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 yaetos.etl_utils.Commandliner에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Commandliner(4)

define_commandline_args(1)

자주 사용되는 메소드들

Commandliner (4)

define_commandline_args (1)

예제 #1

파일 보기

from pyspark.sql.functions import udf, array
from pyspark.sql.types import StringType, IntegerType
from pyspark.sql.functions import col


class Job(ETL_Base):
    def transform(self, some_events):

        udf_format_datetime = udf(self.format_datetime, StringType())

        events_cleaned = some_events \
            .withColumn('timestamp_obj', udf_format_datetime(some_events.timestamp).cast("timestamp")) \
            .where(col('timestamp').like("%2.016%") == False)
        return events_cleaned

    @staticmethod
    def format_datetime(wiki_dt):
        dt = {}
        dt['year'] = wiki_dt[:4]
        dt['month'] = wiki_dt[4:6]
        dt['day'] = wiki_dt[6:8]
        dt['hour'] = wiki_dt[8:10]
        dt['minute'] = wiki_dt[10:12]
        dt['sec'] = wiki_dt[12:14]
        return '{year}-{month}-{day} {hour}:{minute}:{sec}'.format(**dt)


if __name__ == "__main__":
    args = {'job_param_file': 'conf/jobs_metadata.yml'}
    Commandliner(Job, **args)

예제 #2

파일 보기

from yaetos.etl_utils import Commandliner

Commandliner(Job=None, launcher_file='jobs/generic/launcher.py')

예제 #3

파일 보기

from yaetos.etl_utils import Commandliner

Commandliner(Job=None)

예제 #4

파일 보기

파일: sql_job.py 프로젝트: arthurprevot/pyspark_aws_etl

class Job(ETL_Base):
    """To run/deploy sql jobs, using --sql_file arg."""
    def set_jargs(self, pre_jargs, loaded_inputs={}):
        # Function called only if running the job directly, i.e. "python yaetos/sql_job.py --sql_file=jobs/some_job.sql", ignored if running from "python jobs/generic/launcher.py --job_name=some_job.sql"
        sql_file = pre_jargs['cmd_args']['sql_file']
        job_name = Job_Yml_Parser.set_job_name_from_file(sql_file)
        pre_jargs['job_args']['job_name'] = job_name
        return Job_Args_Parser(defaults_args=pre_jargs['defaults_args'],
                               yml_args=None,
                               job_args=pre_jargs['job_args'],
                               cmd_args=pre_jargs['cmd_args'],
                               loaded_inputs=loaded_inputs)

    def transform(self, **ignored):
        sql = self.read_sql_file(self.jargs.sql_file)
        df = self.query(sql)
        if self.jargs.merged_args.get('repartition'):
            df = df.repartition(self.jargs.merged_args['repartition'])
        return df

    @staticmethod
    def read_sql_file(fname):
        fh = open(fname, 'r')
        sql = fh.read()
        fh.close()
        return sql


if __name__ == "__main__":
    Commandliner(Job)

예제 #5

파일 보기

파일: oracle_sql_job.py 프로젝트: arthurprevot/pyspark_aws_etl

 def define_commandline_args():
     parser = Commandliner.define_commandline_args()
     parser.add_argument("-q", "--sql_file", help="path of sql file to run")
     return parser