Python KerberosClient.delete 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: hdfs.ext.kerberos

클래스/타입: KerberosClient

메소드/함수: delete

hotexamples.com에서의 예제들: 4

Python KerberosClient.delete - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 hdfs.ext.kerberos.KerberosClient.delete에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

KerberosClient(30)

list(14)

write(7)

read(6)

download(5)

upload(5)

delete(4)

makedirs(3)

status(3)

_list_status(1)

content(1)

rename(1)

set_permission(1)

예제 #1

파일 보기

파일: didp_inceptor_plugin2.py 프로젝트: zenyud/Didp-master

    def run(self):

        # 前处理
        tc = BeforeHandler(self.__args, self.__col_info, self.__db_info,
                           self.__props)
        ret = tc.run()
        if ret != 0:
            LOG.error("加载前处理失败")
            return ret

        # 加载处理

        # 上传文件到指定hdfs目录
        HDFS_WORK_DIR = "{0}/{1}".format(self.__args.loaddir,
                                         self.__args.table)
        #put_cmd = "KRB5_CONFIG={0}" \
        #          " && kinit -kt {1} {2}" \
        #          " && hadoop fs -rm -r -f {3}" \
        #          " && hadoop fs -mkdir -p {3}" \
        #          " && hadoop fs -put {4} {5}"\
        #    .format(self.__args.krbfile, self.__args.ktfile, self.__args.ktuser, HDFS_WORK_DIR, self.__args.srcfile, HDFS_WORK_DIR)

        #LOG.info("HDFS PUT CMD[{0}]".format(put_cmd))
        #ret = os.system(put_cmd)
        #if ret != 0:
        #    LOG.error("上传文件到hdfs失败")
        #    return -1

        print "AAA:{0}".format(HDFS_WORK_DIR)
        try:
            # 建立连接
            hdfs_client = KerberosClient(self.__args.nnurl,
                                         principal="{0}".format(
                                             self.__args.ktuser))

            # 删除历史目录
            hdfs_client.delete(HDFS_WORK_DIR, recursive=True)

            # 创建新的目录
            hdfs_client.makedirs(HDFS_WORK_DIR)

            # 上传文件到HDFS
            hdfs_client.upload(HDFS_WORK_DIR, self.__args.srcfile)
        except:
            traceback.print_exc()
            LOG.error("数据加载失败")
            return -1

        LOG.info("数据加载成功")

        # 后处理
        tc = AfterHandler(self.__args, self.__db_info, self.__props)
        ret = tc.run()
        if ret != 0:
            LOG.error("加载后处理失败")
            return ret
        return 0

예제 #2

파일 보기

파일: test_pyhive.py 프로젝트: windorchidwarm/py_test_project

                principal=config['kerberos_principal'],
                keytab_file=config['keytab_file'],
                ccache_file=config['kerberos_cache_file']):
    # hive.Connection()
    con = hive.connect(host='uatnd02.csdntest.com.local',
                       port=10000,
                       auth='KERBEROS',
                       kerberos_service_name="hive"
                       )  # host为hiveserver2所在节点，port默认10000，为hs2的端口
    cursor = con.cursor()
    cursor.execute('select * from dl_nccp.account limit 5')  # 不能有分号！
    # cursor.execute('desc dl_nccp.account') #不能有分号！
    datas = cursor.fetchall()
    print(datas)
    cursor.close()
    con.close()

    conn = dbapi.connect(host='uatnd02.csdntest.com.local',
                         port=10000,
                         auth_mechanism='GSSAPI',
                         kerberos_service_name="hive")
    cursor = conn.cursor()

    # hdfs kerberos
    client = KerberosClient('http://hdfs_ip:50070', hostname_override="hdfs域名")
    client._list_status()
    client.list()
    client.delete()
    client.upload()
    client.download()
    client.makedirs('test')

예제 #3

파일 보기

    counter = 0

    for file_path in file_list_arr:

        file_path = source_directory + file_path

        status = client.status(file_path, strict=False)

        if bool(status):
            file_name = os.path.basename(file_path)
            key_name = s3_folder_name + file_name

            with client.read(file_path) as f:
                s3.upload_fileobj(f, bucket_name, key_name)

            client.delete(file_path, recursive=False, skip_trash=True)
            counter = counter + 1
            py_logger.info("File: " + file_path + " moved to s3 bucket")
        
    py_logger.info("S3 script execution completed. No.of Files moved: " + str(counter))

	#Compresses the log files which are greater than 30 days
    today = date.today()
    current_day = datetime.now().strftime('%d')
    log_directory = log_file_path.rpartition('/')[0] + log_file_path.rpartition('/')[1]
    tarFileName = log_directory + today.strftime("%d-%m-%Y") + '.tar.gz'
	
    if current_day == "30":
        # writing files to a compressed file
        with tarfile.open(tarFileName, "w:gz") as tar:
            # writing each file one by one

예제 #4

파일 보기

파일: handle_HDFS.py 프로젝트: yuqi1129/learngit

class OperateHDFS:
    def __init__(self, url):
        '''

        :param url:HDFS名称节点的主机名或IP地址,以协议为前缀,其次是namenode上的WebHDFS端口,也可以指定多个URL以分号分隔以获取高可用性支持.
        '''
        # 实例化HDFS web client using Kerberos authentication
        self.client = KerberosClient(url)

    def file_list(self, file_path):
        '''

        :param file_path: HDFS远程目录路径
        :return: 返回一个远程目录中包含的所有文件
        '''
        file_detail = self.client.list(hdfs_path=file_path)
        return file_detail

    def file_read(self, file_path):
        '''
        从HDFS中读取文件
        :param file_path: HDFS远程文件路径
        :return:
        '''
        lines = []
        with self.client.read(hdfs_path=file_path,
                              encoding='utf-8',
                              delimiter=r'\n') as reader:
            # content = file.read()
            # print(content)
            for item in reader:
                lines.append(item.strip())
        return lines

    def file_create_write(self, file_path, data_write):
        '''
        在HDFS中创建新文件并写入内容
        :param file_path: HDFS远程文件路径
        :param data_write: 写入到文件的数据
        :return:
        '''
        self.client.write(hdfs_path=file_path,
                          data=data_write,
                          encoding='utf-8')

    def file_append_write(self, file_path, data_append):
        '''
        在HDFS中已存在的文件中追加写入内容，文件必须已存在
        :param file_path: HDFS远程文件路径
        :param data_append: 追加到文件的数据
        :return:
        '''
        self.client.write(hdfs_path=file_path,
                          data=data_append,
                          encoding='utf-8',
                          append=True)

    def file_rename(self, src_file_path, dst_file_path):
        '''
        重命名/移动文件或文件夹
        :param src_file_path: 源文件路径
        :param dst_file_path: 目的文件路径
        :return:
        '''
        self.client.rename(hdfs_src_path=src_file_path,
                           hdfs_dst_path=dst_file_path)

    def mkdir(self, file_path):
        '''
        在HDFS中创建远程目录，必要时递归创建
        :param file_path: 需要新建的文件夹路径(包含名字)
        :return:
        '''
        self.client.makedirs(hdfs_path=file_path)

    def upload_files(self, file_path, local_path):
        '''
        上传文件或目录到HDFS
        :param file_path:HDFS目标路径。如果它已经存在并且是一个目录，文件将被上传其中。
        :param local_path:文件或文件夹的本地路径。 如果是文件夹，则将上传其中的所有文件（请注意，这意味着没有文件的文件夹将不会远程创建）
        :return:hdfs_path_return:成功后，此方法将返回远程上传路径。
        '''
        hdfs_path_return = self.client.upload(hdfs_path=file_path,
                                              local_path=local_path)
        return hdfs_path_return

    def download_files(self, file_path, local_path):
        '''
        从HDFS下载一个文件或文件夹并将其保存在本地
        :param file_path:HDFS上要下载的文件或文件夹的路径。 如果是文件夹，则将下载该文件夹下的所有文件
        :param local_path:本地路径。 如果它已经存在并且是目录，则文件将在其中下载。
        :return: local_path_return:成功后，此方法将返回本地下载路径
        '''
        local_path_return = self.client.download(hdfs_path=file_path,
                                                 local_path=local_path)
        return local_path_return

    def delete_files(self, file_path):
        '''
        从HDFS中删除文件或目录
        :param file_path: HDFS中需要删除的文件或目录的路径
        :return:如果删除成功，则此函数返回“ True”，如果先前在“ hdfs_path”处不存在文件或目录，则返回“ False”。
        '''
        # recursive：递归删除文件和目录。 默认情况下，如果尝试删除非空目录，则此方法将引发HdfsError。
        # skip_trash：设置为false时，已删除的路径将被移至相应的垃圾文件夹，而不是被删除。 这需要Hadoop 2.9+且在集群上启用trash
        return self.client.delete(hdfs_path=file_path,
                                  recursive=False,
                                  skip_trash=True)

    def set_files_permission(self, file_path):
        '''
        更改文件的权限
        :param file_path: 需要更改权限的文件路径
        :return:
        '''
        # permission：文件的新八进制权限字符串
        self.client.set_permission(hdfs_path=file_path, permission=None)