Python KerberosClient.upload 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: hdfs.ext.kerberos

클래스/타입: KerberosClient

메소드/함수: upload

hotexamples.com에서의 예제들: 5

Python KerberosClient.upload - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 hdfs.ext.kerberos.KerberosClient.upload에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

KerberosClient(30)

list(14)

write(7)

read(6)

download(5)

upload(5)

delete(4)

makedirs(3)

status(3)

_list_status(1)

content(1)

rename(1)

set_permission(1)

예제 #1

파일 보기

파일: change_file_hdfs_encoding.py 프로젝트: MinisterioPublicoRJ/scripts-bda

def execute_process(args):

    directory = args.directory
    linux_path = args.linuxPath
    file_name = args.fileName
    end_file_name = file_name.replace(".csv", "_done.csv")

    full_path = '{}{}/'.format(linux_path, directory)

    full_file_name_path = '{}{}'.format(full_path, end_file_name)
    with open('{}{}'.format(full_path, file_name), 'rb') as read:
        with open(full_file_name_path, 'wb') as file_write:
            reader = csv.reader(read,
                                delimiter=';',
                                quotechar='"',
                                quoting=csv.QUOTE_MINIMAL)
            for row in reader:
                new_row = [
                    data.replace("\n", " ").replace("\r", " ") for data in row
                ]
                wr = csv.writer(file_write, delimiter=';')
                wr.writerow(new_row)

    client = KerberosClient(args.webHdfs)
    client.upload(args.hdfsPath + directory,
                  full_file_name_path,
                  n_threads=5,
                  overwrite=True)

예제 #2

파일 보기

파일: didp_inceptor_plugin2.py 프로젝트: zenyud/Didp-master

    def run(self):

        # 前处理
        tc = BeforeHandler(self.__args, self.__col_info, self.__db_info,
                           self.__props)
        ret = tc.run()
        if ret != 0:
            LOG.error("加载前处理失败")
            return ret

        # 加载处理

        # 上传文件到指定hdfs目录
        HDFS_WORK_DIR = "{0}/{1}".format(self.__args.loaddir,
                                         self.__args.table)
        #put_cmd = "KRB5_CONFIG={0}" \
        #          " && kinit -kt {1} {2}" \
        #          " && hadoop fs -rm -r -f {3}" \
        #          " && hadoop fs -mkdir -p {3}" \
        #          " && hadoop fs -put {4} {5}"\
        #    .format(self.__args.krbfile, self.__args.ktfile, self.__args.ktuser, HDFS_WORK_DIR, self.__args.srcfile, HDFS_WORK_DIR)

        #LOG.info("HDFS PUT CMD[{0}]".format(put_cmd))
        #ret = os.system(put_cmd)
        #if ret != 0:
        #    LOG.error("上传文件到hdfs失败")
        #    return -1

        print "AAA:{0}".format(HDFS_WORK_DIR)
        try:
            # 建立连接
            hdfs_client = KerberosClient(self.__args.nnurl,
                                         principal="{0}".format(
                                             self.__args.ktuser))

            # 删除历史目录
            hdfs_client.delete(HDFS_WORK_DIR, recursive=True)

            # 创建新的目录
            hdfs_client.makedirs(HDFS_WORK_DIR)

            # 上传文件到HDFS
            hdfs_client.upload(HDFS_WORK_DIR, self.__args.srcfile)
        except:
            traceback.print_exc()
            LOG.error("数据加载失败")
            return -1

        LOG.info("数据加载成功")

        # 后处理
        tc = AfterHandler(self.__args, self.__db_info, self.__props)
        ret = tc.run()
        if ret != 0:
            LOG.error("加载后处理失败")
            return ret
        return 0

예제 #3

파일 보기

    def __write_to_hdfs(hdfs_url, path_hdfs, file_name, logger):
        """
        - Compress local file with ZLIB
        - Put compressed file on HDFS
        - Remove local files
        :param path_hdfs str: 
        :param file_name str: 
        """
        logger.debug('Start process __write_to_hdfs for file: %s' % file_name)
        # Compress file
        file_name_zlib = '%s.gz' % file_name
        with open(file_name, 'rb') as f_in:
            with open(file_name_zlib, 'wb') as f_out:
                f_out.write(zlib.compress(f_in.read()))

        # Write file to HDFS
        try:
            hdfs_client = KerberosClient(hdfs_url)
        except hdfs.util.HdfsError as e:
            logger.error('Error during HDFS connection, wait...: %s' % e)
            time.sleep(10)
            WriteHdfs.__write_to_hdfs(hdfs_url, path_hdfs, file_name, logger)
            return

        file_name_hdfs = file_name_zlib.replace('.tmp', '')
        file_path_hdfs = '%s/%s' % (path_hdfs, file_name_hdfs)
        try:
            hdfs_client.upload(file_path_hdfs, file_name_zlib)
        except hdfs.util.HdfsError as e:
            logger.error('Error during HDFS write, wait...: %s' % e)
            time.sleep(10)
            WriteHdfs.__write_to_hdfs(hdfs_url, path_hdfs, file_name, logger)
            return

        # Remove tmp files
        os.remove(file_name)
        os.remove(file_name_zlib)
        logger.debug('End process __write_to_hdfs for file: %s' % file_name)

예제 #4

파일 보기

파일: test_pyhive.py 프로젝트: windorchidwarm/py_test_project

                principal=config['kerberos_principal'],
                keytab_file=config['keytab_file'],
                ccache_file=config['kerberos_cache_file']):
    # hive.Connection()
    con = hive.connect(host='uatnd02.csdntest.com.local',
                       port=10000,
                       auth='KERBEROS',
                       kerberos_service_name="hive"
                       )  # host为hiveserver2所在节点，port默认10000，为hs2的端口
    cursor = con.cursor()
    cursor.execute('select * from dl_nccp.account limit 5')  # 不能有分号！
    # cursor.execute('desc dl_nccp.account') #不能有分号！
    datas = cursor.fetchall()
    print(datas)
    cursor.close()
    con.close()

    conn = dbapi.connect(host='uatnd02.csdntest.com.local',
                         port=10000,
                         auth_mechanism='GSSAPI',
                         kerberos_service_name="hive")
    cursor = conn.cursor()

    # hdfs kerberos
    client = KerberosClient('http://hdfs_ip:50070', hostname_override="hdfs域名")
    client._list_status()
    client.list()
    client.delete()
    client.upload()
    client.download()
    client.makedirs('test')

예제 #5

파일 보기

파일: handle_HDFS.py 프로젝트: yuqi1129/learngit

class OperateHDFS:
    def __init__(self, url):
        '''

        :param url:HDFS名称节点的主机名或IP地址,以协议为前缀,其次是namenode上的WebHDFS端口,也可以指定多个URL以分号分隔以获取高可用性支持.
        '''
        # 实例化HDFS web client using Kerberos authentication
        self.client = KerberosClient(url)

    def file_list(self, file_path):
        '''

        :param file_path: HDFS远程目录路径
        :return: 返回一个远程目录中包含的所有文件
        '''
        file_detail = self.client.list(hdfs_path=file_path)
        return file_detail

    def file_read(self, file_path):
        '''
        从HDFS中读取文件
        :param file_path: HDFS远程文件路径
        :return:
        '''
        lines = []
        with self.client.read(hdfs_path=file_path,
                              encoding='utf-8',
                              delimiter=r'\n') as reader:
            # content = file.read()
            # print(content)
            for item in reader:
                lines.append(item.strip())
        return lines

    def file_create_write(self, file_path, data_write):
        '''
        在HDFS中创建新文件并写入内容
        :param file_path: HDFS远程文件路径
        :param data_write: 写入到文件的数据
        :return:
        '''
        self.client.write(hdfs_path=file_path,
                          data=data_write,
                          encoding='utf-8')

    def file_append_write(self, file_path, data_append):
        '''
        在HDFS中已存在的文件中追加写入内容，文件必须已存在
        :param file_path: HDFS远程文件路径
        :param data_append: 追加到文件的数据
        :return:
        '''
        self.client.write(hdfs_path=file_path,
                          data=data_append,
                          encoding='utf-8',
                          append=True)

    def file_rename(self, src_file_path, dst_file_path):
        '''
        重命名/移动文件或文件夹
        :param src_file_path: 源文件路径
        :param dst_file_path: 目的文件路径
        :return:
        '''
        self.client.rename(hdfs_src_path=src_file_path,
                           hdfs_dst_path=dst_file_path)

    def mkdir(self, file_path):
        '''
        在HDFS中创建远程目录，必要时递归创建
        :param file_path: 需要新建的文件夹路径(包含名字)
        :return:
        '''
        self.client.makedirs(hdfs_path=file_path)

    def upload_files(self, file_path, local_path):
        '''
        上传文件或目录到HDFS
        :param file_path:HDFS目标路径。如果它已经存在并且是一个目录，文件将被上传其中。
        :param local_path:文件或文件夹的本地路径。 如果是文件夹，则将上传其中的所有文件（请注意，这意味着没有文件的文件夹将不会远程创建）
        :return:hdfs_path_return:成功后，此方法将返回远程上传路径。
        '''
        hdfs_path_return = self.client.upload(hdfs_path=file_path,
                                              local_path=local_path)
        return hdfs_path_return

    def download_files(self, file_path, local_path):
        '''
        从HDFS下载一个文件或文件夹并将其保存在本地
        :param file_path:HDFS上要下载的文件或文件夹的路径。 如果是文件夹，则将下载该文件夹下的所有文件
        :param local_path:本地路径。 如果它已经存在并且是目录，则文件将在其中下载。
        :return: local_path_return:成功后，此方法将返回本地下载路径
        '''
        local_path_return = self.client.download(hdfs_path=file_path,
                                                 local_path=local_path)
        return local_path_return

    def delete_files(self, file_path):
        '''
        从HDFS中删除文件或目录
        :param file_path: HDFS中需要删除的文件或目录的路径
        :return:如果删除成功，则此函数返回“ True”，如果先前在“ hdfs_path”处不存在文件或目录，则返回“ False”。
        '''
        # recursive：递归删除文件和目录。 默认情况下，如果尝试删除非空目录，则此方法将引发HdfsError。
        # skip_trash：设置为false时，已删除的路径将被移至相应的垃圾文件夹，而不是被删除。 这需要Hadoop 2.9+且在集群上启用trash
        return self.client.delete(hdfs_path=file_path,
                                  recursive=False,
                                  skip_trash=True)

    def set_files_permission(self, file_path):
        '''
        更改文件的权限
        :param file_path: 需要更改权限的文件路径
        :return:
        '''
        # permission：文件的新八进制权限字符串
        self.client.set_permission(hdfs_path=file_path, permission=None)