Python get_serializer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dpark.shuffle

메소드/함수: get_serializer

hotexamples.com에서의 예제들: 5

Python get_serializer - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dpark.shuffle.get_serializer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

    def _pre_commit(self, aggregator):
        for i in range(self.num_reduce):
            out_path = self.paths[i]
            if out_path:
                tmp = self._mk_tmp(out_path)

                in_path = [
                    self._mk_tmp(out_path, i) for i in range(self.num_dump + 1)
                ]
                in_path = [p for p in in_path if os.path.exists(p)]
                if len(in_path) == 1:
                    os.rename(in_path[0], tmp)
                else:
                    inputs = [
                        get_serializer(self.rddconf).load_stream(open(p))
                        for p in in_path
                    ]
                    rddconf = self.rddconf.dup(op=dpark.conf.OP_GROUPBY)
                    merger = Merger.get(rddconf,
                                        aggregator=aggregator,
                                        call_site=self.__class__.__name__)
                    merger.merge(inputs)
                    with open(tmp, 'w') as f:
                        get_serializer(self.rddconf).dump_stream(merger, f)
            else:
                self._dump_empty_bucket(i)

예제 #2

파일 보기

파일: task.py 프로젝트: douban/dpark

 def _pre_commit(self, aggregator):
     for i in range(self.num_reduce):
         tmp_paths = self.tmp_paths[i]
         if tmp_paths:
             if len(tmp_paths) == 1:
                 self.paths[i].export(tmp_paths[0])
             else:
                 inputs = [get_serializer(self.rddconf).load_stream(open(p))
                           for p in tmp_paths]
                 rddconf = self.rddconf.dup(op=dpark.conf.OP_GROUPBY)
                 merger = Merger.get(rddconf, aggregator=aggregator, api_callsite=self.__class__.__name__)
                 merger.merge(inputs)
                 final_tmp = self._get_tmp(i, True, 0)
                 with open(final_tmp, 'wb') as f:
                     get_serializer(self.rddconf).dump_stream(merger, f)
         else:
             self._dump_empty_bucket(i)

예제 #3

파일 보기

 def _pre_commit(self, aggregator):
     for i in range(self.num_reduce):
         tmp_paths = self.tmp_paths[i]
         if tmp_paths:
             if len(tmp_paths) == 1:
                 self.paths[i].export(tmp_paths[0])
             else:
                 inputs = [
                     get_serializer(self.rddconf).load_stream(open(p))
                     for p in tmp_paths
                 ]
                 rddconf = self.rddconf.dup(op=dpark.conf.OP_GROUPBY)
                 merger = Merger.get(rddconf,
                                     aggregator=aggregator,
                                     api_callsite=self.__class__.__name__)
                 merger.merge(inputs)
                 final_tmp = self._get_tmp(i, True, 0)
                 with open(final_tmp, 'wb') as f:
                     get_serializer(self.rddconf).dump_stream(merger, f)
         else:
             self._dump_empty_bucket(i)

예제 #4

파일 보기

 def _dump_bucket(self, items, path):
     serializer = get_serializer(self.rddconf)
     with open(path, 'wb') as f:
         serializer.dump_stream(sorted(items), f)
         size = f.tell()
     return size

예제 #5

파일 보기

파일: task.py 프로젝트: douban/dpark

 def _dump_bucket(self, items, path):
     serializer = get_serializer(self.rddconf)
     with open(path, 'wb') as f:
         serializer.dump_stream(sorted(items), f)
         size = f.tell()
     return size