Python PathManager.ls 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: parlai.utils.io

클래스/타입: PathManager

메소드/함수: ls

hotexamples.com에서의 예제들: 3

Python PathManager.ls - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 parlai.utils.io.PathManager.ls에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

open(30)

exists(30)

mkdirs(18)

rm(12)

get_local_path(7)

ls(3)

copy(2)

makedirs(1)

예제 #1

파일 보기

    def load_data(self, datapath):
        folder, fold = os.path.split(datapath)
        with PathManager.open(os.path.join(folder, "tasks.txt")) as taskf:
            tasks_table = pd.read_json(taskf, lines=True)

        dfolder = os.path.join(folder, "dialogues")

        data = []

        for filename in PathManager.ls(dfolder):
            domain = filename.replace(".txt", "")
            if (self.opt["metalwoz_domains"]
                    and domain not in self.opt["metalwoz_domains"]):
                continue
            fullfn = os.path.join(dfolder, filename)
            with PathManager.open(fullfn) as dataf:
                lines = pd.read_json(dataf, lines=True)
                lines = lines.merge(tasks_table, on="task_id")
                data.append(lines.to_dict("records"))

        # Quick check to make sure we didn't fat-finger the spelling of some domain
        if self.opt["metalwoz_domains"]:
            assert len(data) == len(self.opt["metalwoz_domains"])

        if "test" in self.fold:
            flat = []
            for domain in data:
                flat.extend(domain)
            return flat

        return DatatypeHelper.split_subset_data_by_fold(
            self.fold, data, 0.8, 0.1, 0.1)

예제 #2

파일 보기

파일: agents.py 프로젝트: khanhgithead/ParlAI

 def load_chunks(self, fold):
     if fold == "valid":
         fold = "dev"  # change name to match file structure
     for path in PathManager.ls(os.path.join(self.dpath, fold)):
         with PathManager.open(os.path.join(self.dpath, fold, path)) as f:
             blob = json.load(f)
             for convo in blob:
                 yield convo

예제 #3

파일 보기

파일: agents.py 프로젝트: simplecoka/cortx

    def setup_data(self, datapath):
        folder, fold = os.path.split(datapath)
        with PathManager.open(os.path.join(folder, 'tasks.txt')) as taskf:
            tasks_table = pd.read_json(taskf, lines=True)

        dfolder = os.path.join(folder, 'dialogues')

        data = []

        for filename in PathManager.ls(dfolder):
            fullfn = os.path.join(dfolder, filename)
            with PathManager.open(fullfn) as dataf:
                data.append(pd.read_json(dataf, lines=True))

        data = pd.concat(data, axis=0)
        data = data.sample(frac=1.0,
                           random_state=83741)  # metal in l33t numbers, lol
        data = data.merge(tasks_table, on='task_id')
        data['fold'] = data['domain_x'].apply(self._hash)

        for _, row in data.iterrows():
            if fold == 'valid' and row['fold'] != 9:
                continue
            if fold == 'train' and row['fold'] == 9:
                continue
            texts = [row['bot_role']] + list(row['turns'])
            prompts, labels = texts[::2], texts[1::2]
            for i, (prompt, label) in enumerate(zip(prompts, labels)):
                yield {
                    'text': prompt,
                    'label': label,
                    'bot_role': row['bot_role'],
                    'bot_prompt': row['bot_prompt'],
                    'user_role': row['user_role'],
                    'user_prompt': row['user_prompt'],
                    'utterance_id': row['id'],
                    'domain': row['domain_x'],
                    'task_id': row['task_id'],
                }, i == 0