Python Dataset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: models.dataset

메소드/함수: Dataset

hotexamples.com에서의 예제들: 7

Python Dataset - 7개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 models.dataset.Dataset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def _initialize_dataloader(self, training_set):
     dataset = md.Dataset(smiles_list=training_set,
                          vocabulary=self.model.vocabulary,
                          tokenizer=mv.SMILESTokenizer())
     return tud.DataLoader(dataset,
                           batch_size=self.batch_size,
                           shuffle=True,
                           collate_fn=md.Dataset.collate_fn)

예제 #2

파일 보기

파일: train_model.py 프로젝트: stjordanis/reinvent-dnc

 def _initialize_dataloader(self, path):
     training_set = uc.read_smi_file(path)
     dataset = md.Dataset(smiles_list=training_set,
                          vocabulary=self._model.vocabulary,
                          tokenizer=mv.SMILESTokenizer())
     dataloader = torch.utils.data.DataLoader(
         dataset,
         batch_size=self._batch_size,
         shuffle=self._shuffle_each_epoch,
         collate_fn=md.Dataset.collate_fn)
     return dataloader

예제 #3

파일 보기

 def run(self, smiles_list):
     """
     Calculates the NLL for a set of SMILES strings.
     :param smiles_list: List with SMILES.
     :return: An iterator with each NLLs in the same order as the SMILES list.
     """
     dataset = md.Dataset(smiles_list, self.model.vocabulary, self.model.tokenizer)
     dataloader = tud.DataLoader(dataset, batch_size=self.batch_size, collate_fn=md.Dataset.collate_fn,
                                 shuffle=False)
     for batch in dataloader:
         for nll in self.model.likelihood(*batch).data.cpu().numpy():
             yield nll

예제 #4

파일 보기

파일: actions.py 프로젝트: michaelmaser/reinvent-scaffold-decorator

 def run(self, scaffold_list):
     """
     Samples the model for the given number of SMILES.
     :params scaffold_list: A list of scaffold SMILES.
     :return: An iterator with each of the batches sampled in (scaffold, decoration, nll) triplets.
     """
     dataset = md.Dataset(scaffold_list, self.model.vocabulary.scaffold_vocabulary,
                          self.model.vocabulary.scaffold_tokenizer)
     dataloader = tud.DataLoader(dataset, batch_size=self.batch_size,
                                 shuffle=False, collate_fn=md.Dataset.collate_fn)
     for batch in dataloader:
         for scaff, dec, nll in self.model.sample_decorations(*batch):
             yield scaff, dec, nll

예제 #5

파일 보기

 def initialize_dataloader(self, data_path, batch_size, vocab, data_type):
     # Read train or validation
     data = pd.read_csv(os.path.join(data_path, data_type + '.csv'),
                        sep=",")
     dataset = md.Dataset(data=data,
                          vocabulary=vocab,
                          tokenizer=mv.SMILESTokenizer(),
                          prediction_mode=False)
     dataloader = torch.utils.data.DataLoader(
         dataset,
         batch_size,
         shuffle=True,
         collate_fn=md.Dataset.collate_fn)
     return dataloader

예제 #6

파일 보기

 def _initialize_dataloader(self, path):
     training_set = chem_smiles.read_smiles_file(
         path,
         standardize=self._config.standardize,
         randomize=self._config.randomize)
     dataset = reinvent_dataset.Dataset(
         smiles_list=training_set,
         vocabulary=self._model.vocabulary,
         tokenizer=reinvent_vocabulary.SMILESTokenizer())
     dataloader = torch.utils.data.DataLoader(
         dataset,
         batch_size=self._config.batch_size,
         shuffle=self._config.shuffle_each_epoch,
         collate_fn=reinvent_dataset.Dataset.collate_fn)
     return dataloader

예제 #7

파일 보기

파일: generate.py 프로젝트: sailfish009/deep-molecular-optimization

    def initialize_dataloader(self, opt, vocab, test_file):
        """
        Initialize dataloader
        :param opt:
        :param vocab: vocabulary
        :param test_file: test_file_name
        :return:
        """

        # Read test
        data = pd.read_csv(os.path.join(opt.data_path, test_file + '.csv'), sep=",")
        dataset = md.Dataset(data=data, vocabulary=vocab, tokenizer=self.tokenizer, prediction_mode=True)
        dataloader = torch.utils.data.DataLoader(dataset, opt.batch_size,
                                                 shuffle=False, collate_fn=md.Dataset.collate_fn)
        return dataloader