Python PreProcess.prepare_dataset示例

编程语言: Python

命名空间/包名称: pre_process

类/类型: PreProcess

方法/功能: prepare_dataset

hotexamples.com的示例: 3

Python PreProcess.prepare_dataset - 已找到3个示例。这些是从开源项目中提取的最受好评的pre_process.PreProcess.prepare_dataset现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

PreProcess(20)

process(5)

run(4)

prepare_dataset(3)

generate_data(1)

pre_process(1)

verifications(1)

示例#1

显示文件

 def prepare_dataset(self):
     dat_obj = PreProcess()
     dat_obj.prepare_dataset()
     test_df = dat_obj.test_df2
     test_dataset = SentimentDataset(test_df, max_length=100, mode='test')
     self.test_loader = DataLoader(test_dataset,
                                   batch_size=1,
                                   num_workers=0,
                                   shuffle=True)

示例#2

显示文件

文件： train.py 项目： VishnuGopireddy/bert_classification_api

 def prepare_dataset(self):
     dat_obj = PreProcess()
     dat_obj.prepare_dataset()
     train_df = dat_obj.train_df
     val_df = dat_obj.val_df
     test_df = dat_obj.test_df1
     train_dataset = SentimentDataset(train_df, max_length=100)
     val_dataset = SentimentDataset(val_df, max_length=100)
     test_dataset = SentimentDataset(test_df, max_length=100, mode='test')
     self.train_loader = DataLoader(train_dataset, batch_size=32, num_workers=0, shuffle=True)
     self.val_loader = DataLoader(val_dataset, batch_size=32, num_workers=0, shuffle=True)
     self.test_loader = DataLoader(test_dataset, batch_size=32, num_workers=0, shuffle=True)

示例#3

显示文件

文件： dataloader.py 项目： VishnuGopireddy/bert_classification_api

    def __getitem__(self, index):
        row = self.df.iloc[index]
        text, label = row['pre_process'], row[0]
        if label != 0:
            label = 1
        out_dict = self.tokenizer.encode_plus(text=text,
                                              padding='max_length',
                                              max_length=200,
                                              return_tensors='pt')
        # print(out_dict)
        if self.mode != 'test':
            return [(out_dict['input_ids'][:, :self.max_length], out_dict['attention_mask'][:, :self.max_length]), label]
        else:
            return [text, (out_dict['input_ids'][:, :self.max_length], out_dict['attention_mask'][:, :self.max_length]), label]

    def __len__(self):
        # return int(self.df.shape[0])
        return 2000

if __name__ == '__main__':
    from pre_process import PreProcess
    dat_obj = PreProcess()
    dat_obj.prepare_dataset()
    train_df = dat_obj.train_df
    dataset = SentimentDataset(train_df, 200)
    train_loader = DataLoader(dataset, batch_size=5,num_workers=8)

    for i, j in enumerate(train_loader,0):
        print(i)
        print(j[0][0])