Python GeneExpressionDataset.populate_from_datasets示例

编程语言: Python

命名空间/包名称: scvi.dataset.dataset

方法/功能: populate_from_datasets

hotexamples.com的示例: 2

Python GeneExpressionDataset.populate_from_datasets - 已找到2个示例。这些是从开源项目中提取的最受好评的scvi.dataset.dataset.GeneExpressionDataset.populate_from_datasets现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

get_attributes_from_matrix(13)

concat_datasets(10)

GeneExpressionDataset(7)

populate_from_datasets(2)

populate_from_per_batch_list(1)

示例#1

显示文件

文件： mouse_develop.py 项目： brianhie/trajectorama

def correct_scvi(Xs, genes):
    import torch
    torch.manual_seed(0)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

    from scvi.dataset import AnnDatasetFromAnnData
    from scvi.dataset.dataset import GeneExpressionDataset
    from scvi.inference import UnsupervisedTrainer
    from scvi.models import VAE

    all_ann = [AnnDatasetFromAnnData(AnnData(X, var=genes)) for X in Xs]

    all_dataset = GeneExpressionDataset()
    all_dataset.populate_from_datasets(all_ann)

    vae = VAE(all_dataset.nb_genes,
              n_batch=all_dataset.n_batches,
              n_labels=all_dataset.n_labels,
              n_hidden=128,
              n_latent=30,
              n_layers=2,
              dispersion='gene')
    trainer = UnsupervisedTrainer(
        vae,
        all_dataset,
        train_size=1.,
        use_cuda=True,
    )
    n_epochs = 100
    #trainer.train(n_epochs=n_epochs)
    #torch.save(trainer.model.state_dict(),
    #           'data/harmonization.vae.pkl')
    trainer.model.load_state_dict(torch.load('data/harmonization.vae.pkl'))
    trainer.model.eval()

    full = trainer.create_posterior(trainer.model,
                                    all_dataset,
                                    indices=np.arange(len(all_dataset)))
    latent, batch_indices, labels = full.sequential().get_latent()

    return latent

示例#2

显示文件

                from umap import UMAP
                import scanpy as sc

                # TODO: import the datasets into SCVI objects (sigh!)
                # scVI wants raw counts, but who knows about those TabulaMurisSenis data
                # quick and dirty solution for now
                asubr_scvi = asubr.copy()
                asubr_scvi.X.data = asubr_scvi.X.data.astype(np.int64)
                ds_atlas = AnnDatasetFromAnnData(asubr_scvi)

                asub2_scvi = asub2.copy()
                asub2_scvi.X.data = asub2_scvi.X.data.astype(np.int64)
                ds_new = AnnDatasetFromAnnData(asub2_scvi)

                all_dataset = GeneExpressionDataset()
                all_dataset.populate_from_datasets([ds_atlas, ds_new])

                ##############################################################
                t0 = time.time()
                print('Prepare some data structures')
                vae = VAE(
                    all_dataset.nb_genes,
                    n_batch=all_dataset.n_batches,
                    n_labels=all_dataset.n_labels,
                    n_hidden=128,
                    n_latent=30,
                    n_layers=2,
                    dispersion='gene',
                )

                print('Prepare the trainer')