Python GeneExpressionDataset.populate_from_per_batch_list示例

编程语言: Python

命名空间/包名称: scvi.dataset

方法/功能: populate_from_per_batch_list

hotexamples.com的示例: 6

Python GeneExpressionDataset.populate_from_per_batch_list - 已找到6个示例。这些是从开源项目中提取的最受好评的scvi.dataset.GeneExpressionDataset.populate_from_per_batch_list现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

GeneExpressionDataset(30)

get_attributes_from_matrix(13)

populate_from_data(10)

populate_from_datasets(7)

populate_from_per_batch_list(6)

subsample_genes(5)

collate_fn_builder(4)

concat_datasets(4)

remap_categorical_attributes(2)

batch_indices(2)

to_anndata(2)

map_cell_types(1)

populate_from_per_label_list(1)

reorder_genes(1)

subsample_cells(1)

name(1)

n_batches(1)

merge_cell_types(1)

initialize_cell_measurement(1)

labels(1)

initialize_mapped_attribute(1)

__init__(1)

highly_variable_genes(1)

get_batch_mask_cell_measurement(1)

genes_to_index(1)

gene_symbols(1)

gene_names(1)

filter_genes_by_count(1)

filter_genes_by_attribute(1)

filter_cells_by_count(1)

filter_cell_types(1)

compute_library_size_batch(1)

_highly_variable_genes(1)

update_cells(1)

示例#1

显示文件

文件： test_scvi.py 项目： tkisss/scVI

def test_multibatches_features():
    data = [
        np.random.randint(1, 5, size=(20, 10)),
        np.random.randint(1, 10, size=(20, 10)),
        np.random.randint(1, 10, size=(20, 10)),
        np.random.randint(1, 10, size=(30, 10)),
    ]
    dataset = GeneExpressionDataset()
    dataset.populate_from_per_batch_list(data)
    vae = VAE(dataset.nb_genes, dataset.n_batches)
    trainer = UnsupervisedTrainer(vae, dataset, train_size=0.5, use_cuda=use_cuda)
    trainer.train(n_epochs=2)
    trainer.test_set.imputation(n_samples=2, transform_batch=0)
    trainer.train_set.imputation(n_samples=2, transform_batch=[0, 1, 2])

示例#2

显示文件

 def test_populate_from_per_batch_list(self):
     data = [
         np.random.randint(1, 5, size=(7, 10)),
         np.random.randint(1, 5, size=(5, 10)),
         np.random.randint(1, 5, size=(3, 10)),
     ]
     dataset = GeneExpressionDataset()
     dataset.populate_from_per_batch_list(data)
     self.assertEqual(dataset.nb_cells, 15)
     self.assertEqual(dataset.nb_genes, 10)
     true_batch_indices = np.concatenate([
         np.zeros((7, 1), dtype=int),
         np.ones((5, 1), dtype=int),
         2 * np.ones((3, 1), dtype=int),
     ])
     self.assertListEqual(true_batch_indices.tolist(),
                          dataset.batch_indices.tolist())

示例#3

显示文件

    def test_batch_correction(self):
        data = [
            np.random.randint(1, 5, size=(50, 25)),
            np.random.randint(1, 5, size=(50, 25)),
            np.random.randint(1, 5, size=(50, 25)),
        ]
        dataset = GeneExpressionDataset()
        dataset.populate_from_per_batch_list(data)

        n_genes = dataset.nb_genes
        n_top = n_genes // 2
        dataset.highly_variable_genes(n_bins=3, flavor="seurat")

        dataset.highly_variable_genes(n_bins=3, flavor="seurat")

        df = dataset.highly_variable_genes(n_bins=3,
                                           n_top_genes=n_top,
                                           flavor="seurat")
        assert df["highly_variable"].sum() >= n_top
        pass

示例#4

显示文件

    def test_dense_subsample_genes(self):
        data = [
            np.random.randint(1, 5, size=(50, 26)),
            np.random.randint(1, 5, size=(50, 26)),
            np.random.randint(1, 5, size=(50, 26)),
        ]

        # With default
        dataset = GeneExpressionDataset()
        dataset.populate_from_per_batch_list(data)
        n_genes = dataset.nb_genes
        n_top = n_genes // 2
        dataset.subsample_genes(new_n_genes=n_top)
        assert dataset.nb_genes < n_genes
        # For some reason the new number of genes can be slightly different than n_top

        # With Seurat
        dataset = GeneExpressionDataset()
        dataset.populate_from_per_batch_list(data)
        dataset.subsample_genes(new_n_genes=n_top, mode="seurat")
        assert dataset.nb_genes < n_genes

示例#5

显示文件

文件： test_highly_variable_genes.py 项目： parkcc/scVI

    def test_batch_correction(self):
        data = [
            np.random.randint(1, 5, size=(50, 25)),
            np.random.randint(1, 5, size=(50, 25)),
            np.random.randint(1, 5, size=(50, 25)),
        ]
        dataset = GeneExpressionDataset()
        dataset.populate_from_per_batch_list(data)

        n_genes = dataset.nb_genes
        n_top = n_genes // 2
        dataset._highly_variable_genes(n_bins=3, flavor="seurat_v2")
        df = dataset._highly_variable_genes(
            n_bins=3, n_top_genes=n_top, flavor="seurat_v2"
        )
        assert df["highly_variable"].sum() >= n_top

        dataset.subsample_genes(new_n_genes=n_top)
        new_genes = dataset.nb_genes
        assert n_genes > new_genes, "subsample_genes did not filter out genes"
        pass

示例#6

显示文件

文件： test_highly_variable_genes.py 项目： parkcc/scVI

    def test_dense_subsample_genes(self):
        data = [
            np.random.randint(1, 5, size=(50, 26)),
            np.random.randint(1, 5, size=(50, 26)),
            np.random.randint(1, 5, size=(50, 26)),
        ]

        # With default
        dataset = GeneExpressionDataset()
        dataset.populate_from_per_batch_list(data)
        n_genes = dataset.nb_genes
        n_top = n_genes // 2
        dataset.subsample_genes(new_n_genes=n_top, mode="cell_ranger")
        assert dataset.nb_genes == n_top

        # With Seurat v2
        dataset = GeneExpressionDataset()
        dataset.populate_from_per_batch_list(data)
        dataset.subsample_genes(new_n_genes=n_top, mode="seurat_v2")
        assert dataset.nb_genes == n_top

        # With Seurat v3
        dataset = GeneExpressionDataset()
        dataset.populate_from_per_batch_list(data)
        dataset.subsample_genes(new_n_genes=n_top, mode="seurat_v3")
        assert dataset.nb_genes == n_top