Python Dataset.query_samples_by_counts Beispiele

Programmiersprache: Python

Namespace / Paketname: singlet.dataset

Klasse / Typ: Dataset

Methode / Funktion: query_samples_by_counts

Beispiele auf hotexamples.com: 2

Python Dataset.query_samples_by_counts - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die singlet.dataset.Dataset.query_samples_by_counts, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Dataset(14)

copy(9)

query_samples_by_metadata(7)

samplesheet(4)

query_features_by_metadata(4)

split(4)

counts(3)

query_features_by_name(3)

query_samples_by_counts(2)

featuresheet(1)

query_features_by_counts(1)

__repr__(1)

compare(1)

query_samples_by_name(1)

reindex(1)

rename(1)

bootstrap(1)

Beispiel #1

Datei anzeigen

Datei: fig2-S4.py Projekt: Takshan/viscRNA-Seq-paper

import matplotlib.pyplot as plt
import seaborn as sns

os.environ['SINGLET_CONFIG_FILENAME'] = 'singlet.yml'
sys.path.append('/home/fabio/university/postdoc/singlet')
from singlet.dataset import Dataset

# Script
if __name__ == '__main__':

    ds = Dataset(
        counts_table='dengue',
        samplesheet='virus',
        featuresheet='humanGC38',
    )
    ds.query_samples_by_counts('total >= 50000', inplace=True)

    ds.samplesheet.rename(columns={'time [h]': 'time'}, inplace=True)
    cov = ds.samplesheet['coverage'] = ds.counts.sum(axis=0)
    ds.counts.normalize('counts_per_million', inplace=True)

    n = ds.samplesheet['numberDengueReads'].astype(int)
    ds.samplesheet['virus_reads_per_million'] = 1e6 * n / (cov + n)
    ds.counts.log(inplace=True)

    # Only select cells without virus
    ds.query_samples_by_metadata('virus_reads_per_million < 0.1', inplace=True)

    # Check table with number of cells
    table = (ds.samplesheet.groupby(
        ['time', 'MOI']).count().iloc[:,

Beispiel #2

Datei anzeigen

    # NOTE: an env variable for the config file needs to be set when
    # calling this script
    from singlet.dataset import Dataset
    ds = Dataset(
            samplesheet='example_sheet_tsv',
            counts_table='example_table_tsv')

    print('Query samples by metadata')
    ds_tmp = ds.query_samples_by_metadata(
            'experiment == "test_pipeline"',
            inplace=False)
    assert(tuple(ds_tmp.samplenames) == ('test_pipeline',))
    print('Done!')

    print('Query sample by counts in one gene')
    ds_tmp = ds.query_samples_by_counts('KRIT1 > 100', inplace=False)
    assert(tuple(ds_tmp.samplenames) == ('third_sample',))
    print('Done!')

    print('Query sample by total counts')
    ds_tmp = ds.query_samples_by_counts('total < 3000000', inplace=False)
    assert(tuple(ds_tmp.samplenames) == ('second_sample',))
    print('Done!')

    print('Query sample by mapped counts')
    ds_tmp = ds.query_samples_by_counts('mapped < 1000000', inplace=False)
    assert(tuple(ds_tmp.samplenames) == ('second_sample',))
    print('Done!')

    print('Query features by counts')
    ds_tmp = ds.query_features_by_counts(