Python Workflow.setup_clustering 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils.workflow

클래스/타입: Workflow

메소드/함수: setup_clustering

hotexamples.com에서의 예제들: 3

Python Workflow.setup_clustering - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.workflow.Workflow.setup_clustering에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

add_experiment_name(3)

create_new(3)

setup_clustering(3)

add_datafiles(2)

load(2)

cleanup_files(1)

run_clustering(1)

run_preprocessing(1)

setup_preprocessing(1)

예제 #1

파일 보기

파일: new_workflow_template.py 프로젝트: MrKriss/popGen

else:
    W.add_experiment_name(experiment_name, description)

default_params = {"c_thresh": 0.90, "n_filter": 8, "maskN": False}

# Choose method to split files
# ===============================================================================

splitby = None

subgroups = {"zebra": ".*zebra.*", "gazelle": ".*gazelle.*"}

if splitby == "subgroups":
    W.setup_clustering(
        mode="split_by_subgroups",
        infiles_pattern="lane*-clean.fastq.bgzf",
        default_params=default_params,
        subgroups=subgroups,
    )
elif splitby == "tags":
    W.setup_clustering(mode="split_by_tags", infiles_pattern="lane*-clean.fastq.bgzf", default_params=default_params)
# ===============================================================================

# Varibles to change, 1 dictionary per run
run_parameters = [{"c_thresh": 1.0}, {"c_thresh": 0.90}]

W.run_clustering(run_parameters, threads=1)

# Next steps

# Delete all fasta files

예제 #2

파일 보기

파일: workflow_script.py 프로젝트: MrKriss/popGen

# Clustering 
#===============================================================================
if testing:
    W.add_experiment_name('gz-subgroups-test', 'Test for splitting files by subgroups')
else:
    W.add_experiment_name(experiment_name, description)

default_params = { 'c_thresh' : 0.90,
                   'n_filter' : 8,
                    'maskN' : False}

subgroups = { 'zebra'  : '.*zebra.*',
            'gazelle' : '.*gazelle.*'}

if testing:
    W.setup_clustering(mode='split_by_subgroups', infiles_pattern='test*-clean.fastq.bgzf',
                     default_params=default_params, subgroups=subgroups) 
#     W.setup_clustering(mode='split_by_tags', infiles_pattern='test*-clean.fastq.bgzf',
#                      default_params=default_params) 
else:
    W.setup_clustering(mode='split_by_subgroups', infiles_pattern='lane*-clean.fastq.bgzf',
                     default_params=default_params, subgroups=subgroups) 
#     W.setup_clustering(mode='split_by_tags', infiles_pattern='lane*-clean.fastq.bgzf',
#                      default_params=default_params) 

# Varibles to change, 1 dictionary per run
run_parameters = [ 
                    { 'c_thresh' : 1.0},
                    { 'c_thresh' : 0.90},
                   ]

W.run_clustering(run_parameters, threads=1)

예제 #3

파일 보기

파일: gz_clust_add_workflow_script.py 프로젝트: MrKriss/popGen

# Clustering 
#===============================================================================
if testing:
    W.add_experiment_name('gz-subgroups-test', 'Test for splitting files by subgroups')
else:
    W.add_experiment_name(experiment_name, description)

default_params = { 'c_thresh' : 0.90,
                   'n_filter' : 8,
                    'maskN' : False}

subgroups = { 'zebra'  : '.*zebra.*',
            'gazelle' : '.*gazelle.*'}

if testing:
    W.setup_clustering(mode='split_by_subgroups', infiles_pattern='test*-clean.fastq.bgzf',
                     default_params=default_params, subgroups=subgroups) 
#     W.setup_clustering(mode='split_by_tags', infiles_pattern='test*-clean.fastq.bgzf',
#                      default_params=default_params) 
else:
#     W.setup_clustering(mode='split_by_subgroups', infiles_pattern='lane*-clean.fastq.bgzf',
#                      default_params=default_params, subgroups=subgroups) 
#     W.setup_clustering(mode='split_by_tags', infiles_pattern='lane*-clean.fastq.bgzf',
#                      default_params=default_params) 
#     W.setup_clustering(mode='no_split_separate', infiles_pattern='*.bgzf', 
#                        infiles_path=W.c.tag_splitby_subgroup_outpath, 
#                        default_params=default_params) 
    W.setup_clustering(mode='no_split_separate', infiles_pattern='*.bgzf', 
                       infiles_path=W.c.tag_splitby_sample_outpath, 
                       default_params=default_params) 

# Varibles to change, 1 dictionary per run