Python foldername_adapter 예제들, hivwholeseq.sequencing.adapter_info.foldername_adapter Python 예제들

예제 #1

0

파일 보기

파일: symlink_SRA.py 프로젝트: 5l1v3r1/hivwholeseq

def make_output_folders(data_folder, adaIDs, VERBOSE=0):
    '''Make output folders for symlinking'''
    from hivwholeseq.utils.generic import mkdirs
    mkdirs(data_folder)
    if VERBOSE >= 1:
        print 'Folder created:', data_folder

    for adaID in adaIDs + [-1]:
        mkdirs(data_folder+foldername_adapter(adaID))
        if VERBOSE >= 1:
            print 'Folder created:', data_folder+foldername_adapter(adaID)

예제 #2

0

파일 보기

파일: demultiplex.py 프로젝트: 5l1v3r1/hivwholeseq

def make_output_folders(data_folder,
                        adapters_designed,
                        VERBOSE=0,
                        summary=True):
    '''Make output folders for all adapters and unclassified (e.g. PhiX)'''
    from hivwholeseq.utils.generic import mkdirs

    # Make folders for the samples
    for (adaID, s) in adapters_designed:
        dirname = foldername_adapter(adaID)
        mkdirs(data_folder + dirname)
        if VERBOSE:
            print 'Folder created:', dirname

    # Make a default directory for unclassified reads
    mkdirs(data_folder + 'unclassified_reads')
    if VERBOSE:
        print 'Folder created: unclassified reads'

    if summary:
        with open(get_demultiplex_summary_filename(data_folder), 'a') as f:
            f.write('\n')
            f.write(
                'Folders created for samples and unclassified reads (including phix).'
            )
            f.write('\n')

예제 #3

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_reference_premap_hash_filename(data_folder, adaID, ext=True):
    '''Get the filename of the stampy hash of the reference used for premapping'''
    fn = 'reference'
    if ext:
        fn = fn + '.sthash'
    fn = data_folder + foldername_adapter(adaID) + 'premapped/' + fn
    return fn

예제 #4

0

파일 보기

def make_output_folders(data_folder, adaID, VERBOSE=0):
    '''Make output folders for the script'''
    from hivwholeseq.utils.generic import mkdirs
    dirname = data_folder + foldername_adapter(adaID) + 'map_iter/'
    mkdirs(dirname)
    if VERBOSE:
        print 'Folder created:', dirname

예제 #5

0

파일 보기

def get_reference_all_filename(data_folder, adaID, fragment, ext=True):
    '''Get the file with the cumulated consensi'''
    fn = '_'.join(['consensus', 'alliters', fragment])
    fn = data_folder + foldername_adapter(adaID) + 'map_iter/' + fn
    if ext:
        fn = fn + '.fasta'
    return fn

예제 #6

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_mapped_filename(data_folder, adaID=None, fragment=None, type='bam', 
                        bwa=False, filtered=False, sort=False, part=None, unsorted=False,
                        rescue=False, trashed=False):
    '''Get the filename of the mapped reads onto consensus'''
    if fragment is None:
        raise ValueError('Select a fragment')
    filename = fragment
    if rescue:
        filename = filename + '_rescue'
    if bwa:
        filename = filename + '_bwa'
    if filtered:
        filename = filename + '_filtered'
    if trashed:
        filename = filename + '_trashed'
    if sort:
        filename = filename + '_sorted'
    elif part is not None:
        filename = filename+'_part'+str(part)
    elif unsorted:
        filename = filename+'_unsorted'

    filename = 'mapped/'+filename+'.'+type
    if adaID is not None:
        filename = foldername_adapter(adaID)+filename
    return data_folder+filename

예제 #7

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_reference_premap_hash_filename(data_folder, adaID, ext=True):
    '''Get the filename of the stampy hash of the reference used for premapping'''
    fn = 'reference'
    if ext:
        fn = fn + '.sthash'
    fn = data_folder+foldername_adapter(adaID)+'premapped/'+fn
    return fn

예제 #8

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_figure_folder(data_folder, adaID=None):
    '''Get the folder for figures for this sample'''
    folder = 'figures/'
    if adaID is not None:
        folder = foldername_adapter(adaID)+folder
    folder = data_folder+folder
    return folder

예제 #9

0

파일 보기

파일: build_consensus_iterative.py 프로젝트: iosonofabio/hivwholeseq

def make_output_folders(data_folder, adaID, VERBOSE=0):
    '''Make output folders for the script'''
    from hivwholeseq.utils.generic import mkdirs
    dirname = data_folder+foldername_adapter(adaID)+'map_iter/'
    mkdirs(dirname)
    if VERBOSE:
        print 'Folder created:', dirname

예제 #10

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_mapped_filename(data_folder,
                        adaID=None,
                        fragment=None,
                        type='bam',
                        bwa=False,
                        filtered=False,
                        sort=False,
                        part=None,
                        unsorted=False,
                        rescue=False,
                        trashed=False):
    '''Get the filename of the mapped reads onto consensus'''
    if fragment is None:
        raise ValueError('Select a fragment')
    filename = fragment
    if rescue:
        filename = filename + '_rescue'
    if bwa:
        filename = filename + '_bwa'
    if filtered:
        filename = filename + '_filtered'
    if trashed:
        filename = filename + '_trashed'
    if sort:
        filename = filename + '_sorted'
    elif part is not None:
        filename = filename + '_part' + str(part)
    elif unsorted:
        filename = filename + '_unsorted'

    filename = 'mapped/' + filename + '.' + type
    if adaID is not None:
        filename = foldername_adapter(adaID) + filename
    return data_folder + filename

예제 #11

0

파일 보기

파일: build_consensus_iterative.py 프로젝트: iosonofabio/hivwholeseq

def get_reference_all_filename(data_folder, adaID, fragment, ext=True):
    '''Get the file with the cumulated consensi'''
    fn = '_'.join(['consensus', 'alliters', fragment])
    fn = data_folder+foldername_adapter(adaID)+'map_iter/'+fn
    if ext:
        fn = fn+'.fasta'
    return fn

예제 #12

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_premapped_filename(data_folder,
                           adaID=None,
                           type='bam',
                           bwa=False,
                           part=None,
                           unsorted=False):
    '''Get the filename of the readed mapped to reference to split into fragments'''
    filename = 'premapped'
    filename = 'premapped/' + filename
    if adaID is not None:
        filename = foldername_adapter(adaID) + filename
    if part is not None:
        filename = filename + '_part' + str(part)
    elif unsorted:
        filename = filename + '_unsorted'

    if bwa:
        filename = filename + '_bwa'
    if type == 'sam':
        filename = filename + '.sam'
    elif type == 'bam':
        filename = filename + '.bam'
    else:
        raise ValueError('Type of mapped reads file not recognized')

    return data_folder + filename

예제 #13

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_figure_folder(data_folder, adaID=None):
    '''Get the folder for figures for this sample'''
    folder = 'figures/'
    if adaID is not None:
        folder = foldername_adapter(adaID) + folder
    folder = data_folder + folder
    return folder

예제 #14

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_reference_premap_filename(data_folder, adaID, fragment=None):
    '''Get the filename of the reference used from premapping'''
    fn = 'reference'
    if fragment is not None:
        fn = fn+'_'+fragment
    fn = fn+'.fasta'
    fn = data_folder+foldername_adapter(adaID)+'premapped/'+fn
    return fn

예제 #15

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_consensus_old_filename(data_folder, adaID, fragment, trim_primers=True):
    '''Find the filename of the final consensus'''
    filename = 'consensus_old_'+fragment
    if not trim_primers:
        filename = filename+'_with_primers'
    filename = filename+'.fasta'
    filename = foldername_adapter(adaID)+filename
    return data_folder+filename

예제 #16

0

파일 보기

def get_hash_file(data_folder, adaID, fragment, ext=True):
    '''Get the index filename, with or w/o extension'''
    filename = 'consensus_' + fragment
    filename = 'hash/' + filename
    filename = foldername_adapter(adaID) + filename
    if ext:
        filename = filename + '.sthash'
    return data_folder + filename

예제 #17

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_merged_consensus_filename(data_folder, adaID=None,
                                  fragments=['F1', 'F2', 'F3', 'F4', 'F5', 'F6']):
    '''Get the merged consensus of several fragments'''
    filename = 'consensus_'+'-'.join(fragments)+'.fasta'
    if adaID is not None:
        filename = foldername_adapter(adaID)+filename
    filename = data_folder+filename
    return filename

예제 #18

0

파일 보기

파일: map_to_consensus.py 프로젝트: iosonofabio/hivwholeseq

def get_hash_file(data_folder, adaID, fragment, ext=True):
    '''Get the index filename, with or w/o extension'''
    filename = 'consensus_'+fragment
    filename = 'hash/'+filename
    filename = foldername_adapter(adaID)+filename
    if ext:
        filename = filename+'.sthash'
    return data_folder+filename

예제 #19

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_reference_premap_filename(data_folder, adaID, fragment=None):
    '''Get the filename of the reference used from premapping'''
    fn = 'reference'
    if fragment is not None:
        fn = fn + '_' + fragment
    fn = fn + '.fasta'
    fn = data_folder + foldername_adapter(adaID) + 'premapped/' + fn
    return fn

예제 #20

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_build_consensus_summary_filename(data_folder, adaID, fragment='general',
                                         iterative=True):
    '''Get the filename of the summary of the iterative consensus'''
    filename = 'summary_build_consensus_'+fragment+'.txt'
    if iterative:
        filename = 'map_iter/'+filename
    filename = data_folder+foldername_adapter(adaID)+filename
    return filename

예제 #21

0

파일 보기

def get_mapped_filename(data_folder, adaID, fragment, n_iter, type='bam'):
    '''Get the mapped filenames'''
    filename = 'mapped_to_'
    if n_iter == 1:
        filename = filename + 'reference'
    else:
        filename = filename + 'consensus_' + str(n_iter - 1)
    filename = filename + '_' + fragment + '.' + type
    return data_folder + foldername_adapter(adaID) + 'map_iter/' + filename

예제 #22

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_map_summary_filename(data_folder, adaID, fragment, rescue=False):
    '''Get the filename of the summary of the division into fragments'''
    filename = 'summary_map'+fragment
    if rescue:
        filename = filename+'_rescue'
    filename = filename+'.txt'
    filename = 'mapped/'+filename
    filename = data_folder+foldername_adapter(adaID)+filename
    return filename

예제 #23

0

파일 보기

파일: build_consensus_iterative.py 프로젝트: iosonofabio/hivwholeseq

def get_mapped_filename(data_folder, adaID, fragment, n_iter, type='bam'):
    '''Get the mapped filenames'''
    filename = 'mapped_to_'
    if n_iter == 1:
        filename = filename + 'reference'
    else:
        filename = filename + 'consensus_'+str(n_iter - 1)
    filename = filename+'_'+fragment+'.'+type
    return data_folder+foldername_adapter(adaID)+'map_iter/'+filename

예제 #24

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_map_summary_filename(data_folder, adaID, fragment, rescue=False):
    '''Get the filename of the summary of the division into fragments'''
    filename = 'summary_map' + fragment
    if rescue:
        filename = filename + '_rescue'
    filename = filename + '.txt'
    filename = 'mapped/' + filename
    filename = data_folder + foldername_adapter(adaID) + filename
    return filename

예제 #25

0

파일 보기

파일: samples.py 프로젝트: iosonofabio/hivwholeseq

    def __init__(self, *args, **kwargs):
        '''Initialize a sequenced sample'''
        super(SampleSeq, self).__init__(*args, **kwargs)

        from hivwholeseq.sequencing.filenames import get_seqrun_foldername
        from hivwholeseq.sequencing.adapter_info import foldername_adapter
        seq_run = self.loc['seq run']
        adaID = self.loc['adapter']
        self['folder'] = str(get_seqrun_foldername(seq_run)+foldername_adapter(adaID))
        self['seqrun_folder'] = str(get_seqrun_foldername(seq_run))

예제 #26

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_build_consensus_summary_filename(data_folder,
                                         adaID,
                                         fragment='general',
                                         iterative=True):
    '''Get the filename of the summary of the iterative consensus'''
    filename = 'summary_build_consensus_' + fragment + '.txt'
    if iterative:
        filename = 'map_iter/' + filename
    filename = data_folder + foldername_adapter(adaID) + filename
    return filename

예제 #27

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_merged_allele_frequencies_filename(data_folder,
                                           adaID,
                                           fragments=[
                                               'F1', 'F2', 'F3', 'F4', 'F5',
                                               'F6'
                                           ]):
    '''Get the merged allele frequencies of several fragments'''
    filename = 'allele_frequencies_' + '-'.join(fragments) + '.fasta'
    filename = data_folder + foldername_adapter(adaID) + filename
    return filename

예제 #28

0

파일 보기

파일: samples.py 프로젝트: 5l1v3r1/hivwholeseq

    def __init__(self, *args, **kwargs):
        '''Initialize a sequenced sample'''
        super(SampleSeq, self).__init__(*args, **kwargs)

        from hivwholeseq.sequencing.filenames import get_seqrun_foldername
        from hivwholeseq.sequencing.adapter_info import foldername_adapter
        seq_run = self.loc['seq run']
        adaID = self.loc['adapter']
        self['folder'] = str(
            get_seqrun_foldername(seq_run) + foldername_adapter(adaID))
        self['seqrun_folder'] = str(get_seqrun_foldername(seq_run))

예제 #29

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_consensus_old_filename(data_folder,
                               adaID,
                               fragment,
                               trim_primers=True):
    '''Find the filename of the final consensus'''
    filename = 'consensus_old_' + fragment
    if not trim_primers:
        filename = filename + '_with_primers'
    filename = filename + '.fasta'
    filename = foldername_adapter(adaID) + filename
    return data_folder + filename

예제 #30

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_merged_consensus_filename(data_folder,
                                  adaID=None,
                                  fragments=[
                                      'F1', 'F2', 'F3', 'F4', 'F5', 'F6'
                                  ]):
    '''Get the merged consensus of several fragments'''
    filename = 'consensus_' + '-'.join(fragments) + '.fasta'
    if adaID is not None:
        filename = foldername_adapter(adaID) + filename
    filename = data_folder + filename
    return filename

예제 #31

0

파일 보기

파일: build_consensus_iterative.py 프로젝트: iosonofabio/hivwholeseq

def get_reference_filename(data_folder, adaID, fragment, n_iter, ext=True):
    '''Get the reference filename for the intermediate mappings'''
    if n_iter == 1:
        fn = get_reference_premap_filename(data_folder, adaID, fragment)
        if not ext:
            fn = fn[:-6]
    else:
        fn = '_'.join(['consensus', str(n_iter-1), fragment])
        fn = data_folder+foldername_adapter(adaID)+'map_iter/'+fn
        if ext:
            fn = fn+'.fasta'
    return fn

예제 #32

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_divided_filename(data_folder, adaID=None, fragment=None, type='bam', chunk=None):
    '''Get the filename of the BAM files divided for a single fragment'''
    filename = 'divided'
    filename = 'divided/'+filename
    if adaID is not None:
        filename = foldername_adapter(adaID)+filename
    filename = data_folder+filename
    filename = filename+'_'+fragment
    if chunk is not None:
        filename = filename+'_chunk_'+str(chunk)
    filename = filename+'.'+type
    return filename

예제 #33

0

파일 보기

def get_reference_filename(data_folder, adaID, fragment, n_iter, ext=True):
    '''Get the reference filename for the intermediate mappings'''
    if n_iter == 1:
        fn = get_reference_premap_filename(data_folder, adaID, fragment)
        if not ext:
            fn = fn[:-6]
    else:
        fn = '_'.join(['consensus', str(n_iter - 1), fragment])
        fn = data_folder + foldername_adapter(adaID) + 'map_iter/' + fn
        if ext:
            fn = fn + '.fasta'
    return fn

예제 #34

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_divided_filenames(data_folder, adaID=None, fragments=None, type='bam'):
    '''Get the filenames of the BAM files divided by fragment'''
    filename = 'divided'
    filename = 'divided/' + filename
    if adaID is not None:
        filename = foldername_adapter(adaID) + filename
    filename = data_folder + filename
    filenames = []
    for fragment in (list(fragments) +
                     ['ambiguous', 'crossmapped', 'unmapped', 'low_quality']):
        fnf = filename + '_' + fragment + '.' + type
        filenames.append(fnf)
    return filenames

예제 #35

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_divided_filenames(data_folder, adaID=None, fragments=None, type='bam'):
    '''Get the filenames of the BAM files divided by fragment'''
    filename = 'divided'
    filename = 'divided/'+filename
    if adaID is not None:
        filename = foldername_adapter(adaID)+filename
    filename = data_folder+filename
    filenames = []
    for fragment in (list(fragments) + ['ambiguous', 'crossmapped',
                                        'unmapped', 'low_quality']):
        fnf = filename+'_'+fragment+'.'+type
        filenames.append(fnf)
    return filenames

예제 #36

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_read_filenames(data_folder, adaID=None, fragment=None, suffix='',
                       gzip=False, trimmed=False):
    '''Get the filenames of the demultiplexed reads'''
    filenames = ['read1', 'read2']
    for i,fn in enumerate(filenames):
        if adaID is not None:
            fn = foldername_adapter(adaID)+fn
        fn = data_folder+fn
        if trimmed:
            fn = fn+'_trimmed'
        fn = fn+suffix+'.fastq'
        if gzip:
            fn = fn+'.gz' 
        filenames[i] = fn
    return filenames

예제 #37

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_divided_filename(data_folder,
                         adaID=None,
                         fragment=None,
                         type='bam',
                         chunk=None):
    '''Get the filename of the BAM files divided for a single fragment'''
    filename = 'divided'
    filename = 'divided/' + filename
    if adaID is not None:
        filename = foldername_adapter(adaID) + filename
    filename = data_folder + filename
    filename = filename + '_' + fragment
    if chunk is not None:
        filename = filename + '_chunk_' + str(chunk)
    filename = filename + '.' + type
    return filename

예제 #38

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_read_filenames(data_folder,
                       adaID=None,
                       fragment=None,
                       suffix='',
                       gzip=False,
                       trimmed=False):
    '''Get the filenames of the demultiplexed reads'''
    filenames = ['read1', 'read2']
    for i, fn in enumerate(filenames):
        if adaID is not None:
            fn = foldername_adapter(adaID) + fn
        fn = data_folder + fn
        if trimmed:
            fn = fn + '_trimmed'
        fn = fn + suffix + '.fastq'
        if gzip:
            fn = fn + '.gz'
        filenames[i] = fn
    return filenames

예제 #39

0

파일 보기

파일: demultiplex.py 프로젝트: iosonofabio/hivwholeseq

def make_output_folders(data_folder, adapters_designed, VERBOSE=0, summary=True):
    '''Make output folders for all adapters and unclassified (e.g. PhiX)'''
    from hivwholeseq.utils.generic import mkdirs

    # Make folders for the samples
    for (adaID, s) in adapters_designed:
            dirname = foldername_adapter(adaID)
            mkdirs(data_folder+dirname)
            if VERBOSE:
                print 'Folder created:', dirname

    # Make a default directory for unclassified reads
    mkdirs(data_folder+'unclassified_reads')
    if VERBOSE:
        print 'Folder created: unclassified reads'

    if summary:
        with open(get_demultiplex_summary_filename(data_folder), 'a') as f:
            f.write('\n')
            f.write('Folders created for samples and unclassified reads (including phix).')
            f.write('\n')

예제 #40

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_premapped_filename(data_folder, adaID=None, type='bam', bwa=False,
                           part=None, unsorted=False):
    '''Get the filename of the readed mapped to reference to split into fragments'''
    filename = 'premapped'
    filename = 'premapped/'+filename
    if adaID is not None:
        filename = foldername_adapter(adaID)+filename
    if part is not None:
        filename = filename+'_part'+str(part)
    elif unsorted:
        filename = filename+'_unsorted'

    if bwa:
        filename = filename + '_bwa'
    if type == 'sam':
        filename = filename + '.sam'
    elif type == 'bam':
        filename = filename + '.bam'
    else:
        raise ValueError('Type of mapped reads file not recognized')

    return data_folder+filename

예제 #41

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_fragment_positions_filename(data_folder, adaID):
    '''Get the filename of the positions of fragments in the reference for premap'''
    filename = 'fragment_positions_premapped.dat'
    filename = 'divided/'+filename
    return data_folder+foldername_adapter(adaID)+filename

예제 #42

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_mutations_file(data_folder, adaID, fragment):
    '''Get the filename with the mutations for all reads'''
    filename = 'mutations_' + fragment + '.pickle'
    filename = foldername_adapter(adaID) + filename
    return data_folder + filename

예제 #43

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_filter_mapped_summary_filename(data_folder, adaID, fragment):
    '''Get the filename of the summary of the division into fragments'''
    filename = 'summary_filter_'+fragment+'.txt'
    filename = 'mapped/'+filename
    filename = data_folder+foldername_adapter(adaID)+filename
    return filename

예제 #44

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_filter_mapped_summary_filename(data_folder, adaID, fragment):
    '''Get the filename of the summary of the division into fragments'''
    filename = 'summary_filter_' + fragment + '.txt'
    filename = 'mapped/' + filename
    filename = data_folder + foldername_adapter(adaID) + filename
    return filename

예제 #45

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_fragment_positions_filename(data_folder, adaID):
    '''Get the filename of the positions of fragments in the reference for premap'''
    filename = 'fragment_positions_premapped.dat'
    filename = 'divided/' + filename
    return data_folder + foldername_adapter(adaID) + filename

예제 #46

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_premap_summary_filename(data_folder, adaID):
    '''Get the filename of the premap to reference'''
    filename = 'summary_premapped.txt'
    filename = 'premapped/'+filename
    filename = data_folder+foldername_adapter(adaID)+filename
    return filename

예제 #47

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_divide_summary_filename(data_folder, adaID):
    '''Get the filename of the summary of the division into fragments'''
    filename = 'summary_divide.txt'
    filename = 'divided/' + filename
    filename = data_folder + foldername_adapter(adaID) + filename
    return filename

예제 #48

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_premap_summary_filename(data_folder, adaID):
    '''Get the filename of the premap to reference'''
    filename = 'summary_premapped.txt'
    filename = 'premapped/' + filename
    filename = data_folder + foldername_adapter(adaID) + filename
    return filename

예제 #49

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_trim_summary_filename(data_folder, adaID):
    '''Get the filename of the trim low quality'''
    filename = 'summary_trim.txt'
    filename = data_folder + foldername_adapter(adaID) + filename
    return filename

예제 #50

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_divide_summary_filename(data_folder, adaID):
    '''Get the filename of the summary of the division into fragments'''
    filename = 'summary_divide.txt'
    filename = 'divided/'+filename
    filename = data_folder+foldername_adapter(adaID)+filename
    return filename

예제 #51

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_trim_summary_filename(data_folder, adaID):
    '''Get the filename of the trim low quality'''
    filename = 'summary_trim.txt'
    filename = data_folder+foldername_adapter(adaID)+filename
    return filename

예제 #52

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_read_unpaired_filename(data_folder, adaID):
    '''Get the reads pairs for which one read is low quality'''
    fn = 'reads_unpaired.fastq'
    fn = foldername_adapter(adaID) + fn
    fn = data_folder + fn
    return fn

예제 #53

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_mapped_suspicious_filename(data_folder, adaID, fragment, type='bam'):
    '''The the filename of the mapped reads with many mutations from consensus'''
    filename = fragment + '_suspicious.' + type
    filename = data_folder + foldername_adapter(adaID) + 'mapped/' + filename
    return filename

예제 #54

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_merged_allele_frequencies_filename(data_folder, adaID,
                                    fragments=['F1', 'F2', 'F3', 'F4', 'F5', 'F6']):
    '''Get the merged allele frequencies of several fragments'''
    filename = 'allele_frequencies_'+'-'.join(fragments)+'.fasta'
    filename = data_folder+foldername_adapter(adaID)+filename
    return filename

예제 #55

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_read_unpaired_filename(data_folder, adaID):
    '''Get the reads pairs for which one read is low quality'''
    fn = 'reads_unpaired.fastq'
    fn = foldername_adapter(adaID)+fn
    fn = data_folder+fn
    return fn

예제 #56

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_allele_frequencies_filename(data_folder, adaID, fragment):
    '''Get the filename with the corrected allele frequencies'''
    filename = 'allele_frequencies_'+fragment+'.npy'
    filename = foldername_adapter(adaID)+filename
    return data_folder+filename

예제 #57

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_mapped_suspicious_filename(data_folder, adaID, fragment, type='bam'):
    '''The the filename of the mapped reads with many mutations from consensus'''
    filename = fragment+'_suspicious.'+type
    filename = data_folder+foldername_adapter(adaID)+'mapped/'+filename
    return filename

예제 #58

0

파일 보기

파일: filenames.py 프로젝트: 5l1v3r1/hivwholeseq

def get_allele_frequencies_filename(data_folder, adaID, fragment):
    '''Get the filename with the corrected allele frequencies'''
    filename = 'allele_frequencies_' + fragment + '.npy'
    filename = foldername_adapter(adaID) + filename
    return data_folder + filename

예제 #59

0

파일 보기

파일: filenames.py 프로젝트: iosonofabio/hivwholeseq

def get_mutations_file(data_folder, adaID, fragment):
    '''Get the filename with the mutations for all reads'''
    filename = 'mutations_'+fragment+'.pickle'
    filename = foldername_adapter(adaID)+filename
    return data_folder+filename