Python HLLCounter.estimate_cardinalityの例

プログラミング言語: Python

名前空間/パッケージ名: khmer

クラス/型: HLLCounter

メソッド/関数: estimate_cardinality

hotexamples.comのコード掲載数: 6

Python HLLCounter.estimate_cardinality - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのkhmer.HLLCounter.estimate_cardinalityの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

HLLCounter(3)

estimate_cardinality(3)

consume_string(2)

consume_fasta(1)

consume_seqfile(1)

コード例 #1

ファイルを表示

    def parse(fn):
        hll = HLLCounter(.01, K)
        lens = []
        names = []
        gc_len = 0
        n_ambiguous = 0
        for contig in ReadParser(fn):
            sequence = contig.sequence
            lens.append(len(sequence))
            names.append(contig.name)

            if DNA.match(sequence) is None:
                raise RuntimeError('non-ACGTN characters not supported. '\
                                   'Offending transcript: \n>{0}\n{1}\nbad'\
                                   .format(contig.name, contig.sequence))
            if 'N' in sequence:
                sequence = sequence.replace('N', 'A')
                n_ambiguous += 1

            hll.consume_string(sequence)
            gc_len += contig.sequence.count('C')
            gc_len += contig.sequence.count('G')
        S = pd.Series(lens, index=names)
        try:
            S.sort_values()
        except AttributeError:
            S.sort()
        gc_perc = float(gc_len) / S.sum()
        return S, hll.estimate_cardinality(), gc_perc, n_ambiguous

コード例 #2

ファイルを表示

ファイル: getuniquekmers.py プロジェクト: chris-klinger/MMETSP

def get_unique_kmers(mmetsp, fasta):
    print(fasta)
    counter = HLLCounter(0.1, 25)
    counter.consume_fasta(fasta)
    unique_kmers = counter.estimate_cardinality()
    print(unique_kmers)
    return unique_kmers

コード例 #3

ファイルを表示

ファイル: tasks.py プロジェクト: camillescott/dammit

    def parse(fn):
        hll = HLLCounter(.01, K)
        lens = []
        names = []
        gc_len = 0
        n_ambiguous = 0
        for contig in ReadParser(fn):
            sequence = contig.sequence
            lens.append(len(sequence))
            names.append(contig.name)

            if DNA.match(sequence) is None:
                raise RuntimeError('non-ACGTN characters not supported. '\
                                   'Offending transcript: \n>{0}\n{1}\nbad'\
                                   .format(contig.name, contig.sequence))
            if 'N' in sequence:
                sequence = sequence.replace('N', 'A')
                n_ambiguous += 1

            hll.consume_string(sequence)
            gc_len += contig.sequence.count('C')
            gc_len += contig.sequence.count('G')
        S = pd.Series(lens, index=names)
        try:
            S.sort_values()
        except AttributeError:
            S.sort()
        gc_perc = float(gc_len) / S.sum()
        print('return')
        return S, hll.estimate_cardinality(), gc_perc, n_ambiguous

コード例 #4

ファイルを表示

ファイル: getuniquekmers.py プロジェクト: ljcohen/MMETSP

def get_unique_kmers(sra,fasta):
	print fasta
	counter = HLLCounter(0.1,25)
	counter.consume_fasta(fasta)
	unique_kmers = counter.estimate_cardinality()
	print unique_kmers
	return unique_kmers

コード例 #5

ファイルを表示

ファイル: tasks.py プロジェクト: macmanes/dammit

 def parse(fn):
     hll = HLLCounter(.01, K)
     lens = []
     names = []
     gc_len = 0
     for contig in ReadParser(fn):
         lens.append(len(contig.sequence))
         names.append(contig.name)
         hll.consume_string(contig.sequence)
         gc_len += contig.sequence.count('C')
         gc_len += contig.sequence.count('G')
     S = pd.Series(lens, index=names)
     S.sort()
     gc_perc = float(gc_len) / S.sum()
     return S, hll.estimate_cardinality(), gc_perc

コード例 #6

ファイルを表示

ファイル: tasks.py プロジェクト: macmanes-lab/dammit

 def parse(fn):
     hll = HLLCounter(.01, K)
     lens = []
     names = []
     gc_len = 0
     for contig in ReadParser(fn):
         lens.append(len(contig.sequence))
         names.append(contig.name)
         hll.consume_string(contig.sequence)
         gc_len += contig.sequence.count('C')
         gc_len += contig.sequence.count('G')
     S = pd.Series(lens, index=names)
     try:
         S.sort_values()
     except AttributeError:
         S.sort()
     gc_perc = float(gc_len) / S.sum()
     return S, hll.estimate_cardinality(), gc_perc