Python generate_words_with_mismatches 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: _01_10_most_freq_with_mismatches

메소드/함수: generate_words_with_mismatches

hotexamples.com에서의 예제들: 5

Python generate_words_with_mismatches - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 _01_10_most_freq_with_mismatches.generate_words_with_mismatches에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: _03_02_median.py 프로젝트: GodfatherThe/bioinf-algo-2015

def median(dnas, k):
    kmers = set()
    for dna in dnas:
        substr_kmers = set(["".join(x) for x in window(dna, k)])
        for kmer in substr_kmers:
            kmers.update(set(generate_words_with_mismatches(kmer, k)))
    opt_kmer = ''
    opt_distance = len(dnas)*k + 1
    for kmer in kmers:
        if opt_distance > d(kmer, dnas, k):
            opt_distance = d(kmer, dnas, k)
            opt_kmer = kmer
    return opt_kmer, opt_distance

예제 #2

파일 보기

def median(dnas, k):
    kmers = set()
    for dna in dnas:
        substr_kmers = set(["".join(x) for x in window(dna, k)])
        for kmer in substr_kmers:
            kmers.update(set(generate_words_with_mismatches(kmer, k)))
    opt_kmer = ''
    opt_distance = len(dnas) * k + 1
    for kmer in kmers:
        if opt_distance > d(kmer, dnas, k):
            opt_distance = d(kmer, dnas, k)
            opt_kmer = kmer
    return opt_kmer, opt_distance

예제 #3

파일 보기

파일: _03_01_motif_enum.py 프로젝트: okainov/bioinf-algo-2015

def enumerate_motifs(dnas, k, d):
    kmers = []
    for text in dnas:
        kmers.extend(["".join(x) for x in window(text, k)])
    resulting_set = set()
    for kmer in kmers:
        for modified_kmer in generate_words_with_mismatches(kmer, d):
            will_add = True
            for text in dnas:
                was_found = False
                for fragment in ["".join(x) for x in window(text, k)]:
                    if hamming_distance(fragment, modified_kmer) <= d:
                        was_found = True
                        break
                if not was_found:
                    will_add = False
                    break
            if will_add:
                resulting_set.add(modified_kmer)
    return list(resulting_set)

예제 #4

파일 보기

    max_count = 0
    visited_kmers = set()
    for kmer in kmers:
        app = approx_pattern_count(text, kmer, d) + approx_pattern_count(
            text, reverse_dna(kmer), d)
        if app > 0 and kmer not in visited_kmers:
            if kmer not in count_dict:
                count_dict[kmer] = 0
            count_dict[kmer] += app
            if count_dict[kmer] > max_count:
                max_count = count_dict[kmer]

    result = [key for key in count_dict if count_dict[key] == max_count]
    return result, max_count


if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        text = f.readline().strip()
        k, d = map(int, f.readline().split())

    substr_kmers = set(["".join(x) for x in window(text, k)])
    kmers = set()
    for kmer in substr_kmers:
        kmers.update(set(generate_words_with_mismatches(kmer, d)))

    result, max_count = frequent_words_with_mismatch(text, kmers, d)

    with open('out.txt', 'w') as f:
        f.write(str(' '.join(result)))

예제 #5

파일 보기

파일: _01_11_most_freq_with_mismatches_rev.py 프로젝트: GodfatherThe/bioinf-algo-2015

    max_count = 0
    visited_kmers = set()
    for kmer in kmers:
        app = approx_pattern_count(text, kmer, d) + approx_pattern_count(text, reverse_dna(kmer), d)
        if app > 0 and kmer not in visited_kmers:
            if kmer not in count_dict:
                count_dict[kmer] = 0
            count_dict[kmer] += app
            if count_dict[kmer] > max_count:
                max_count = count_dict[kmer]

    result = [key for key in count_dict if count_dict[key] == max_count]
    return result, max_count


if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        text = f.readline().strip()
        k, d = map(int, f.readline().split())

    substr_kmers = set(["".join(x) for x in window(text, k)])
    kmers = set()
    for kmer in substr_kmers:
        kmers.update(set(generate_words_with_mismatches(kmer, d)))

    result, max_count = frequent_words_with_mismatch(text, kmers, d)

    with open('out.txt', 'w') as f:
        f.write(str(' '.join(result)))