Python window示例，_01_02_frequent_words.window Python示例

示例#1

0

显示文件

文件： _01_09_approx_pattern_count.py 项目： GodfatherThe/bioinf-algo-2015

def approx_pattern_count(text, pattern, d):
    fragment_length = len(pattern)
    count = 0
    for i, fragment in enumerate(["".join(x) for x in window(text, fragment_length)]):
        if hamming_distance(fragment, pattern) <= d:
            count += 1
    return count

示例#2

0

显示文件

def approx_pattern_count(text, pattern, d):
    fragment_length = len(pattern)
    count = 0
    for i, fragment in enumerate(
        ["".join(x) for x in window(text, fragment_length)]):
        if hamming_distance(fragment, pattern) <= d:
            count += 1
    return count

示例#3

0

显示文件

文件： _03_01_motif_enum.py 项目： okainov/bioinf-algo-2015

def enumerate_motifs(dnas, k, d):
    kmers = []
    for text in dnas:
        kmers.extend(["".join(x) for x in window(text, k)])
    resulting_set = set()
    for kmer in kmers:
        for modified_kmer in generate_words_with_mismatches(kmer, d):
            will_add = True
            for text in dnas:
                was_found = False
                for fragment in ["".join(x) for x in window(text, k)]:
                    if hamming_distance(fragment, modified_kmer) <= d:
                        was_found = True
                        break
                if not was_found:
                    will_add = False
                    break
            if will_add:
                resulting_set.add(modified_kmer)
    return list(resulting_set)

示例#4

0

显示文件

def median(dnas, k):
    kmers = set()
    for dna in dnas:
        substr_kmers = set(["".join(x) for x in window(dna, k)])
        for kmer in substr_kmers:
            kmers.update(set(generate_words_with_mismatches(kmer, k)))
    opt_kmer = ''
    opt_distance = len(dnas) * k + 1
    for kmer in kmers:
        if opt_distance > d(kmer, dnas, k):
            opt_distance = d(kmer, dnas, k)
            opt_kmer = kmer
    return opt_kmer, opt_distance

示例#5

0

显示文件

文件： _03_02_median.py 项目： GodfatherThe/bioinf-algo-2015

def median(dnas, k):
    kmers = set()
    for dna in dnas:
        substr_kmers = set(["".join(x) for x in window(dna, k)])
        for kmer in substr_kmers:
            kmers.update(set(generate_words_with_mismatches(kmer, k)))
    opt_kmer = ''
    opt_distance = len(dnas)*k + 1
    for kmer in kmers:
        if opt_distance > d(kmer, dnas, k):
            opt_distance = d(kmer, dnas, k)
            opt_kmer = kmer
    return opt_kmer, opt_distance

示例#6

0

显示文件

文件： _07_04_longest_repeat.py 项目： GodfatherThe/bioinf-algo-2015

def repeat_subst(text):
    for k in range(len(text), 1, -1):
        for kmer in ["".join(x) for x in window(text, k)]:
            if len(list(find_all(kmer, text))) > 1:
                return kmer
    return None

示例#7

0

显示文件

文件： _01_08_approx_match.py 项目： GodfatherThe/bioinf-algo-2015

from _01_07_hamming_distance import hamming_distance
from _01_02_frequent_words import window


if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        pattern = f.readline().strip()
        text = f.readline().strip()
        d = int(f.readline())

    fragment_length = len(pattern)
    indexes = list()
    for i, fragment in enumerate(["".join(x) for x in window(text, fragment_length)]):
        if hamming_distance(fragment, pattern) <= d:
            indexes.append(i)

    with open('out.txt', 'w') as f:
        f.write(' '.join(map(str, indexes)))

示例#8

0

显示文件

文件： _07_06_shortest_substr.py 项目： okainov/bioinf-algo-2015

def common_subst(text1, text2):
    for k in range(1, min([len(text1), len(text2)])):
        for kmer in ["".join(x) for x in window(text1, k)]:
            if kmer not in text2:
                return kmer
    return None

示例#9

0

显示文件

from _01_07_hamming_distance import hamming_distance
from _01_02_frequent_words import window

if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        pattern = f.readline().strip()
        text = f.readline().strip()
        d = int(f.readline())

    fragment_length = len(pattern)
    indexes = list()
    for i, fragment in enumerate(
        ["".join(x) for x in window(text, fragment_length)]):
        if hamming_distance(fragment, pattern) <= d:
            indexes.append(i)

    with open('out.txt', 'w') as f:
        f.write(' '.join(map(str, indexes)))

示例#10

0

显示文件

文件： _01_10_most_freq_with_mismatches.py 项目： okainov/bioinf-algo-2015

    count_dict = dict()
    max_count = 0
    for kmer in kmers:
        app = approx_pattern_count(text, kmer, d)
        if app > 0:
            if kmer not in count_dict:
                count_dict[kmer] = 0
            count_dict[kmer] += app
            if count_dict[kmer] > max_count:
                max_count = count_dict[kmer]

    result = [key for key in count_dict if count_dict[key] == max_count]
    return result, max_count


if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        text = f.readline().strip()
        k, d = map(int, f.readline().split())

    substr_kmers = set(["".join(x) for x in window(text, k)])
    kmers = set()
    for kmer in substr_kmers:
        kmers.update(set(generate_words_with_mismatches(kmer, d)))

    result, max_count = frequent_words_with_mismatch(text, kmers, d)

    with open('out.txt', 'w') as f:
        f.write(str(' '.join(result)))

示例#11

0

显示文件

def get_kmers(s, k):
    return list(set(["".join(x) for x in window(s, k)]))

示例#12

0

显示文件

文件： _03_02_median.py 项目： GodfatherThe/bioinf-algo-2015

def distance(kmer, string, k):
    result = k+2
    for fragment in ["".join(x) for x in window(string, k)]:
        if hamming_distance(kmer, fragment) < result:
            result = hamming_distance(kmer, fragment)
    return result

示例#13

0

显示文件

import random
from _01_02_frequent_words import window
from _03_03_profile import profile_most_probable_kmer
from _03_04_greedy import profile_most_probable_kmer_swap, score, profile
from _03_05_pseudo import profile_with_pseudocounts

if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        k = int(f.readline())
        dna = f.readline().strip()

    substr_kmers = set(["".join(x) for x in window(dna, k)])
    result = sorted(substr_kmers)
    with open('out.txt', 'w') as f:
        f.write('\n'.join(sorted(substr_kmers)))

示例#14

0

显示文件

def repeat_subst(text):
    for k in range(len(text), 1, -1):
        for kmer in ["".join(x) for x in window(text, k)]:
            if len(list(find_all(kmer, text))) > 1:
                return kmer
    return None

示例#15

0

显示文件

文件： _04_01_composition.py 项目： GodfatherThe/bioinf-algo-2015

import random
from _01_02_frequent_words import window
from _03_03_profile import profile_most_probable_kmer
from _03_04_greedy import profile_most_probable_kmer_swap, score, profile
from _03_05_pseudo import profile_with_pseudocounts


if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        k = int(f.readline())
        dna = f.readline().strip()

    substr_kmers = set(["".join(x) for x in window(dna, k)])
    result = sorted(substr_kmers)
    with open('out.txt', 'w') as f:
        f.write('\n'.join(sorted(substr_kmers)))

示例#16

0

显示文件

def common_subst(text1, text2):
    for k in range(min([len(text1), len(text2)]), 1, -1):
        for kmer in ["".join(x) for x in window(text1, k)]:
            if kmer in text2:
                return kmer

示例#17

0

显示文件

文件： _01_11_most_freq_with_mismatches_rev.py 项目： GodfatherThe/bioinf-algo-2015

    max_count = 0
    visited_kmers = set()
    for kmer in kmers:
        app = approx_pattern_count(text, kmer, d) + approx_pattern_count(text, reverse_dna(kmer), d)
        if app > 0 and kmer not in visited_kmers:
            if kmer not in count_dict:
                count_dict[kmer] = 0
            count_dict[kmer] += app
            if count_dict[kmer] > max_count:
                max_count = count_dict[kmer]

    result = [key for key in count_dict if count_dict[key] == max_count]
    return result, max_count


if __name__ == '__main__':
    with open('in.txt', 'r') as f:
        text = f.readline().strip()
        k, d = map(int, f.readline().split())

    substr_kmers = set(["".join(x) for x in window(text, k)])
    kmers = set()
    for kmer in substr_kmers:
        kmers.update(set(generate_words_with_mismatches(kmer, d)))

    result, max_count = frequent_words_with_mismatch(text, kmers, d)

    with open('out.txt', 'w') as f:
        f.write(str(' '.join(result)))

示例#18

0

显示文件

def distance(kmer, string, k):
    result = k + 2
    for fragment in ["".join(x) for x in window(string, k)]:
        if hamming_distance(kmer, fragment) < result:
            result = hamming_distance(kmer, fragment)
    return result