Python MultipleSeqAlignment.get_alignment_length 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: Bio.AlignIO

클래스/타입: MultipleSeqAlignment

메소드/함수: get_alignment_length

hotexamples.com에서의 예제들: 2

Python MultipleSeqAlignment.get_alignment_length - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 Bio.AlignIO.MultipleSeqAlignment.get_alignment_length에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MultipleSeqAlignment(26)

append(2)

format(1)

get_alignment_length(1)

sort(1)

예제 #1

파일 보기

파일: __init__.py 프로젝트: shuichiro-makigaki/agora

 def _aligned_number(self, aln: MultipleSeqAlignment):
     return len([
         i for i in range(aln.get_alignment_length())
         if '-' not in aln[:, i]
     ])

예제 #2

파일 보기

파일: sampler.py 프로젝트: ericmjl/polymorphism-sampler

class PolymorphismSampler(object):
    """docstring for PolymorphismSampler"""
    def __init__(self):
        super(PolymorphismSampler, self).__init__()
        self.sequences = None
        self.alignment = None
        self.polymorphisms = dict()
        self.subsampled = set()
        self.num_positions = []
        self.num_polymorphisms = []
        
    def read_sequences(self, handle):
        sequences = [s for s in SeqIO.parse(handle, 'fasta')]

        counts = Counter([len(s) for s in sequences])
        mc_length = counts.most_common(1)[0][0]
        
        filtered_sequences = list()
        for s in sequences:
            if len(s.seq) == mc_length:
                filtered_sequences.append(s)
        self.sequences = filtered_sequences

    def identify_polymorphisms(self):

        self.alignment = MultipleSeqAlignment(self.sequences)
        for col in range(self.alignment.get_alignment_length()):
            polmorphs = set(self.alignment[:,col])
            if len(polmorphs) > 1:
                self.polymorphisms[col] = polmorphs

    def number_of_polymorphisms(self):
        total_polymorphisms = 0
        for pos, polymorphs in self.polymorphisms.items():
            total_polymorphisms += len(polymorphs)

        return total_polymorphisms

    def subsample(self):
        while len(self.polymorphisms.keys()) > 0:
            try:

                # Choose a seqrecord at random, based on LH sampling criteria.
                pos = choice(list(self.polymorphisms.keys()))
                letter = choice(list(self.polymorphisms[pos]))
                filtered = MultipleSeqAlignment([s for s in self.alignment if s[pos] == letter])
                seqrecord = choice(filtered)
                self.subsampled.add(seqrecord)

                # Remove polymorphisms
                for pos in self.polymorphisms.keys():
                    if seqrecord.seq[pos] in self.polymorphisms[pos]:
                        self.polymorphisms[pos].remove(seqrecord.seq[pos])

                # Update data
                self.polymorphisms = {k:v for k,v in self.polymorphisms.items() if len(v) > 0}
                self.num_polymorphisms.append(self.number_of_polymorphisms())
                self.num_positions.append(len(self.polymorphisms.keys()))

            except IndexError:
                break