Python split_fasta示例

编程语言: Python

命名空间/包名称: fastaparse

方法/功能: split_fasta

hotexamples.com的示例: 2

Python split_fasta - 已找到2个示例。这些是从开源项目中提取的最受好评的fastaparse.split_fasta现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： pep4mrna.py 项目： ivan-krukov/kipple

def trim_ambiguous_nucleotides (sequence):
	return ambiguous_pattern.sub("",sequence)

def longest_ORF (sequence):
	open_reading_frames = orf_pattern.findall(sequence);
	
	if open_reading_frames:
		#trim M and X
		return max(open_reading_frames,key=len)[1:-1]
	else:
		return ""

if __name__=="__main__":
	parser = argparse.ArgumentParser(__doc__)
	parser.add_argument("input_file",type=str,help="Target fasta file")
	args = parser.parse_args()

	sequences = (seq for seq in split_fasta(args.input_file))

	for seq in sequences:
		data = trim_ambiguous_nucleotides(seq.data.lower())
		header = seq.header
		#keep track of longest ORF for each of 3 forward frames
		peptides = []
		for translation in forward_frame_translate(data):
			peptides.append(longest_ORF(translation))
		print header
		print max(peptides,key=len)

示例#2

显示文件

文件： fasta_grab.py 项目： ivan-krukov/kipple

"""
Given a fasta reference, only print requested sequences (search by identifiers)
"""

import argparse
import fastaparse

parser = argparse.ArgumentParser()

parser.add_argument("reference_file",type=str,help="Reference fasta database")
parser.add_argument("id_file",type=str,help="File containing references to sequences")
args = parser.parse_args()

sequences = fastaparse.split_fasta(args.reference_file)

results = list()

for seq_id in open(args.id_file):
	for seq in sequences:
		if seq_id.strip() in seq.header:
			results.append(seq.fasta())

for seq in results:
	print seq