Python BlastProcessor示例

编程语言: Python

命名空间/包名称: blastplus

类/类型: BlastProcessor

hotexamples.com的示例: 2

Python BlastProcessor - 已找到2个示例。这些是从开源项目中提取的最受好评的blastplus.BlastProcessor现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

top_hits(1)

uniq_hits(1)

示例#1

显示文件

文件： 03-export_top_blastp_hits.py 项目： omsai/t3ss-project

#!/usr/bin/env python
'''Read and process blastp output file.'''

from blastplus import BlastProcessor, BLASTP_OUTPUT_FILE

bp = BlastProcessor(BLASTP_OUTPUT_FILE)

# Write the subject ids to disk for sequence retrieval
bp.uniq_hits().to_csv('../data/analyze-output/subject_ids.ref',
                      header=False, index=False)

示例#2

显示文件

文件： 05-concatenate_homologous_and_top_hit_sequence_files.py 项目： omsai/t3ss-project

for query_file in query_files:
    with open(query_file, 'rU') as f:
        query_ids = []
        for line in f.xreadlines():
            if line[0] == COMMENT:
                query_ids += [line[1:-1]] # Leave out newline character
    filenames = len(query_ids) * [os.path.basename(query_file)]
    df_query = pd.DataFrame({
        'filename': filenames,
        'query id': query_ids,
    })
    df_queries = df_queries.append(df_query)
df_queries = df_queries.reset_index()

# Create DataFrame of blast results
bp = BlastProcessor(BLASTP_OUTPUT_FILE)
df_blast_results = bp.top_hits()

# Merge the DataFrames to get the filename and blast hits
df = pd.merge(df_queries, df_blast_results)
df = df[['filename', 'subject id']]
mask_dups = df.duplicated()
df = df[~mask_dups]             # Get unique values

# Concatenate the query and subject sequences into the alignment files
for query_filename, group in df.groupby('filename'):
    query_file = os.path.join(QUERY_DIR, query_filename)
    align_filename = os.path.splitext(query_filename)[0] + '.cat.faa'
    align_file = os.path.join(ALIGN_DIR, align_filename)
    with open(query_file, 'rU') as f:
        query = f.readlines()