Python count_genes 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: gff_parser

메소드/함수: count_genes

hotexamples.com에서의 예제들: 3

Python count_genes - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 gff_parser.count_genes에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: gff+top2-to-rep_gff-single.py 프로젝트: gsc0107/HTseq-toolbox

filename_gff = sys.argv[1]
filename_top2 = sys.argv[2]

filename_base = filename_gff.replace('_gff','').replace('.gff','')

total_gene_count = dict()

gff = dict()
data_list = [filename_base]
if( not os.access(filename_gff, os.R_OK) ):
    sys.stderr.write('%s is not available.\n'%filename_gff)
    sys.exit(1)
gff[filename_base] = gff_parser.read_gmap_gff(filename_gff)

count_scaffolds = len(gff[filename_base].keys())
count_genes = gff_parser.count_genes(gff[filename_base])
total_gene_count[filename_base] = count_genes
sys.stderr.write('%s -> %s: %d scaffolds, %d genes\n'%(filename_gff, filename_base, count_scaffolds, count_genes))

best_cov_gff = dict()
best_cov_gff[filename_base] = gff_parser.filter_top2(gff[filename_base],filename_top2)

f_rep = open('%s_rep.gff'%filename_base,'w')
f_multi = open('%s_multi.gff'%filename_base,'w')
f_log = open('%s_log.gff'%filename_base,'w')

gene2data = dict()
t_range_list = dict()
gff_new = dict()
for tmp_data in data_list:
    for tmp_t_id in best_cov_gff[tmp_data].keys():

예제 #2

파일 보기

            gene_list.append(tmp_gid)
    return len(set(gene_list))


total_gene_count = dict()
gff = dict()
data_list = []
f_list = open(filename_list, 'r')
for line in f_list:
    (tmp_dataname, tmp_filename) = line.strip().split()
    if (not os.access(tmp_filename, os.R_OK)):
        sys.stderr.write('%s is not available.\n' % tmp_filename)
        continue
    gff[tmp_dataname] = gff_parser.read_gff(tmp_filename)
    data_list.append(tmp_dataname)
    total_gene_count[tmp_dataname] = gff_parser.count_genes(gff[tmp_dataname])
    sys.stderr.write('%s -> %s: %d scaffolds, %d genes\n' %
                     (tmp_filename, tmp_dataname, len(
                         gff[tmp_dataname]), total_gene_count[tmp_dataname]))
f_list.close()
sys.exit(1)

if (len(data_list) == 0):
    sys.stderr.write('No input data. Exit.\n')
    sys.exit(1)

f_rep = open('%s_rep.gff' % filename_base, 'w')
f_multi = open('%s_multi.gff' % filename_base, 'w')
f_log = open('%s_log.gff' % filename_base, 'w')

gene_tlen = dict()

예제 #3

파일 보기

파일: make-rep_gff-multi.py 프로젝트: CarmenGarrido/HTseq-toolbox

        for tmp_gid in tmp_gff[tmp_tid].keys():
            gene_list.append(tmp_gid)
    return len(set(gene_list))

total_gene_count = dict()
gff = dict()
data_list = []
f_list = open(filename_list,'r')
for line in f_list:
    (tmp_dataname, tmp_filename) = line.strip().split()
    if( not os.access(tmp_filename, os.R_OK) ):
        sys.stderr.write('%s is not available.\n'%tmp_filename)
        continue
    gff[tmp_dataname] = gff_parser.read_gff(tmp_filename)
    data_list.append(tmp_dataname)
    total_gene_count[tmp_dataname] = gff_parser.count_genes(gff[tmp_dataname])
    sys.stderr.write('%s -> %s: %d scaffolds, %d genes\n'%(tmp_filename, tmp_dataname,len(gff[tmp_dataname]), total_gene_count[tmp_dataname]))
f_list.close()
sys.exit(1)

if( len(data_list) == 0 ):
    sys.stderr.write('No input data. Exit.\n')
    sys.exit(1)

f_rep = open('%s_rep.gff'%filename_base,'w')
f_multi = open('%s_multi.gff'%filename_base,'w')
f_log = open('%s_log.gff'%filename_base,'w')

gene_tlen = dict()
gff_new = dict()
for tmp_data in data_list: