Python LlamaEnsembl.get_gene_pos 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: biollama.core.annotation

클래스/타입: LlamaEnsembl

메소드/함수: get_gene_pos

hotexamples.com에서의 예제들: 2

Python LlamaEnsembl.get_gene_pos - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 biollama.core.annotation.LlamaEnsembl.get_gene_pos에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

LlamaEnsembl(7)

annotate_dataframe(3)

get_gene_pos(2)

annotate_variants(1)

get_cds_region(1)

예제 #1

파일 보기

def annotate(df, cols):
    """ get longest transcript for gene column or regions """
    def get_regions(row, cols):
        prefix = '' if row[cols[0]].startswith('chr') else 'chr'
        return "{}{}:{}-{}".format(prefix, row[cols[0]], row[cols[1]],
                                   row[cols[2]])

    llama = LlamaEnsembl()
    ucsc = UCSCapi()
    dd = {'query': [], 'transcripts': []}
    if len(cols) == 1:
        genes = df[cols[0]].values
        for gene in genes:
            chrom, start, end = llama.get_gene_pos(gene)
            res = ucsc.query("chr{}:{}-{}".format(chrom, start, end))
            dd['query'].append(gene)
            dd['transcripts'].append(res.longest(gene)['transcript'])
            mergecol = cols[0]
    elif len(cols) == 3:
        dd['genes'] = []
        df['region'] = df.apply(get_regions, axis=1, args=[cols])
        regions = df['region'].values
        for region in regions:
            res = ucsc.query(region)
            for gene in res.genes():
                dd['genes'].append(gene)
                dd['query'].append(region)
                dd['transcripts'].append(res.longest(gene)['transcript'])
                mergecol = 'region'
    ndf = df.merge(pd.DataFrame(dd),
                   left_on=mergecol,
                   right_on='query',
                   how='outer')
    return ndf[~ndf.duplicated()]

예제 #2

파일 보기

def test_gene_transcripts():
    llama = LlamaEnsembl()
    ucsc = UCSCapi()
    gene = 'BRCA1'
    chrom, start, end = llama.get_gene_pos(gene)
    res = ucsc.query("chr{}:{}-{}".format(chrom, start, end))
    transcript = res.longest(gene)
    print(transcript['transcript'])