Ejemplos de EnsemblRelease.transcript_ids_of_gene_name en Python

Lenguaje de programación: Python

Namespace/Package Name: pyensembl

Clase / Tipo: EnsemblRelease

Método / Función: transcript_ids_of_gene_name

Ejemplos en hotexamples.com: 1

Python EnsemblRelease.transcript_ids_of_gene_name - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de pyensembl.EnsemblRelease.transcript_ids_of_gene_name extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

EnsemblRelease(30)

download(8)

index(8)

gene_names_at_locus(7)

transcript_by_id(6)

gene_by_id(6)

genes_by_name(3)

gene_ids_of_gene_name(3)

transcript_ids_of_gene_id(2)

transcript_ids(2)

genes_at_locus(2)

genes(2)

transcripts_by_name(2)

exon_ids_of_transcript_id(2)

exon_by_id(2)

cache_directory_path(1)

gene_names(1)

gene_name_of_gene_id(1)

gene_ids(1)

gene_id_of_protein_id(1)

exons_at_locus(1)

protein_sequence(1)

exon_ids_of_gene_name(1)

cached(1)

transcript_ids_of_gene_name(1)

gene_name_of_transcript_id(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: Ensembl.py Proyecto: superDross/GeneaPy

class ScrapeEnsembl():
    ''' 
    '''
    def __init__(self, query, hg_version):
        self.query = query.replace("chr","")
        self.hg_version = ScrapeEnsembl.genome.get(hg_version) # convert to ensembl release
        self.hg = EnsemblRelease(self.hg_version) # convert to ensembl release object

    
    genome = {"hg19": 75, "hg38": 83}
    
    def get_gene_info(self):
        ''' Get the gene information at a given genomic position
        '''
         
        # check if the input is a genomic position or genomic range
        if re.search(r"[-:]", self.query) and self.query.replace(":","").isdigit():

            chrom = int(self.query.split(":")[0])
            pos = int(self.query.split(":")[1])
            gene_name = self.hg.gene_names_at_locus(contig=chrom, position=pos)
            if not gene_name:
                msg = " ".join(("No gene found at",self.query,"for genome version",
                                str(self.hg_version)))
                return msg 
            
            gene_info = self.hg.genes_by_name(gene_name[0])
            # gene_info[0].loaction doesn't work, hence the mess below
            gene_location = str(gene_info[0]).split(",")[-1][:-1].split("=")[1]

            gene_info = (gene_info[0].name, gene_info[0].id, 
                         gene_info[0].biotype, gene_location)
            
            return(gene_info)
    
    
    def get_canonical_transcript(self, gene_name):
        ''' Determine and return the canonical transcript of the given gene
        '''
        all_transcripts = self.hg.transcript_ids_of_gene_name(gene_name)
        all_transcript_details = [self.hg.transcript_by_id(x) for x in all_transcripts]
        protein_coding_transcripts = []
        for x in all_transcript_details:
            split_transcript_info = re.split(r"[=,]",str(x))
            transcript = split_transcript_info[1]
            transcript_type = split_transcript_info[9]
            location = split_transcript_info[-1][:-1]
            start = re.split(r"[:-]", location)[1]
            stop = re.split(r"[:-]", location)[2]
            size = int(stop) - int(start)
            if transcript_type == "protein_coding":
                protein_coding_transcripts.append((size,transcript,transcript_type)) 
        
        # sort by size and return the largest protein coding transcript
        if protein_coding_transcripts:    
            canonical_transcript = sorted(protein_coding_transcripts)[-1][1]
            return canonical_transcript