Example #1
0
    print ""
    parser.print_help()
    sysexit()

################################################################################
# read input sequence files
################################################################################
input = readsequences(input)


################################################################################
# proces getorf data, input gff and confirm gene & unigene structure on Orfs
################################################################################
input = rungetorf(input)
input = parseinputgff(input)
input,gene_confirmation,unigene_confirmation = geneandunigeneconfirmation(input)


################################################################################
# do several sequence / annotation property checks
################################################################################
IS_REPETITIVE           = annotatedproteinsequencerepetitivenesscheck(input)
HAS_SMALL_OR_TINY_EXONS = annotatedgeneexonsizeevaluation(input)
HAS_N_SYMBOLS           = ntracksindnasequencecheck(input)
for org in input.keys():
    status,warnings = confirmcanonicalsplicesites(input[org]['genomeseq'],
        input[org]['gff-gene'],exon_fmethod=GFF_CDS_FMETHOD,verbose=False)
    input[org]['warnings'].extend(warnings)


################################################################################
Example #2
0
       sysExit()

    # change directory to the one specified by optparse option
    os.chdir(OPTIONS.DIRECTORY)

    try:
        locus = AbgpGeneLocusDirectory(OPTIONS.DIRECTORY)
        input = locus.toinputdict()
    except:
        print explain()
        sysExit()
        ## TEMPORARILY backwards-compatibility with old input_data_struct.txt file
        #input = eval(open('input_data_struct.txt').read().strip())

    # do geneandunigeneconfirmation
    input,gene_status,unigene_status = geneandunigeneconfirmation(input,verbose=False)

    if not OPTIONS.sequenceonly:
        # proces tcode data; no needed in `sequenceonly` output modus
        input = obtaintcodedata(input)

    for org in input.keys():

        if OPTIONS.verbose and not input[org]['gff-gene']:
            print "# No gene GFF data present in GeneLocusDirectory"
        if OPTIONS.verbose and not input[org]['gff-unigene']:
            print "# No unigene GFF data present in GeneLocusDirectory"

        # translate gene's exons to introns
        exons = []
        for gfftrack in input[org]['gff-gene']: