print "" parser.print_help() sysexit() ################################################################################ # read input sequence files ################################################################################ input = readsequences(input) ################################################################################ # proces getorf data, input gff and confirm gene & unigene structure on Orfs ################################################################################ input = rungetorf(input) input = parseinputgff(input) input,gene_confirmation,unigene_confirmation = geneandunigeneconfirmation(input) ################################################################################ # do several sequence / annotation property checks ################################################################################ IS_REPETITIVE = annotatedproteinsequencerepetitivenesscheck(input) HAS_SMALL_OR_TINY_EXONS = annotatedgeneexonsizeevaluation(input) HAS_N_SYMBOLS = ntracksindnasequencecheck(input) for org in input.keys(): status,warnings = confirmcanonicalsplicesites(input[org]['genomeseq'], input[org]['gff-gene'],exon_fmethod=GFF_CDS_FMETHOD,verbose=False) input[org]['warnings'].extend(warnings) ################################################################################
sysExit() # change directory to the one specified by optparse option os.chdir(OPTIONS.DIRECTORY) try: locus = AbgpGeneLocusDirectory(OPTIONS.DIRECTORY) input = locus.toinputdict() except: print explain() sysExit() ## TEMPORARILY backwards-compatibility with old input_data_struct.txt file #input = eval(open('input_data_struct.txt').read().strip()) # do geneandunigeneconfirmation input,gene_status,unigene_status = geneandunigeneconfirmation(input,verbose=False) if not OPTIONS.sequenceonly: # proces tcode data; no needed in `sequenceonly` output modus input = obtaintcodedata(input) for org in input.keys(): if OPTIONS.verbose and not input[org]['gff-gene']: print "# No gene GFF data present in GeneLocusDirectory" if OPTIONS.verbose and not input[org]['gff-unigene']: print "# No unigene GFF data present in GeneLocusDirectory" # translate gene's exons to introns exons = [] for gfftrack in input[org]['gff-gene']: