Ejemplo n.º 1
0
def testIndelStatistics():
    listOfData = ioLib.readFromMummerOutput("ecoli536")
    listOfData = ioLib.filterData(listOfData)
    
    listOfData =ioLib.transformMummerOutput(listOfData) 
    listOfData = sorted(listOfData)
    
    listOfData= approximateRepeatLib.findApproximateIndelRepeatStatistics(listOfData, "oneLine.fasta","oneLine2.fasta")
    print listOfData
def batchGenerateApproximateRepeatStatIndel(genomeSource1,genomeSource2,mummerOutput,HDrange):
    arrayOfListOfData = []    
   
    listOfData = ioLib.readFromMummerOutput(mummerOutput)
    listOfData = sorted(listOfData,key = itemgetter(2))
    listOfData = ioLib.filterData(listOfData)    
    listOfData = ioLib.transformMummerOutput(listOfData)  

    arrayOfListOfData.append(listOfData)
    
    for index in range(1,HDrange):
        listOfData= approximateRepeatLib.findApproximateIndelRepeatStatistics(listOfData, "oneLine.fasta","oneLine2.fasta")
        listOfData = ioLib.filterData(listOfData)
        arrayOfListOfData.append(listOfData)
        temp = listOfData[len(listOfData)-1]
        print "Approx repeat indel"
        print listOfData[len(listOfData)-5:len(listOfData)-1]
        #checking(temp,genomeSource1,genomeSource2 )
        print listOfData[len(listOfData)-2:len(listOfData)]

    plotgraph(arrayOfListOfData, HDrange) 
Ejemplo n.º 3
0
def batchGenerateApproximateRepeatStatIndel(genomeSource1, genomeSource2,
                                            mummerOutput, HDrange):
    arrayOfListOfData = []

    listOfData = ioLib.readFromMummerOutput(mummerOutput)
    listOfData = sorted(listOfData, key=itemgetter(2))
    listOfData = ioLib.filterData(listOfData)
    listOfData = ioLib.transformMummerOutput(listOfData)

    arrayOfListOfData.append(listOfData)

    for index in range(1, HDrange):
        listOfData = approximateRepeatLib.findApproximateIndelRepeatStatistics(
            listOfData, "oneLine.fasta", "oneLine2.fasta")
        listOfData = ioLib.filterData(listOfData)
        arrayOfListOfData.append(listOfData)
        temp = listOfData[len(listOfData) - 1]
        print "Approx repeat indel"
        print listOfData[len(listOfData) - 5:len(listOfData) - 1]
        #checking(temp,genomeSource1,genomeSource2 )
        print listOfData[len(listOfData) - 2:len(listOfData)]

    plotgraph(arrayOfListOfData, HDrange)