Python TsvFileSorterの例、oncotator.utils.TsvFileSorter.TsvFileSorter Pythonの例

コード例 #1

0

ファイルを表示

ファイル: TsvFileSorterTest.py プロジェクト: Tmacme/oncotator

    def testSortFileWithSpaces(self):
        """
        Tests sorting a file with spaces in the headers on the filesystem.
        """
        inputFilename = os.path.join(*["testdata", "small_cosmic_with_gp_and_gpp", "small_cosmic_trimmed_for_sorting.txt.tbi.byAA"])
        outputFilename = os.path.join("out", "small_cosmic_trimmed_for_sorting.txt.byAA.sorted.tsv")
        tsvFileSorter = TsvFileSorter(inputFilename)
        func = lambda val: ((val["Gene name"]).lower(), int(val["startAA"]), int(val["endAA"]))
        tsvFileSorter.sortFile(outputFilename, func)

        self.assertTrue(os.path.exists(outputFilename), "No file was generated.")

コード例 #2

0

ファイルを表示

ファイル: TsvFileSorterTest.py プロジェクト: Tmacme/oncotator

    def testSortFile(self):
        """
        Tests sorting a file on the filesystem.
        """
        inputFilename = os.path.join(*["testdata", "small_cosmic_gpp", "small_cosmic_gpp.tempForSorting.tsv"])
        outputFilename = os.path.join("out", "small_cosmic_gpp.tempForSorting.out.tsv")
        tsvFileSorter = TsvFileSorter(inputFilename)
        func = lambda val: ((val["Gene_name"]).lower(), int(val["startAA"]), int(val["endAA"]))
        tsvFileSorter.sortFile(outputFilename, func)

        self.assertTrue(os.path.exists(outputFilename), "No file was generated.")

コード例 #3

0

ファイルを表示

ファイル: TsvFileSorterTest.py プロジェクト: Tmacme/oncotator

 def testCallbackExceptionIncorrectType(self):
     """
     Tests that the CallbackException is raised when the input anonymous function does not return a tuple given a
     row.
     """
     inputFilename = os.path.join(*["testdata", "sort_mixed_caps_tsv", "sort_mixed_caps.tsv"])
     outputFilename = os.path.join("out", "multiple_partitions_sort_mixed_caps.tsv.sorted.out.tsv")
     tsvFileSorter = TsvFileSorter(inputFilename)
     func = lambda val: (val["Gene name"]).lower()
     try:
         tsvFileSorter.sortFile(outputFilename, func, 3)
     except CallbackException as msg:
         self.assertTrue(msg.value == "The value returned by the callback must be a tuple. Instead, a value of "
                                      "<type 'str'> was returned.", "Error msg is different.")

コード例 #4

0

ファイルを表示

ファイル: OutputDataManager.py プロジェクト: alexramos/oncotator

    def getSortedTsvFilename(self, path):
        """


        :param path:
        :return:
        """
        chrom2HashCode = MutUtils.createChrom2HashCodeTable(self.chroms)
        tsvFileSorter = TsvFileSorter(self.filename)
        sortedTempTsvFile = tempfile.NamedTemporaryFile(dir=path, delete=False)
        func = lambda val: (chrom2HashCode[val["chr"]], int(val["start"]), val["alt_allele"])
        tsvFileSorter.sortFile(sortedTempTsvFile.name, func)
        os.remove(self.filename)

        return sortedTempTsvFile.name

コード例 #5

0

ファイルを表示

    def getSortedTsvFilename(self, path):
        """


        :param path:
        :return:
        """
        chrom2HashCode = MutUtils.createChrom2HashCodeTable(self.chroms)
        tsvFileSorter = TsvFileSorter(self.filename)
        sortedTempTsvFile = tempfile.NamedTemporaryFile(dir=path, delete=False)
        func = lambda val: (chrom2HashCode[val["chr"]], int(val["start"]), val["alt_allele"])
        self.logger.debug("Sorting tmp tsv %s->%s", self.filename, sortedTempTsvFile.name)
        tsvFileSorter.sortFile(sortedTempTsvFile.name, func)
        os.remove(self.filename)

        return sortedTempTsvFile.name

コード例 #6

0

ファイルを表示

ファイル: TsvFileSorterTest.py プロジェクト: Tmacme/oncotator

    def testSortMixedCaps(self):
        """
        Tests sorting a file with mixed capitalization in the reference column.
        """
        inputFilename = os.path.join(*["testdata", "sort_mixed_caps_tsv", "sort_mixed_caps.tsv"])
        outputFilename = os.path.join("out", "sort_mixed_caps.tsv.sorted.out.tsv")
        tsvFileSorter = TsvFileSorter(inputFilename)
        func = lambda val: ((val["Gene name"]).lower(), int(val["startAA"]), int(val["endAA"]))
        tsvFileSorter.sortFile(outputFilename, func)

        self.assertTrue(os.path.exists(outputFilename), "No file was generated.")

        guessmd5 = hashlib.md5(file(outputFilename, 'r').read()).hexdigest()
        gtmd5 = hashlib.md5(file(os.path.join(*["testdata", "sort_mixed_caps_tsv", "sort_mixed_caps_sorted.tsv"]),
                                 "r").read()).hexdigest()
        self.assertTrue(guessmd5 == gtmd5)

コード例 #7

0

ファイルを表示

ファイル: TsvFileSorterTest.py プロジェクト: Tmacme/oncotator

    def testMultiplePartitionSorting(self):
        """
        Tests that the sorting works when the partition size is small and input file must be broken into multiple
        partitions.
        """
        inputFilename = os.path.join(*["testdata", "sort_mixed_caps_tsv", "sort_mixed_caps.tsv"])
        outputFilename = os.path.join("out", "multiple_partitions_sort_mixed_caps.tsv.sorted.out.tsv")
        tsvFileSorter = TsvFileSorter(inputFilename)
        func = lambda val: ((val["Gene name"]).lower(), int(val["startAA"]), int(val["endAA"]))
        tsvFileSorter.sortFile(outputFilename, func, 3)
        self.assertTrue(os.path.exists(outputFilename), "No file was generated.")

        guessmd5 = hashlib.md5(file(outputFilename, "r").read()).hexdigest()
        gtmd5 = hashlib.md5(file(os.path.join(*["testdata", "sort_mixed_caps_tsv", "sort_mixed_caps_sorted.tsv"]),
                                 "r").read()).hexdigest()
        self.assertTrue(guessmd5 == gtmd5)

コード例 #8

0

ファイルを表示