Esempi in Python per MRSortAndGroup

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: tests.mr_sort_and_group

Classe/tipologia: MRSortAndGroup

Esempi su hotexamples.com: 11

MRSortAndGroup in Python: 11 esempi trovati. Questi sono i migliori esempi reali in Python per tests.mr_sort_and_group.MRSortAndGroup, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

MRSortAndGroup(6)

make_runner(5)

parse_output(5)

sandbox(5)

mr_job_script(1)

Esempio n. 1

Mostra file

File: test_runner.py Progetto: Affirm/mrjob

    def test_sort_values(self):
        job = MRSortAndGroup(['-r', 'spark'])
        job.sandbox(stdin=BytesIO(
            b'alligator\nactuary\nbowling\nartichoke\nballoon\nbaby\n'))

        with job.make_runner() as runner:
            runner.run()

            self.assertEqual(
                dict(job.parse_output(runner.cat_output())),
                dict(a=['actuary', 'alligator', 'artichoke'],
                     b=['baby', 'balloon', 'bowling']))

Esempio n. 2

Mostra file

File: test_sim.py Progetto: okomestudio/mrjob

    def test_sort_values(self):
        job = MRSortAndGroup(['-r', self.RUNNER])
        job.sandbox(stdin=BytesIO(self._INPUT))

        with job.make_runner() as runner:
            runner.run()
            output = list(job.parse_output(runner.cat_output()))

            self.assertEqual(
                sorted(output),
                [('a', ['actuary', 'alligator', 'artichoke']),
                 ('b', ['baby', 'balloon', 'bowling'])])

Esempio n. 3

Mostra file

File: test_sim.py Progetto: okomestudio/mrjob

    def test_sorting_is_case_sensitive(self):
        job = MRSortAndGroup(['-r', self.RUNNER])
        job.sandbox(stdin=BytesIO(b'Aaron\naardvark\nABC\n'))

        with job.make_runner() as runner:
            runner.run()
            output = list(job.parse_output(runner.cat_output()))

            self.assertEqual(
                sorted(output),
                [('A', ['ABC', 'Aaron']),
                 ('a', ['aardvark'])])

Esempio n. 4

Mostra file

File: test_local.py Progetto: Affirm/mrjob

    def test_custom_sort_bin_overrides_sort_values(self):
        # this breaks SORT_VALUES; see #1699 for a fix
        job = MRSortAndGroup(['-r', 'local', '--sort-bin', 'sort -r'])
        job.sandbox(stdin=BytesIO(
            b'apples\nbabies\nbuffaloes\nbears\nbicycles'))

        with job.make_runner() as runner:
            runner.run()

            self.assertEqual(
                sorted(job.parse_output(runner.cat_output())),
                [('a', ['apples']),
                 ('b', ['buffaloes', 'bicycles', 'bears', 'babies'])])

        self.assertTrue(self.check_call.called)
        self.assertFalse(self._sort_lines_in_memory.called)

        sort_args = self.check_call.call_args[0][0]

        self.assertEqual(sort_args[:2], ['sort', '-r'])

Esempio n. 5

Mostra file

File: test_local.py Progetto: Affirm/mrjob

    def test_default_sort_bin_sort_values(self):
        job = MRSortAndGroup(['-r', 'local'])
        job.sandbox(stdin=BytesIO(
            b'apples\nbuffaloes\nbears'))

        with job.make_runner() as runner:
            runner.run()

            self.assertEqual(
                sorted(job.parse_output(runner.cat_output())),
                [('a', ['apples']), ('b', ['bears', 'buffaloes'])])

        self.assertTrue(self.check_call.called)
        self.assertFalse(self._sort_lines_in_memory.called)

        sort_args = self.check_call.call_args[0][0]

        self.assertEqual(sort_args[:1], ['sort'])
        self.assertNotEqual(sort_args[:6],
                            ['sort', '-t', '\t', '-k', '1,1', '-s'])

Esempio n. 6

Mostra file

    def test_ignore_format_and_sort_kwargs(self):
        # hadoop formats and SORT_VALUES are read directly from the job,
        # so the runner's constructor ignores the corresponding kwargs
        #
        # see #2022

        # same set up as test_sort_values(), above
        runner = SparkMRJobRunner(
            mr_job_script=MRSortAndGroup.mr_job_script(),
            mrjob_cls=MRSortAndGroup,
            stdin=BytesIO(
                b'alligator\nactuary\nbowling\nartichoke\nballoon\nbaby\n'),
            hadoop_input_format='TerribleInputFormat',
            hadoop_output_format='AwfulOutputFormat',
            sort_values=False)

        runner.run()

        self.assertEqual(
            dict(MRSortAndGroup().parse_output(runner.cat_output())),
            dict(a=['actuary', 'alligator', 'artichoke'],
                 b=['baby', 'balloon', 'bowling']))

Esempio n. 7

Mostra file

File: test_sim.py Progetto: Streaky75/mrjob

    def test_sorting_is_case_sensitive(self):
        job = MRSortAndGroup(['-r', self.RUNNER])
        job.sandbox(stdin=BytesIO(b'Aaron\naardvark\nABC\n'))

        with job.make_runner() as runner:
            runner.run()
            output = list(job.parse_output(runner.cat_output()))

            self.assertEqual(sorted(output), [('A', ['ABC', 'Aaron']),
                                              ('a', ['aardvark'])])

Esempio n. 8

Mostra file

File: test_sim.py Progetto: Streaky75/mrjob

    def test_sort_values(self):
        job = MRSortAndGroup(['-r', self.RUNNER])
        job.sandbox(stdin=BytesIO(self._INPUT))

        with job.make_runner() as runner:
            runner.run()
            output = list(job.parse_output(runner.cat_output()))

            self.assertEqual(sorted(output),
                             [('a', ['actuary', 'alligator', 'artichoke']),
                              ('b', ['baby', 'balloon', 'bowling'])])

Esempio n. 9

Mostra file

    def test_sort_values(self):
        job = MRSortAndGroup(['-r', 'spark'])
        job.sandbox(stdin=BytesIO(
            b'alligator\nactuary\nbowling\nartichoke\nballoon\nbaby\n'))

        with job.make_runner() as runner:
            runner.run()

            self.assertEqual(
                dict(job.parse_output(runner.cat_output())),
                dict(a=['actuary', 'alligator', 'artichoke'],
                     b=['baby', 'balloon', 'bowling']))

Esempio n. 10

Mostra file

    def test_default_sort_bin_sort_values(self):
        job = MRSortAndGroup(['-r', 'local'])
        job.sandbox(stdin=BytesIO(b'apples\nbuffaloes\nbears'))

        with job.make_runner() as runner:
            runner.run()

            self.assertEqual(sorted(job.parse_output(runner.cat_output())),
                             [('a', ['apples']),
                              ('b', ['bears', 'buffaloes'])])

        self.assertTrue(self.check_call.called)
        self.assertFalse(self._sort_lines_in_memory.called)

        sort_args = self.check_call.call_args[0][0]

        self.assertEqual(sort_args[:1], ['sort'])
        self.assertNotEqual(sort_args[:6],
                            ['sort', '-t', '\t', '-k', '1,1', '-s'])

Esempio n. 11

Mostra file

    def test_custom_sort_bin_overrides_sort_values(self):
        # this breaks SORT_VALUES; see #1699 for a fix
        job = MRSortAndGroup(['-r', 'local', '--sort-bin', 'sort -r'])
        job.sandbox(
            stdin=BytesIO(b'apples\nbabies\nbuffaloes\nbears\nbicycles'))

        with job.make_runner() as runner:
            runner.run()

            self.assertEqual(
                sorted(job.parse_output(runner.cat_output())),
                [('a', ['apples']),
                 ('b', ['buffaloes', 'bicycles', 'bears', 'babies'])])

        self.assertTrue(self.check_call.called)
        self.assertFalse(self._sort_lines_in_memory.called)

        sort_args = self.check_call.call_args[0][0]

        self.assertEqual(sort_args[:2], ['sort', '-r'])