Python MRWordCount.HADOOP_OUTPUT_FORMAT примеры использования

Язык программирования: Python

Пространство имен/Пакет: tests.mr_word_count

Класс/Тип: MRWordCount

Метод/Функция: HADOOP_OUTPUT_FORMAT

Примеров на hotexamples.com: 5

Python MRWordCount.HADOOP_OUTPUT_FORMAT - 5 примеров найдено. Это лучшие примеры Python кода для tests.mr_word_count.MRWordCount.HADOOP_OUTPUT_FORMAT, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

make_runner(30)

sandbox(18)

MRWordCount(11)

HADOOP_INPUT_FORMAT(2)

HADOOP_OUTPUT_FORMAT(2)

parse_output(2)

JOBCONF(1)

parse_output_line(1)

Пример #1

Показать файл

Файл: test_runner.py Проект: ENuge/mrjob

    def test_hadoop_extra_args_comes_first(self):
        job = MRWordCount(
            ['--cmdenv', 'FOO=bar',
             '--hadoop-arg', '-libjar', '--hadoop-arg', 'qux.jar',
             '--jobconf', 'baz=qux',
             '--partitioner', 'java.lang.Object'])
        job.HADOOP_INPUT_FORMAT = 'FooInputFormat'
        job.HADOOP_OUTPUT_FORMAT = 'BarOutputFormat'

        with job.make_runner() as runner:
            hadoop_args = runner._hadoop_args_for_step(0)
            self.assertEqual(hadoop_args[:2], ['-libjar', 'qux.jar'])
            self.assertEqual(len(hadoop_args), 12)

Пример #2

Показать файл

    def test_hadoop_extra_args_comes_first(self):
        job = MRWordCount([
            '--cmdenv', 'FOO=bar', '--hadoop-arg', '-libjar', '--hadoop-arg',
            'qux.jar', '--jobconf', 'baz=qux', '--partitioner',
            'java.lang.Object'
        ])
        job.HADOOP_INPUT_FORMAT = 'FooInputFormat'
        job.HADOOP_OUTPUT_FORMAT = 'BarOutputFormat'

        with job.make_runner() as runner:
            hadoop_args = runner._hadoop_args_for_step(0)
            self.assertEqual(hadoop_args[:2], ['-libjar', 'qux.jar'])
            self.assertEqual(len(hadoop_args), 12)

Пример #3

Показать файл

Файл: test_runner.py Проект: irskep/mrjob

    def test_hadoop_output_format(self):
        output_format = "org.apache.hadoop.mapred.SequenceFileOutputFormat"

        # one-step job
        job1 = MRWordCount()
        # no cmd-line argument for this because it's part of job semantics
        job1.HADOOP_OUTPUT_FORMAT = output_format
        with job1.make_runner() as runner1:
            self.assertEqual(runner1._hadoop_args_for_step(0), ["-outputformat", output_format])

        # multi-step job: only use -outputformat on the last step
        job2 = MRTwoStepJob()
        job2.HADOOP_OUTPUT_FORMAT = output_format
        with job2.make_runner() as runner2:
            self.assertEqual(runner2._hadoop_args_for_step(0), [])
            self.assertEqual(runner2._hadoop_args_for_step(1), ["-outputformat", output_format])

Пример #4

Показать файл

    def test_hadoop_output_format(self):
        output_format = 'org.apache.hadoop.mapred.SequenceFileOutputFormat'

        # one-step job
        job1 = MRWordCount()
        # no cmd-line argument for this because it's part of job semantics
        job1.HADOOP_OUTPUT_FORMAT = output_format
        with job1.make_runner() as runner1:
            self.assertEqual(runner1._hadoop_args_for_step(0),
                             ['-outputformat', output_format])

        # multi-step job: only use -outputformat on the last step
        job2 = MRTwoStepJob()
        job2.HADOOP_OUTPUT_FORMAT = output_format
        with job2.make_runner() as runner2:
            self.assertEqual(runner2._hadoop_args_for_step(0), [])
            self.assertEqual(runner2._hadoop_args_for_step(1),
                             ['-outputformat', output_format])

Пример #5

Показать файл

Файл: test_runner.py Проект: irskep/mrjob

    def test_hadoop_extra_args_comes_first(self):
        job = MRWordCount(
            [
                "--cmdenv",
                "FOO=bar",
                "--hadoop-arg",
                "-libjar",
                "--hadoop-arg",
                "qux.jar",
                "--jobconf",
                "baz=qux",
                "--partitioner",
                "java.lang.Object",
            ]
        )
        job.HADOOP_INPUT_FORMAT = "FooInputFormat"
        job.HADOOP_OUTPUT_FORMAT = "BarOutputFormat"

        with job.make_runner() as runner:
            hadoop_args = runner._hadoop_args_for_step(0)
            self.assertEqual(hadoop_args[:2], ["-libjar", "qux.jar"])
            self.assertEqual(len(hadoop_args), 12)