Ejemplos de MRWordCount.HADOOP_INPUT_FORMAT en Python

Lenguaje de programación: Python

Namespace/Package Name: tests.mr_word_count

Clase / Tipo: MRWordCount

Método / Función: HADOOP_INPUT_FORMAT

Ejemplos en hotexamples.com: 5

Python MRWordCount.HADOOP_INPUT_FORMAT - 5 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de tests.mr_word_count.MRWordCount.HADOOP_INPUT_FORMAT extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

make_runner(30)

sandbox(18)

MRWordCount(11)

HADOOP_INPUT_FORMAT(2)

HADOOP_OUTPUT_FORMAT(2)

parse_output(2)

JOBCONF(1)

parse_output_line(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: test_runner.py Proyecto: ENuge/mrjob

    def test_hadoop_extra_args_comes_first(self):
        job = MRWordCount(
            ['--cmdenv', 'FOO=bar',
             '--hadoop-arg', '-libjar', '--hadoop-arg', 'qux.jar',
             '--jobconf', 'baz=qux',
             '--partitioner', 'java.lang.Object'])
        job.HADOOP_INPUT_FORMAT = 'FooInputFormat'
        job.HADOOP_OUTPUT_FORMAT = 'BarOutputFormat'

        with job.make_runner() as runner:
            hadoop_args = runner._hadoop_args_for_step(0)
            self.assertEqual(hadoop_args[:2], ['-libjar', 'qux.jar'])
            self.assertEqual(len(hadoop_args), 12)

Ejemplo n.º 2

Mostrar archivo

    def test_hadoop_extra_args_comes_first(self):
        job = MRWordCount([
            '--cmdenv', 'FOO=bar', '--hadoop-arg', '-libjar', '--hadoop-arg',
            'qux.jar', '--jobconf', 'baz=qux', '--partitioner',
            'java.lang.Object'
        ])
        job.HADOOP_INPUT_FORMAT = 'FooInputFormat'
        job.HADOOP_OUTPUT_FORMAT = 'BarOutputFormat'

        with job.make_runner() as runner:
            hadoop_args = runner._hadoop_args_for_step(0)
            self.assertEqual(hadoop_args[:2], ['-libjar', 'qux.jar'])
            self.assertEqual(len(hadoop_args), 12)

Ejemplo n.º 3

Mostrar archivo

Archivo: test_runner.py Proyecto: irskep/mrjob

    def test_hadoop_input_format(self):
        input_format = "org.apache.hadoop.mapred.SequenceFileInputFormat"

        # one-step job
        job1 = MRWordCount()
        # no cmd-line argument for this because it's part of job semantics
        job1.HADOOP_INPUT_FORMAT = input_format
        with job1.make_runner() as runner1:
            self.assertEqual(runner1._hadoop_args_for_step(0), ["-inputformat", input_format])

        # multi-step job: only use -inputformat on the first step
        job2 = MRTwoStepJob()
        job2.HADOOP_INPUT_FORMAT = input_format
        with job2.make_runner() as runner2:
            self.assertEqual(runner2._hadoop_args_for_step(0), ["-inputformat", input_format])
            self.assertEqual(runner2._hadoop_args_for_step(1), [])

Ejemplo n.º 4

Mostrar archivo

    def test_hadoop_input_format(self):
        input_format = 'org.apache.hadoop.mapred.SequenceFileInputFormat'

        # one-step job
        job1 = MRWordCount()
        # no cmd-line argument for this because it's part of job semantics
        job1.HADOOP_INPUT_FORMAT = input_format
        with job1.make_runner() as runner1:
            self.assertEqual(runner1._hadoop_args_for_step(0),
                             ['-inputformat', input_format])

        # multi-step job: only use -inputformat on the first step
        job2 = MRTwoStepJob()
        job2.HADOOP_INPUT_FORMAT = input_format
        with job2.make_runner() as runner2:
            self.assertEqual(runner2._hadoop_args_for_step(0),
                             ['-inputformat', input_format])
            self.assertEqual(runner2._hadoop_args_for_step(1), [])

Ejemplo n.º 5

Mostrar archivo

Archivo: test_runner.py Proyecto: irskep/mrjob

    def test_hadoop_extra_args_comes_first(self):
        job = MRWordCount(
            [
                "--cmdenv",
                "FOO=bar",
                "--hadoop-arg",
                "-libjar",
                "--hadoop-arg",
                "qux.jar",
                "--jobconf",
                "baz=qux",
                "--partitioner",
                "java.lang.Object",
            ]
        )
        job.HADOOP_INPUT_FORMAT = "FooInputFormat"
        job.HADOOP_OUTPUT_FORMAT = "BarOutputFormat"

        with job.make_runner() as runner:
            hadoop_args = runner._hadoop_args_for_step(0)
            self.assertEqual(hadoop_args[:2], ["-libjar", "qux.jar"])
            self.assertEqual(len(hadoop_args), 12)