Python MRSparkWordcount Beispiele

Programmiersprache: Python

Namespace / Paketname: mrjob.examples.mr_spark_wordcount

Klasse / Typ: MRSparkWordcount

Beispiele auf hotexamples.com: 4

Python MRSparkWordcount - 4 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die mrjob.examples.mr_spark_wordcount.MRSparkWordcount, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

MRSparkWordcount(3)

make_runner(3)

sandbox(3)

Beispiel #1

Datei anzeigen

Datei: test_mr_spark_wordcount.py Projekt: yzhanggithub/mrjob

    def test_empty(self):
        job = MRSparkWordcount([])
        job.sandbox()

        with job.make_runner() as runner:
            runner.run()

            self.assertEqual(sorted(to_lines(runner.cat_output())), [])

Beispiel #2

Datei anzeigen

Datei: test_inline.py Projekt: qui/mrjob

    def test_spark_mrjob(self):
        text = b'one fish\ntwo fish\nred fish\nblue fish\n'

        job = MRSparkWordcount(['-r', 'inline'])
        job.sandbox(stdin=BytesIO(text))

        counts = {}

        with job.make_runner() as runner:
            runner.run()

            for line in to_lines(runner.cat_output()):
                k, v = safeeval(line)
                counts[k] = v

        self.assertEqual(counts, dict(blue=1, fish=4, one=1, red=1, two=1))

Beispiel #3

Datei anzeigen

Datei: test_inline.py Projekt: Yelp/mrjob

    def test_spark_mrjob(self):
        text = b'one fish\ntwo fish\nred fish\nblue fish\n'

        job = MRSparkWordcount(['-r', 'inline'])
        job.sandbox(stdin=BytesIO(text))

        counts = {}

        with job.make_runner() as runner:
            runner.run()

            for line in to_lines(runner.cat_output()):
                k, v = safeeval(line)
                counts[k] = v

        self.assertEqual(counts, dict(
            blue=1, fish=4, one=1, red=1, two=1))

Beispiel #4

Datei anzeigen

Datei: test_mr_spark_wordcount.py Projekt: yzhanggithub/mrjob

    def test_count_words(self):
        job = MRSparkWordcount([])
        job.sandbox(
            stdin=BytesIO(b'Mary had a little lamb\nlittle lamb\nlittle lamb'))

        with job.make_runner() as runner:
            runner.run()

            output = sorted(
                safeeval(line) for line in to_lines(runner.cat_output()))

            self.assertEqual(output, [
                ('a', 1),
                ('had', 1),
                ('lamb', 3),
                ('little', 3),
                ('mary', 1),
            ])