Python read_delimited_chunks 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: intelmq.lib.splitreports

메소드/함수: read_delimited_chunks

hotexamples.com에서의 예제들: 6

Python read_delimited_chunks - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 intelmq.lib.splitreports.read_delimited_chunks에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_splitreports.py 프로젝트: playkind/intelmq

 def test_read_delimited_chunks_empty_input(self):
     """Test empty input for read_delimited_chunks."""
     # splittign an empty file yields no chunks at all, similar to
     # how a string's readline method yields an empty list for an
     # empty string.
     self.assertEqual(list(read_delimited_chunks(io.BytesIO(b""), 1000)),
                      [])

예제 #2

파일 보기

파일: test_splitreports.py 프로젝트: playkind/intelmq

    def test_read_delimited_chunks_long_lines(self):
        """Test lines longer than chunksize, data longer than chunk_size."""
        chunk_size = 100

        # Make sure the test data fits the testcase:
        #
        # 1. At least one lines must be longer than the chunk_size, so
        # that at least one chunk has to be longer as well
        self.assertTrue(max(map(len, csv_test_data.splitlines())) > chunk_size)

        # The actual test
        chunked = list(
            read_delimited_chunks(io.BytesIO(csv_test_data), chunk_size))

        # Appending all chunks yields the original unchunked data
        self.assertEqual(csv_test_data, b"".join(chunked))

        # Chunks longer than chunk_size have newlines only at the end.
        long_chunks = list(
            filter(lambda chunk: len(chunk) > chunk_size, chunked))
        self.assertTrue(len(long_chunks) > 0)
        for chunk in long_chunks:
            if chunk.endswith(b"\n"):
                chunk = chunk[:-1]
            self.assertFalse(b"\n" in chunk)

예제 #3

파일 보기

파일: test_splitreports.py 프로젝트: playkind/intelmq

    def test_read_delimited_chunks_short_lines(self):
        """Test lines shorter than chunksize, data longer than chunk_size."""
        chunk_size = 500

        # Make sure the test data fits the testcase:
        #
        # 1. The lines must be shorter than the chunk_size, so that all
        # chunks can be shorter than chunk_size
        self.assertTrue(max(map(len, csv_test_data.splitlines())) < chunk_size)
        # 2. The data must be longer than chunk_size so that chunking is
        # useful
        self.assertTrue(len(csv_test_data) > chunk_size)

        # The actual test
        chunked = list(
            read_delimited_chunks(io.BytesIO(csv_test_data), chunk_size))

        # Appending all chunks yields the original unchunked data
        self.assertEqual(csv_test_data, b"".join(chunked))

        # All chunks are shorter than chunk_size
        self.assertTrue(max(map(len, chunked)) <= chunk_size)

        # All chunks were split at line separators
        self.assertEqual(
            csv_test_data.splitlines(),
            list(
                itertools.chain.from_iterable(chunk.splitlines()
                                              for chunk in chunked)))

예제 #4

파일 보기

파일: test_splitreports.py 프로젝트: certtools/intelmq

    def test_read_delimited_chunks_long_lines(self):
        """Test lines longer than chunksize, data longer than chunk_size."""
        chunk_size = 100

        # Make sure the test data fits the testcase:
        #
        # 1. At least one lines must be longer than the chunk_size, so
        # that at least one chunk has to be longer as well
        self.assertTrue(max(map(len, csv_test_data.splitlines())) > chunk_size)

        # The actual test
        chunked = list(read_delimited_chunks(io.BytesIO(csv_test_data),
                                             chunk_size))

        # Appending all chunks yields the original unchunked data
        self.assertEqual(csv_test_data, b"".join(chunked))

        # Chunks longer than chunk_size have newlines only at the end.
        long_chunks = list(filter(lambda chunk: len(chunk) > chunk_size,
                                  chunked))
        self.assertTrue(len(long_chunks) > 0)
        for chunk in long_chunks:
            if chunk.endswith(b"\n"):
                chunk = chunk[:-1]
            self.assertFalse(b"\n" in chunk)

예제 #5

파일 보기

파일: test_splitreports.py 프로젝트: certtools/intelmq

    def test_read_delimited_chunks_short_lines(self):
        """Test lines shorter than chunksize, data longer than chunk_size."""
        chunk_size = 500

        # Make sure the test data fits the testcase:
        #
        # 1. The lines must be shorter than the chunk_size, so that all
        # chunks can be shorter than chunk_size
        self.assertTrue(max(map(len, csv_test_data.splitlines())) < chunk_size)
        # 2. The data must be longer than chunk_size so that chunking is
        # useful
        self.assertTrue(len(csv_test_data) > chunk_size)

        # The actual test
        chunked = list(read_delimited_chunks(io.BytesIO(csv_test_data),
                                             chunk_size))

        # Appending all chunks yields the original unchunked data
        self.assertEqual(csv_test_data, b"".join(chunked))

        # All chunks are shorter than chunk_size
        self.assertTrue(max(map(len, chunked)) <= chunk_size)

        # All chunks were split at line separators
        self.assertEqual(csv_test_data.splitlines(),
                         list(itertools.chain.from_iterable(
                             chunk.splitlines() for chunk in chunked)))

예제 #6

파일 보기

파일: test_splitreports.py 프로젝트: certtools/intelmq

 def test_read_delimited_chunks_empty_input(self):
     """Test empty input for read_delimited_chunks."""
     # splittign an empty file yields no chunks at all, similar to
     # how a string's readline method yields an empty list for an
     # empty string.
     self.assertEqual(list(read_delimited_chunks(io.BytesIO(b""),
                                                 1000)),
                      [])