Python ExtractToolの例

プログラミング言語: Python

名前空間/パッケージ名: warcat.tool

クラス/型: ExtractTool

hotexamples.comのコード掲載数: 6

Python ExtractTool - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのwarcat.tool.ExtractToolの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

ExtractTool(3)

process(3)

コード例 #1

ファイルを表示

ファイル: tool_test.py プロジェクト: shayaaan8/warcat

 def test_extract_not_utf8_http_header(self):
     with tempfile.TemporaryDirectory() as temp_dir:
         tool = ExtractTool(
             [os.path.join(self.test_dir, 'not_utf8_http_header.warc')],
             out_dir=temp_dir,
             preserve_block=False)
         tool.process()

コード例 #2

ファイルを表示

ファイル: tool_test.py プロジェクト: jbinfo/warcat

    def test_extract_bad_http_chunked_content(self):
        with tempfile.TemporaryDirectory() as temp_dir:
            tool = ExtractTool([os.path.join(self.test_dir, 'bad_http_chunked_content.warc')],
                out_dir=temp_dir, preserve_block=False)
            tool.process()

            self.assertEqual(1, len(
                glob.glob(os.path.join(temp_dir, '*', '*index*'))))

コード例 #3

ファイルを表示

ファイル: tool_test.py プロジェクト: shayaaan8/warcat

    def test_extract(self):
        with tempfile.TemporaryDirectory() as temp_dir:
            tool = ExtractTool([os.path.join(self.test_dir, 'at.warc')],
                               out_dir=temp_dir,
                               preserve_block=False)
            tool.process()

            self.assertEqual(
                1, len(glob.glob(os.path.join(temp_dir, '*', '*index*'))))

コード例 #4

ファイルを表示

ファイル: tool_test.py プロジェクト: jbinfo/warcat

    def test_extract_long_url(self):
        with tempfile.TemporaryDirectory() as temp_dir:
            tool = ExtractTool([os.path.join(self.test_dir, 'long_url.warc')],
                out_dir=temp_dir, preserve_block=False)
            tool.process()

            self.assertEqual(1, len(
                glob.glob(os.path.join(temp_dir, '*', '*index*'))))

            files = list(glob.glob(os.path.join(temp_dir, '*', '*index*')))
            filename = files[0].rsplit('/', 1)[-1]
            self.assertLess(len(filename), 180)

コード例 #5

ファイルを表示

ファイル: tool_test.py プロジェクト: shayaaan8/warcat

    def test_extract_long_url(self):
        with tempfile.TemporaryDirectory() as temp_dir:
            tool = ExtractTool([os.path.join(self.test_dir, 'long_url.warc')],
                               out_dir=temp_dir,
                               preserve_block=False)
            tool.process()

            self.assertEqual(
                1, len(glob.glob(os.path.join(temp_dir, '*', '*index*'))))

            files = list(glob.glob(os.path.join(temp_dir, '*', '*index*')))
            filename = files[0].rsplit('/', 1)[-1]
            self.assertLess(len(filename), 180)

コード例 #6

ファイルを表示

ファイル: tool_test.py プロジェクト: chfoo/warcat

 def test_extract_not_utf8_http_header(self):
     with tempfile.TemporaryDirectory() as temp_dir:
         tool = ExtractTool([os.path.join(self.test_dir, 'not_utf8_http_header.warc')],
                            out_dir=temp_dir, preserve_block=False)
         tool.process()