def test_is_html(self): self.assertFalse(is_html(b'\x49\x44\x43<html')) self.assertTrue(is_html(b'<!DOCTYPE foo>\xaaa')) self.assertTrue(is_html( # UTF-8 with BOM b'\xef\xbb\xbf<!DOCTYPE foo>\xaaa')) self.assertTrue(is_html( # UTF-16-LE b'\xff\xfe<\x00h\x00t\x00m\x00l\x00>\x00\xe4\x00' )) self.assertTrue(is_html( # UTF-16-BE b'\xfe\xff\x00<\x00h\x00t\x00m\x00l\x00>\x00\xe4' )) self.assertTrue(is_html( # UTF-32-BE b'\x00\x00\xFE\xFF\x00\x00\x00<\x00\x00\x00h\x00\x00\x00t\x00\x00\x00m\x00\x00\x00l\x00\x00\x00>\x00\x00\x00\xe4')) self.assertTrue(is_html( # UTF-32-LE b'\xFF\xFE\x00\x00<\x00\x00\x00h\x00\x00\x00t\x00\x00\x00m\x00\x00\x00l\x00\x00\x00>\x00\x00\x00\xe4\x00\x00\x00'))
def test_is_html(self): self.assertFalse(is_html(b"\x49\x44\x43<html")) self.assertTrue(is_html(b"<!DOCTYPE foo>\xaaa")) self.assertTrue(is_html(b"\xef\xbb\xbf<!DOCTYPE foo>\xaaa")) # UTF-8 with BOM self.assertTrue(is_html(b"\xff\xfe<\x00h\x00t\x00m\x00l\x00>\x00\xe4\x00")) # UTF-16-LE self.assertTrue(is_html(b"\xfe\xff\x00<\x00h\x00t\x00m\x00l\x00>\x00\xe4")) # UTF-16-BE self.assertTrue( is_html( # UTF-32-BE b"\x00\x00\xFE\xFF\x00\x00\x00<\x00\x00\x00h\x00\x00\x00t\x00\x00\x00m\x00\x00\x00l\x00\x00\x00>\x00\x00\x00\xe4" ) ) self.assertTrue( is_html( # UTF-32-LE b"\xFF\xFE\x00\x00<\x00\x00\x00h\x00\x00\x00t\x00\x00\x00m\x00\x00\x00l\x00\x00\x00>\x00\x00\x00\xe4\x00\x00\x00" ) )