Python HTMLTokenizer примеры использования

Язык программирования: Python

Пространство имен/Пакет: tokenizer

Класс/Тип: HTMLTokenizer

Примеров на hotexamples.com: 6

Python HTMLTokenizer - 6 примеров найдено. Это лучшие примеры Python кода для tokenizer.HTMLTokenizer, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

HTMLTokenizer(1)

__init__(1)

__iter__(1)

state(1)

Пример #1

Показать файл

Файл: sanitizer.py Проект: mikexstudios/html5lib-python

 def __init__(self, stream, encoding=None, parseMeta=True, useChardet=True,
              lowercaseElementName=False, lowercaseAttrName=False):
     #Change case matching defaults as we only output lowercase html anyway
     #This solution doesn't seem ideal...
     HTMLTokenizer.__init__(self, stream, encoding, parseMeta, useChardet,
                            lowercaseElementName, lowercaseAttrName)
     # flag to indicate if stripping is going on or not
     self.stripping = 0

Пример #2

Показать файл

 def __init__(self,
              stream,
              encoding=None,
              parseMeta=True,
              lowercaseElementName=False,
              lowercaseAttrName=False):
     #Change case matching defaults as we only output lowercase html anyway
     #This solution doesn't seem ideal...
     HTMLTokenizer.__init__(self, stream, encoding, parseMeta,
                            lowercaseElementName, lowercaseAttrName)

Пример #3

Показать файл

Файл: sanitizer.py Проект: mikexstudios/html5lib-python

    def __iter__(self):
        for token in HTMLTokenizer.__iter__(self):
            # if its a start tag and is a risky block element (e.g. script), we
            # indicate that we are in striping mode. Its a counter which allows us
            # to handle nested risky block elements
            if self.strip_tokens and token["type"] in ["StartTag", "EndTag"] \
                and token["name"].lower() in HTMLSanitizerMixin.unacceptable_block_elements:
                if token["type"] == "StartTag":
                    self.stripping += 1
                elif token["type"] == "EndTag":
                    self.stripping -= 1

            # Only yield tokens if we are not in stripping mode
            if self.stripping < 1:
                token = self.sanitize_token(token, self.strip_tokens)
                if token:
                    yield token

Пример #4

Показать файл

Файл: mockParser.py Проект: dsheets/html5lib

 def parse(self, stream, output=True):
     tokenizer = HTMLTokenizer(stream)
     for token in tokenizer:
         if output:
             print(token)

Пример #5

Показать файл

Файл: sanitizer.py Проект: 1974kpkpkp/WebGL

 def __iter__(self):
     for token in HTMLTokenizer.__iter__(self):
         token = self.sanitize_token(token)
         if token:
             yield token

Пример #6

Показать файл

 def __iter__(self):
     for token in HTMLTokenizer.__iter__(self):
         token = self.sanitize_token(token)
         if token:
             yield token