Python HTMLTokenizer Exemples

Langage de programmation: Python

Espace de nommage/Pack: tokenizer

Class/Type: HTMLTokenizer

Exemples au hotexamples.com: 6

Python HTMLTokenizer - 6 exemples trouvés. Ce sont les exemples réels les mieux notés de tokenizer.HTMLTokenizer extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

HTMLTokenizer(1)

__init__(1)

__iter__(1)

state(1)

Méthodes fréquemment utilisées

HTMLTokenizer (1)

__init__ (1)

__iter__ (1)

state (1)

Associées

loadStories

split_extension

add_actor

horizontal_rule

generate_static_clients

gen_M_r_from_T

get_fps

ensTraj

Ui_Form

isodate

Related in langs

Reservation (PHP)

BLL_Property_PropSpread (PHP)

PathAppearance (C#)

ParcelLineRow (C#)

vp8_interpolate_motion (C++)

read_mission_item (C++)

MustConnect (Go)

Pod (Go)

ARCH_FAIL (Java)

Class (Java)

Exemple #1

0

Afficher le fichier

Fichier : sanitizer.py Projet : mikexstudios/html5lib-python

def __init__(self, stream, encoding=None, parseMeta=True, useChardet=True, lowercaseElementName=False, lowercaseAttrName=False): #Change case matching defaults as we only output lowercase html anyway #This solution doesn't seem ideal... HTMLTokenizer.__init__(self, stream, encoding, parseMeta, useChardet, lowercaseElementName, lowercaseAttrName) # flag to indicate if stripping is going on or not self.stripping = 0

Exemple #2

0

Afficher le fichier

def __init__(self, stream, encoding=None, parseMeta=True, lowercaseElementName=False, lowercaseAttrName=False): #Change case matching defaults as we only output lowercase html anyway #This solution doesn't seem ideal... HTMLTokenizer.__init__(self, stream, encoding, parseMeta, lowercaseElementName, lowercaseAttrName)

Exemple #3

0

Afficher le fichier

Fichier : sanitizer.py Projet : mikexstudios/html5lib-python

def __iter__(self): for token in HTMLTokenizer.__iter__(self): # if its a start tag and is a risky block element (e.g. script), we # indicate that we are in striping mode. Its a counter which allows us # to handle nested risky block elements if self.strip_tokens and token["type"] in ["StartTag", "EndTag"] \ and token["name"].lower() in HTMLSanitizerMixin.unacceptable_block_elements: if token["type"] == "StartTag": self.stripping += 1 elif token["type"] == "EndTag": self.stripping -= 1 # Only yield tokens if we are not in stripping mode if self.stripping < 1: token = self.sanitize_token(token, self.strip_tokens) if token: yield token

Exemple #4

0

Afficher le fichier

Fichier : mockParser.py Projet : dsheets/html5lib

def parse(self, stream, output=True): tokenizer = HTMLTokenizer(stream) for token in tokenizer: if output: print(token)

Exemple #5

0

Afficher le fichier

Fichier : sanitizer.py Projet : 1974kpkpkp/WebGL

def __iter__(self): for token in HTMLTokenizer.__iter__(self): token = self.sanitize_token(token) if token: yield token

Exemple #6

0

Afficher le fichier

def __iter__(self): for token in HTMLTokenizer.__iter__(self): token = self.sanitize_token(token) if token: yield token