Ejemplos de script_cat en Python

Lenguaje de programación: Python

Namespace/Package Name: unicodedata2

Método / Función: script_cat

Ejemplos en hotexamples.com: 4

Python script_cat - 4 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de unicodedata2.script_cat extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: namsor_tools.py Proyecto: Oshan96/namsor-python-tools-v2

def computeScriptFirst(someString):
    for i in range(len(someString)):
        c = someString[i]
        script = unicodedata2.script_cat(c)[0]
        if script == "Common":
            continue

        return script

    return None

Ejemplo n.º 2

Mostrar archivo

 def tokenize_real(self, text):
     chars = ((unicodedata2.script_cat(c), c) for c in text)
     tokens = list()
     for (key, group) in itertools.groupby(chars, operator.itemgetter(0)):
         if (key[1][0] == 'L' and key[0] not in self.DISCARD_SCRIPTS):
             cand = ''.join((c[1] for c in group))
             if (key[0] in self.JP_SCRIPTS):
                 tokens.extend(self.tiny.tokenize(cand))
             else:
                 tokens.append(cand.lower())
     return tokens

Ejemplo n.º 3

Mostrar archivo

Archivo: unicode_props.py Proyecto: pombredanne/quac

 def tokenize_real(self, text):
     chars = ((unicodedata2.script_cat(c), c) for c in text)
     tokens = list()
     for (key, group) in itertools.groupby(chars, operator.itemgetter(0)):
         if key[1][0] == "L" and key[0] not in self.DISCARD_SCRIPTS:
             cand = "".join((c[1] for c in group))
             if key[0] in self.JP_SCRIPTS:
                 tokens.extend(self.tiny.tokenize(cand))
             else:
                 tokens.append(cand.lower())
     return tokens

Ejemplo n.º 4

Mostrar archivo

Archivo: wttrin_png.py Proyecto: ericharris/wttrin-dockerized

def script_category(char):
    """
    Returns category of a Unicode character
    Possible values:
        default, Cyrillic, Greek, Han, Hiragana
    """
    cat = unicodedata2.script_cat(char)[0]
    if char == u'：':
        return 'Han'
    if cat in ['Latin', 'Common']:
        return 'default'
    else:
        return cat