Python SocialLM.tokenize Beispiele

Programmiersprache: Python

Namespace / Paketname: social

Klasse / Typ: SocialLM

Methode / Funktion: tokenize

Beispiele auf hotexamples.com: 3

Python SocialLM.tokenize - 3 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die social.SocialLM.tokenize, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

add_doc(3)

tokenize(3)

calculate(2)

karbasa(1)

normalize(1)

Beispiel #1

Datei anzeigen

Datei: dysl.py Projekt: dracone/nlp-tools

def readfile(filename):
    #print 'readfile', filename
    f = codecs.open(filename, encoding='utf-8')
    tokenz = LM.tokenize(f.read())
    f.close()
    #print tokenz
    return tokenz

Beispiel #2

Datei anzeigen

Datei: langid.py Projekt: dracone/nlp-tools

    def _readfile(cls, filename):
        """ Reads a file a utf-8 file,
            and retuns character tokens.

            :param filename: Name of file to be read.
        """
        f = codecs.open(filename, encoding='utf-8')
        filedata = f.read()
        f.close()
        tokenz = LM.tokenize(filedata, mode='c')
        #print tokenz
        return tokenz

Beispiel #3

Datei anzeigen

Datei: langid.py Projekt: dracone/nlp-tools

    def classify(self, text=u''):
        """ Predicts the Language of a given text.

            :param text: Unicode text to be classified.
        """

        text = self.lm.normalize(text)
        tokenz = LM.tokenize(text, mode='c')
        result = self.lm.calculate(doc_terms=tokenz)
        #print 'Karbasa:', self.karbasa(result)
        if self.unk and self.lm.karbasa(result) < self.min_karbasa:
            lang = 'unk'
        else:
            lang = result['calc_id']
        return lang