Python tokenize Beispiele

Programmiersprache: Python

Namespace / Paketname: mptokenize

Methode / Funktion: tokenize

Beispiele auf hotexamples.com: 4

Python tokenize - 4 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die mptokenize.tokenize, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Beispiel #1

Datei anzeigen

Datei: mpclassify.py Projekt: elishowk/mpsentiments

def features_gen(config):
    """
    Reads the training data set and yields feature sets associated with class labels
    """
    ratingsmean = get_ratingsmean(config)
    logging.debug("middle rating value used for training = %d"%ratingsmean)
    sourcetype = config['training']['type']
    path = join( config['data_path'], config['training']['path'] )
    dataclass = _dynamic_get_class("mpdata", sourcetype)
    data = dataclass( path,  dialect="excel")
    for com in data:
        if 'rating' in com:
            if com['rating'] >= ratingsmean:
                yield (word_feats(mptokenize.tokenize(com['body'])), 'pos')
            else:
                yield (word_feats(mptokenize.tokenize(com['body'])), 'neg')
    logging.debug("total of bad lines : %d"%data.impossible_line)

Beispiel #2

Datei anzeigen

def features_gen(config):
    """
    Reads the training data set and yields feature sets associated with class labels
    """
    ratingsmean = get_ratingsmean(config)
    logging.debug("middle rating value used for training = %d" % ratingsmean)
    sourcetype = config['training']['type']
    path = join(config['data_path'], config['training']['path'])
    dataclass = _dynamic_get_class("mpdata", sourcetype)
    data = dataclass(path, dialect="excel")
    for com in data:
        if 'rating' in com:
            if com['rating'] >= ratingsmean:
                yield (word_feats(mptokenize.tokenize(com['body'])), 'pos')
            else:
                yield (word_feats(mptokenize.tokenize(com['body'])), 'neg')
    logging.debug("total of bad lines : %d" % data.impossible_line)

Beispiel #3

Datei anzeigen

Datei: __init__.py Projekt: elishowk/mpsentiments

def articles_gen(config, dbconnect):
    content_gen = dbconnect.get_contents()
    total=0
    try:
        while 1:
            alltokens = []
            (id, contents) = content_gen.next()
            # tokenizes all selected fields from DB
            for field in contents:
                alltokens += mptokenize.tokenize( nltk.clean_html(field) )
            yield (id, alltokens)
            total+=1
    except StopIteration:
        logging.debug( "analyzed %d articles"%total )

Beispiel #4

Datei anzeigen

def articles_gen(config, dbconnect):
    content_gen = dbconnect.get_contents()
    total = 0
    try:
        while 1:
            alltokens = []
            (id, contents) = content_gen.next()
            # tokenizes all selected fields from DB
            for field in contents:
                alltokens += mptokenize.tokenize(nltk.clean_html(field))
            yield (id, alltokens)
            total += 1
    except StopIteration:
        logging.debug("analyzed %d articles" % total)