Python tokens_for Examples

Programming Language: Python

Namespace/Package Name: tokenise_parse

Method/Function: tokens_for

Examples at hotexamples.com: 5

Python tokens_for - 5 examples found. These are the top rated real world Python examples of tokenise_parse.tokens_for extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

File: log_reg_baseline.py Project: ml-lab/snli_nn_tf

def features_for(eg):
    features = []
    for token in tokenise_parse.tokens_for(eg, 1):
        features.append("s1_" + token)
    for token in tokenise_parse.tokens_for(eg, 2):
        features.append("s2_" + token)
    return features

Example #2

Show file

File: log_reg_baseline.py Project: crazydonkey200/snli_nn_tf

def features_for(eg):
    features = []
    for token in tokenise_parse.tokens_for(eg, 1):
        features.append("s1_" + token)
    for token in tokenise_parse.tokens_for(eg, 2):
        features.append("s2_" + token)
    return features

Example #3

Show file

File: token_stats.py Project: BinbinBian/snli_nn

#!/usr/bin/env python
from collections import Counter
import json
import numpy as np
import tokenise_parse
import sys

PARSE_MODE = sys.argv[1]

def quantiles(v):
    return np.percentile(v, np.linspace(0, 100, 5))

token_freq = Counter()
s1_lengths = []
s2_lengths = []
for line in sys.stdin:
    eg = json.loads(line)
    s1_tokens = tokenise_parse.tokens_for(eg, 1, PARSE_MODE)
    s1_lengths.append(len(s1_tokens))
    s2_tokens = tokenise_parse.tokens_for(eg, 2, PARSE_MODE)
    s2_lengths.append(len(s2_tokens))
    token_freq.update(s1_tokens)
    token_freq.update(s2_tokens)

print "s1_lengths quantiles", quantiles(s1_lengths)
print "s2_lengths quantiles", quantiles(s2_lengths)
print token_freq.most_common(30)

Example #4

Show file

#!/usr/bin/env python
from collections import Counter
import json
import numpy as np
import tokenise_parse
import sys

PARSE_MODE = sys.argv[1]


def quantiles(v):
    return np.percentile(v, np.linspace(0, 100, 5))


token_freq = Counter()
s1_lengths = []
s2_lengths = []
for line in sys.stdin:
    eg = json.loads(line)
    s1_tokens = tokenise_parse.tokens_for(eg, 1, PARSE_MODE)
    s1_lengths.append(len(s1_tokens))
    s2_tokens = tokenise_parse.tokens_for(eg, 2, PARSE_MODE)
    s2_lengths.append(len(s2_tokens))
    token_freq.update(s1_tokens)
    token_freq.update(s2_tokens)

print "s1_lengths quantiles", quantiles(s1_lengths)
print "s2_lengths quantiles", quantiles(s2_lengths)
print token_freq.most_common(30)

Example #5

Show file

File: util.py Project: BinbinBian/snli_nn

def tokens_in_sentences(eg, parse_mode):
    return (tokenise_parse.tokens_for(eg, 1, parse_mode),
            tokenise_parse.tokens_for(eg, 2, parse_mode))