Python TrainedGrammar.TrainedGrammarの例

プログラミング言語: Python

名前空間/パッケージ名: lexer.pcfg

クラス/型: TrainedGrammar

メソッド/関数: TrainedGrammar

hotexamples.comのコード掲載数: 3

Python TrainedGrammar.TrainedGrammar - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlexer.pcfg.TrainedGrammar.TrainedGrammarの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

TrainedGrammar(3)

decode_rule(1)

encode_rule(1)

get_actual_NonTlist(1)

get_freq(1)

get_freq_range(1)

コード例 #1

ファイルを表示

ファイル: complete_setup.py プロジェクト: mspencer08/nocrack

def create_pcfg(vault_leak, password_leak=None):
    # learn the grammar
    vault_d = json.load(open(vault_leak))
    print "# of vaults: ", len(vault_d)
    print "max size of vault:", max(len(x) for x in vault_d.values())
    print "max size of vault:", min(len(x) for x in vault_d.values())

    if not password_leak:
        D = defaultdict(int)
        for k, v in vault_d.items():
            if len(v) > 40: continue
            for x in v:
                D[x] += 1
        password_leak = PW_TMP_FILE
        with open(password_leak, 'w') as f:
            f.write('\n'.join('%d\t%s' % (f, p) for p, f in sorted(
                D.items(), key=lambda x: x[1], reverse=True)))
        print "Password file created"
    parallel_buildpcfg(password_leak)

    # learn the vault distribution
    tg = TrainedGrammar()
    G = cal_size_subG(tg, vault_leak)
    f = os.tmpfile()
    json.dump(G, f)
    f.seek(0)
    cal_stat(fds=[f])
    f.close()

コード例 #2

ファイルを表示

ファイル: train_vault_dist.py プロジェクト: mspencer08/nocrack

    # s = [sum(R[i])/float(len(R[i])) for i in range(len(NT))]
    print G.keys()
    for k, v in G.items():
        if len(v) < 30:
            for i in range(1, len(v) + 30):
                v[i] = 5 * v.get(i, 1)
    json.dump(G,
              open(GRAMMAR_DIR + 'vault_dist.cfg', 'wb'),
              indent=2,
              separators=(',', ':'),
              sort_keys=True)


if __name__ == "__main__":
    if sys.argv[1] == '-process':
        tg = TrainedGrammar()
        print json.dumps(cal_size_subG(tg, sys.argv[2]), indent=2)
    elif sys.argv[1] == '-stat':
        # give the vaultcleaned files,
        cal_stat(fnames=sys.argv[2:])
    elif sys.argv[1] == '-default':
        tg = TrainedGrammar()
        files = [
            "data_vault/%s_vaultcleaned.json" % x for x in ['joe', 'weir'][:1]
        ]
        G = {}
        for f in files:
            G.update(cal_size_subG(tg, f))
        f = os.tmpfile()
        json.dump(G, f)
        f.seek(0)

コード例 #3

ファイルを表示

 def __init__(self, grammar=None, cal_cdf=False):
     self.G = grammar
     if not self.G:
         self.G = TrainedGrammar(cal_cdf=cal_cdf)