Esempi in Python per CharsCorpusReader

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: util

Metodo/funzione: CharsCorpusReader

Esempi su hotexamples.com: 3

CharsCorpusReader in Python: 3 esempi trovati. Questi sono i migliori esempi reali in Python per util.CharsCorpusReader, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Esempio n. 1

Mostra file

File: rnnlm_transduce.py Progetto: frankatmech/dynet

            rnd = random.random()
            for i,p in enumerate(dist):
                rnd -= p
                if rnd <= 0: break
            res.append(i)
            cw = i
            if cw == stop: break
            if nchars and len(res) > nchars: break
        return res

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('corpus', help='Path to the corpus file.')
    args = parser.parse_args()

    train = util.CharsCorpusReader(args.corpus, begin="<s>")
    vocab = util.Vocab.from_corpus(train)
    
    VOCAB_SIZE = vocab.size()

    model = Model()
    trainer = SimpleSGDTrainer(model)

    #lm = RNNLanguageModel(model, LAYERS, INPUT_DIM, HIDDEN_DIM, VOCAB_SIZE, builder=SimpleRNNBuilder)
    lm = RNNLanguageModel(model, LAYERS, INPUT_DIM, HIDDEN_DIM, VOCAB_SIZE, builder=LSTMBuilder)

    train = list(train)

    chars = loss = 0.0
    for ITER in range(100):
        random.shuffle(train)

Esempio n. 2

Mostra file

File: rnnlm.py Progetto: adhigunasurya/distillation_parser

            r_t = bias + (R * y_t)
            ydist = softmax(r_t)
            dist = ydist.vec_value()
            rnd = random.random()
            for i, p in enumerate(dist):
                rnd -= p
                if rnd <= 0: break
            res.append(i)
            cw = i
            if cw == stop: break
            if nchars and len(res) > nchars: break
        return res


if __name__ == '__main__':
    train = util.CharsCorpusReader(sys.argv[1], begin="<s>")
    vocab = util.Vocab.from_corpus(train)

    VOCAB_SIZE = vocab.size()

    model = Model()
    sgd = SimpleSGDTrainer(model)

    #lm = RNNLanguageModel(model, builder=LSTMBuilder)
    lm = RNNLanguageModel(model,
                          LAYERS,
                          INPUT_DIM,
                          HIDDEN_DIM,
                          VOCAB_SIZE,
                          builder=SimpleRNNBuilder)

Esempio n. 3

Mostra file

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('train', help='Path to the corpus file.')
    parser.add_argument('dev', help='Path to the validation corpus file.')
    parser.add_argument('test', help='Path to the test corpus file.')
    parser.add_argument(
        '--print_probs',
        action="store_true",
        help=
        'whether to print the probabilities per word over the validation set')
    parser.add_argument('--perform_train',
                        action="store_true",
                        help='whether to perform training')
    args, unknown = parser.parse_known_args()

    train = util.CharsCorpusReader(args.train, begin="<s>")
    dev = util.CharsCorpusReader(args.dev, begin="<s>")
    test = util.CharsCorpusReader(args.test, begin="<s>")

    vocab = util.Vocab.from_corpus(train)

    VOCAB_SIZE = vocab.size()

    model = dy.Model()
    trainer = dy.SimpleSGDTrainer(model, learning_rate=1.0)

    lm = RNNLanguageModel(model,
                          LAYERS,
                          INPUT_DIM,
                          HIDDEN_DIM,
                          VOCAB_SIZE,