Python PoemModel Examples

Programming Language: Python

Namespace/Package Name: model

Class/Type: PoemModel

Examples at hotexamples.com: 7

Python PoemModel - 7 examples found. These are the top rated real world Python examples of model.PoemModel extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

PoemModel(6)

decoder_state_computer(1)

encoder_computer(1)

global_trace_computer(1)

his_mem_computer(1)

key_memory_computer(1)

step(1)

topic_trace_computer(1)

Example #1

Show file

    def __init__(self, beam_size, model_file=None):
        # Construct hyper-parameter
        self.hps = hps
        self.dtool = data_tool
        self.beam_size = beam_size
        self.tool = PoetryTool(sens_num=hps.sens_num,
                               key_slots=hps.key_slots,
                               enc_len=hps.bucket[0],
                               dec_len=hps.bucket[1])
        if hps.init_emb == '':
            self.init_emb = None
        else:
            self.init_emb = np.load(self.hps.init_emb)
            print("init_emb_size: %s" % str(np.shape(self.init_emb)))
        self.tool.load_dic(hps.vocab_path, hps.ivocab_path)

        vocab_size = self.tool.get_vocab_size()
        assert vocab_size > 0
        PAD_ID = self.tool.get_PAD_ID()
        assert PAD_ID > 0

        self.hps = self.hps._replace(vocab_size=vocab_size,
                                     PAD_ID=PAD_ID,
                                     batch_size=beam_size,
                                     mode='decode')
        self.model = PoemModel(self.hps)

        self.EOS_ID, self.PAD_ID, self.GO_ID, self.UNK_ID \
            = self.tool.get_special_IDs()

        self.enc_len = self.hps.bucket[0]
        self.dec_len = self.hps.bucket[1]
        self.topic_trace_size = self.hps.topic_trace_size
        self.key_slots = self.hps.key_slots
        self.his_mem_slots = self.hps.his_mem_slots
        self.his_mem_size = self.hps.his_mem_size
        self.global_trace_size = self.hps.global_trace_size
        self.hidden_size = self.hps.hidden_size

        self.sess = tf.InteractiveSession()

        if model_file is None:
            self.load_model(self.sess, self.model)
        else:
            self.load_model_by_path(self.sess, self.model, model_file)

        self.__buildPH()

Example #2

Show file

def main():
    preprocessing = Preprocessing(Config.train_poems_location)
    preprocessing.preprocess()
    model = PoemModel(preprocessed=preprocessing,
                      weight_file=Config.weight_file,
                      window_size=Config.window_size,
                      learning_rate=0.001,
                      batch_size=32)

Example #3

Show file

    def create_model(self, session):
        """Create the model and initialize or load parameters in session."""
        model = PoemModel(self.hps)
        ckpt = tf.train.get_checkpoint_state(self.FLAGS.model_dir)
        if ckpt and tf.gfile.Exists(ckpt.model_checkpoint_path):
            print("Reading model parameters from %s" %
                  ckpt.model_checkpoint_path)
            model.saver.restore(session, ckpt.model_checkpoint_path)
        else:
            print("Created model with fresh parameters.")
            session.run(tf.global_variables_initializer())

        return model

Example #4

Show file

File: generate.py Project: zxlzr/StylisticPoetry

    def load_model(self, session, beam_size):
        """load parameters in session."""
        decode_hps = self.hps._replace(batch_size=beam_size)
        model = PoemModel(decode_hps)

        ckpt = tf.train.get_checkpoint_state("model/")

        if ckpt and tf.gfile.Exists(ckpt.model_checkpoint_path):
            print("Reading model parameters from %s" %
                  ckpt.model_checkpoint_path)
            model.saver.restore(session, ckpt.model_checkpoint_path)
        else:
            raise ValueError("%s not found! " % ckpt.model_checkpoint_path)

        return model

Example #5

Show file

    def train(self):
        gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.98)
        gpu_options.allow_growth = True

        with tf.Session(config=tf.ConfigProto(
                gpu_options=gpu_options)) as sess:

            # Create model.
            model = PoemModel(self.hps, self.init_emb)
            self.create_model(sess, model)

            # Build batched data
            train_batch_num, valid_batch_num, \
            train_batches, valid_batches = self.tool.build_data(
                self.hps.batch_size, self.hps.train_data, self.hps.valid_data)

            print("train_batch_num: %d" % (train_batch_num))
            print("valid_batch_num: %d" % (valid_batch_num))

            for epoch in xrange(1, self.hps.max_epoch + 1):
                total_gen_loss = 0.0
                time1 = time.time()

                for step in xrange(0, train_batch_num):
                    batch = train_batches[step]
                    outputs, gen_loss = model.step(sess, batch, False)
                    total_gen_loss += gen_loss

                    if step % self.hps.steps_per_train_log == 0:
                        time2 = time.time()
                        time_cost = float(time2 -
                                          time1) / self.hps.steps_per_train_log
                        time1 = time2
                        process_info = "epoch: %d, %d/%d %.3f%%, %.3f s per iter" % (
                            epoch, step, train_batch_num,
                            float(step + 1) / train_batch_num * 100, time_cost)

                        self.sample(batch['enc_inps'], batch['dec_inps'],
                                    batch['key_inps'], outputs)
                        current_gen_loss = total_gen_loss / (step + 1)
                        ppl = math.exp(current_gen_loss
                                       ) if current_gen_loss < 300 else float(
                                           'inf')
                        train_info = "train loss: %.3f  ppl:%.2f" % (
                            current_gen_loss, ppl)
                        print(process_info)
                        print(train_info)
                        print("______________________")

                        info = process_info + " " + train_info
                        fout = open("trainlog.txt", 'a')
                        fout.write(info + "\n")
                        fout.close()

                current_epoch = int(model.global_step.eval() //
                                    train_batch_num)

                if epoch > self.hps.burn_down:
                    lr0 = model.learning_rate.eval()
                    print("lr decay...")
                    sess.run(model.learning_rate_decay_op)
                    lr1 = model.learning_rate.eval()
                    print("%.4f to %.4f" % (lr0, lr1))

                if epoch % self.hps.epoches_per_validate == 0:
                    self.run_validation(sess, model, valid_batches,
                                        valid_batch_num, epoch)

                if epoch % self.hps.epoches_per_checkpoint == 0:
                    # Save checkpoint and zero timer and loss.
                    print("saving model...")
                    checkpoint_path = os.path.join(
                        self.hps.model_path,
                        "poem.ckpt" + "_" + str(current_epoch))
                    model.saver.save(sess,
                                     checkpoint_path,
                                     global_step=model.global_step)

                print("shuffle data...")
                random.shuffle(train_batches)

Example #6

Show file

class Generator(object):
    def __init__(self, beam_size, model_file=None):
        # Construct hyper-parameter
        self.hps = hps
        self.dtool = data_tool
        self.beam_size = beam_size
        self.tool = PoetryTool(sens_num=hps.sens_num,
                               key_slots=hps.key_slots,
                               enc_len=hps.bucket[0],
                               dec_len=hps.bucket[1])
        if hps.init_emb == '':
            self.init_emb = None
        else:
            self.init_emb = np.load(self.hps.init_emb)
            print("init_emb_size: %s" % str(np.shape(self.init_emb)))
        self.tool.load_dic(hps.vocab_path, hps.ivocab_path)

        vocab_size = self.tool.get_vocab_size()
        assert vocab_size > 0
        PAD_ID = self.tool.get_PAD_ID()
        assert PAD_ID > 0

        self.hps = self.hps._replace(vocab_size=vocab_size,
                                     PAD_ID=PAD_ID,
                                     batch_size=beam_size,
                                     mode='decode')
        self.model = PoemModel(self.hps)

        self.EOS_ID, self.PAD_ID, self.GO_ID, self.UNK_ID \
            = self.tool.get_special_IDs()

        self.enc_len = self.hps.bucket[0]
        self.dec_len = self.hps.bucket[1]
        self.topic_trace_size = self.hps.topic_trace_size
        self.key_slots = self.hps.key_slots
        self.his_mem_slots = self.hps.his_mem_slots
        self.his_mem_size = self.hps.his_mem_size
        self.global_trace_size = self.hps.global_trace_size
        self.hidden_size = self.hps.hidden_size

        self.sess = tf.InteractiveSession()

        if model_file is None:
            self.load_model(self.sess, self.model)
        else:
            self.load_model_by_path(self.sess, self.model, model_file)

        self.__buildPH()

    def load_model(self, session, model):
        """load parameters in session."""
        ckpt = tf.train.get_checkpoint_state(self.hps.model_path)
        if ckpt and tf.gfile.Exists(ckpt.model_checkpoint_path):
            print("Reading model parameters from %s" %
                  ckpt.model_checkpoint_path)
            model.saver.restore(session, ckpt.model_checkpoint_path)
        else:
            raise ValueError("%s not found! " % ckpt.model_checkpoint_path)

    def load_model_by_path(self, session, model, modefile):
        """load parameters in session."""
        if tf.gfile.Exists(modefile):
            print("Reading model parameters from %s" % modefile)
            model.saver.restore(session, modefile)
        else:
            raise ValueError("%s not found! " % modefile)

    def __buildPH(self):
        self.__PHDic = self.dtool.buildPHDicForIdx(
            copy.deepcopy(
                self.tool.get_vocab()))  #把__GLDic改一下，由原来的 韵编号-字列表，变为，韵编号-字id列表

    def addtionFilter(self, trans, pos):  #4 trans batch_size,3
        pos -= 1
        preidx = range(0, pos)  #0 1 2
        batch_size = len(trans)
        forbidden_list = [[] for _ in xrange(0, batch_size)]

        for i in range(0, batch_size):
            prechar = [trans[i][c] for c in preidx]
            forbidden_list[i] = prechar

        return forbidden_list

    def beam_select(
        self, probs, trans, k, trg_len, beam_size, repeatidxvec, ph
    ):  #trans是已有的候选，probs是这次step的。trans [candidate_num,already_len] probs [candidate_num,vocab_size]
        V = np.shape(probs)[1]  # vocabulary size
        n_samples = np.shape(probs)[0]
        if k == 1:
            n_samples = beam_size

        # trans_indices, word_indices, costs
        hypothesis = []  # (char_idx, which beam, prob)
        cost_eps = float(1e5)

        # Control inner repeat
        forbidden_list = self.addtionFilter(trans, k)
        for i in range(0, np.shape(probs)[0]):
            probs[i, forbidden_list[i]] = cost_eps

        # Control global repeat
        probs[:, repeatidxvec] = cost_eps

        # hard control for genre
        if ph != 0:
            #print (k, gl)
            probs *= cost_eps
            probs[:, self.__PHDic[ph]] /= float(cost_eps)

        flat_next_costs = probs.flatten()  #全部展平，变为1维列表
        best_costs_indices = np.argpartition(  #若第一个参数是数字列表，第二个参数是k，则返回一个与数字列表相同长度的列表，这个列表里的每个元素是下标，其中下标是k的元素是从小到大排序的正确元素，它左边的元素是小于它的，右边的元素是大于它的
            flat_next_costs.flatten(), n_samples)[:n_samples]

        trans_indices = [int(idx)
                         for idx in best_costs_indices / V]  # which beam line
        word_indices = best_costs_indices % V
        costs = flat_next_costs[best_costs_indices]

        for i in range(0, n_samples):
            hypothesis.append((word_indices[i], trans_indices[i], costs[i]))

        return hypothesis

    def beam_search(self, sess, sen, len_inps, ori_key_states,
                    key_initial_state, ori_topic_trace, ori_his_mem,
                    ori_his_mem_mask, ori_global_trace, enc_mask, ori_key_mask,
                    repeatidxvec, phs):
        trg_length = len(phs)
        beam_size = self.beam_size
        n_samples = beam_size

        enc_state, attn_states = self.model.encoder_computer(
            sess, sen, enc_mask)  #为啥input_feed是0？？？
        enc_states = copy.deepcopy(attn_states)
        enc_mask = np.array(enc_mask)

        key_states = copy.deepcopy(ori_key_states)
        topic_trace = copy.deepcopy(ori_topic_trace)
        global_trace = copy.deepcopy(ori_global_trace)
        his_mem = copy.deepcopy(ori_his_mem)
        his_mem_mask = copy.deepcopy(ori_his_mem_mask)
        key_mask = copy.deepcopy(ori_key_mask)

        fin_trans, fin_costs, fin_align = [], [], []

        trans = [[] for i in xrange(0, beam_size)]
        costs = [0.0]

        key_align = []
        for i in range(beam_size):
            key_align.append(np.zeros([1, self.key_slots], dtype=np.float32))

        state = enc_state
        if not (key_initial_state is None):
            state = key_initial_state
        inp = np.array([self.GO_ID] * beam_size)

        ph_inp = [phs[0]] * n_samples

        output, state, alignments = self.model.decoder_state_computer(
            sess, inp, len_inps[0], ph_inp, state, attn_states, key_states,
            his_mem, global_trace, enc_mask, key_mask, his_mem_mask,
            topic_trace)  #output [batch_size,vocab_size]

        for k in range(1, 2 * trg_length):
            if n_samples == 0:
                break

            if k == 1:
                output = output[0, :]  #[vocab_size]

            log_probs = np.log(output)
            next_costs = np.array(
                costs
            )[:,
              None] - log_probs  #np.array(costs) array([0.0]) np.array(costs)[:,None] array([[0.0]]) 增加一个维度，shape(1,1)

            # Form a beam for the next iteration
            new_trans = [[] for i in xrange(0, n_samples)]
            new_costs = np.zeros(n_samples, dtype="float32")
            new_states = np.zeros((n_samples, self.hidden_size),
                                  dtype="float32")
            new_align = [[] for i in xrange(0, n_samples)]

            inputs = np.zeros(n_samples, dtype="int64")

            # Note that here k < len(gls) means that we don't put hard constraint on yun
            ph_require = phs[k - 1] if k <= len(phs) else 0

            #print (gl_require)
            hypothesis = self.beam_select(next_costs, trans, k, trg_length,
                                          n_samples, repeatidxvec, ph_require)

            for i, (next_word, orig_idx, next_cost) in enumerate(hypothesis):
                #print("%d %d %d %f %s" % (i, next_word, orig_idx, next_cost))
                new_trans[i] = trans[orig_idx] + [next_word]
                new_costs[i] = next_cost
                align_start = self.his_mem_slots
                align_end = self.his_mem_slots + self.key_slots
                current_align = alignments[orig_idx, align_start:align_end]
                new_align[i] = np.concatenate(
                    (key_align[orig_idx], [current_align]), axis=0)
                new_states[i] = state[orig_idx, :]
                inputs[i] = next_word

            # Filter the sequences that end with end-of-sequence character
            trans, costs, indices, key_align = [], [], [], []

            for i in range(n_samples):
                if new_trans[i][-1] != self.EOS_ID:
                    trans.append(new_trans[i])
                    costs.append(new_costs[i])
                    indices.append(i)
                    key_align.append(new_align[i])
                else:
                    n_samples -= 1
                    fin_trans.append(new_trans[i])
                    fin_costs.append(new_costs[i])
                    fin_align.append(new_align[i])

            if n_samples == 0:
                break

            inputs = inputs[indices]
            new_states = new_states[indices]
            attn_states = attn_states[indices, :, :]

            global_trace = global_trace[indices, :]
            enc_mask = enc_mask[indices, :, :]
            key_states = key_states[indices, :, :]
            his_mem = his_mem[indices, :, :]
            key_mask = key_mask[indices, :, :]
            his_mem_mask = his_mem_mask[indices, :]
            topic_trace = topic_trace[indices, :]

            if k >= np.shape(len_inps)[0]:
                specify_len = len_inps[np.shape(len_inps)[0] - 1, indices]
            else:
                specify_len = len_inps[k, indices]

            if k >= len(phs):
                ph_inp = [0] * n_samples
            else:
                ph_inp = [phs[k]] * n_samples

            output, state, alignments = self.model.decoder_state_computer(
                sess, inputs, specify_len, ph_inp, new_states, attn_states,
                key_states, his_mem, global_trace, enc_mask, key_mask,
                his_mem_mask, topic_trace)

        #print (np.shape(fin_align))
        for i in range(len(fin_align)):
            fin_align[i] = fin_align[i][1:, :]

        index = np.argsort(fin_costs)  #从小到大排序，返回下标列表
        fin_align = np.array(fin_align)[index]
        fin_trans = np.array(fin_trans)[index]
        fin_costs = np.array(sorted(fin_costs))

        if len(fin_trans) == 0:
            index = np.argsort(costs)
            fin_align = np.array(key_align)[index]
            fin_trans = np.array(trans)[index]
            fin_costs = np.array(sorted(costs))

        return fin_trans, fin_costs, fin_align, enc_states

    def get_new_global_trace(self, sess, history, ori_enc_states, beam_size):

        enc_states = np.expand_dims(ori_enc_states,
                                    axis=0)  #[1,enc_len,2*hidden_size]
        prev_history = np.expand_dims(history[0, :], 0)  #[1,global_trace_size]
        #print (np.shape(prev_encoder_state))
        #tt = input(">")
        new_history = self.model.global_trace_computer(sess, prev_history,
                                                       enc_states)
        new_history = np.tile(new_history,
                              [beam_size, 1])  #[beam_size,global_trace_size]
        return new_history

    def get_new_his_mem(self, sess, ori_his_mem, enc_states, ori_global_trace,
                        beam_size, src_len):
        his_mem = np.expand_dims(ori_his_mem,
                                 axis=0)  #[1,his_mem_slots,his_mem_size]
        fin_states = []
        for i in xrange(0, np.shape(enc_states)[0]):
            fin_states.append(np.expand_dims(enc_states[i],
                                             0))  #enc_len [1,2*hidden_size]

        mask = [np.ones((1, 1))] * src_len + [np.zeros(
            (1, 1))] * (np.shape(enc_states)[0] - src_len)
        global_trace = np.expand_dims(ori_global_trace[0, :],
                                      0)  #[1,global_trace_size]
        new_his_mem = self.model.his_mem_computer(sess, his_mem, fin_states,
                                                  mask, global_trace)

        new_his_mem = np.tile(
            new_his_mem,
            [beam_size, 1, 1])  #[beam_size,his_mem_slots,his_mem_size]
        return new_his_mem

    def get_new_topic_trace(self, sess, ori_topic_trace, key_align,
                            ori_key_states, beam_size):
        key_states = np.expand_dims(ori_key_states[0, :, :],
                                    0)  #[1,key_slots,2*hidden_size]
        topic_trace = np.expand_dims(ori_topic_trace,
                                     axis=0)  #[1,topic_trace_size+key_slots]
        key_align = np.mean(key_align,
                            axis=0)  #[trg_len,key_slots]变为[key_slots]
        key_align = np.expand_dims(key_align, axis=0)  #[1,key_slots]
        new_topic_trace = self.model.topic_trace_computer(
            sess, key_states, topic_trace, key_align)
        new_topic_trace = np.tile(
            new_topic_trace,
            [beam_size, 1])  #[beam_size,topic_trace_size+key_slots]
        return new_topic_trace

    def generate_one(self, keystr, pattern):  #pattern 4,5或4,7
        beam_size = self.beam_size
        sens_num = len(pattern)
        keys = keystr.strip()
        ans, repeatidxes = [], []
        print("using keywords: %s" % (keystr))
        keys = keystr.split(" ")
        keys_idxes = [
            self.tool.chars2idxes(self.tool.line2chars(key)) for key in keys
        ]
        #print (keys_idxes)
        key_inps, key_mask = self.tool.gen_batch_key_beam(
            keys_idxes, beam_size
        )  #key_inps:key_slots,2 [batch_size] key_mask:batch_size [key_slots,1]

        # Calculate initial_key state and key_states
        key_initial_state, key_states = self.model.key_memory_computer(
            self.sess, key_inps, key_mask)

        his_mem_mask = np.zeros([beam_size, self.his_mem_slots],
                                dtype=np.float32)
        global_trace = np.zeros([beam_size, self.global_trace_size],
                                dtype='float32')
        his_mem = np.zeros([beam_size, self.his_mem_slots, self.his_mem_size],
                           dtype='float32')
        topic_trace = np.zeros(
            [beam_size, self.topic_trace_size + self.key_slots],
            dtype='float32')

        # Generate the first line, line0 is an empty list
        sen = []
        for step in xrange(0, sens_num):
            print("generating %d line..." % (step + 1))
            phs = pattern[step]
            trg_len = len(phs)
            if step > 0:
                key_initial_state = None
            src_len = len(sen)
            batch_sen, enc_mask, len_inps = self.tool.gen_batch_beam(
                sen, trg_len, beam_size)  #len_inps [dec_len,batch_size]
            trans, costs, align, enc_states = self.beam_search(
                self.sess, batch_sen, len_inps, key_states, key_initial_state,
                topic_trace, his_mem, his_mem_mask, global_trace, enc_mask,
                key_mask, repeatidxes, phs)

            trans, costs, align, enc_states = self.pFilter(
                trans, costs, align, enc_states, trg_len)

            if len(trans) == 0:
                return [], ("line %d generation failed!" % (step + 1))

            which = 0

            his_mem = self.get_new_his_mem(self.sess, his_mem[which, :, :],
                                           enc_states[which], global_trace,
                                           beam_size, src_len)

            if step >= 1:  #更新his_mem_mask
                one_his_mem = his_mem[
                    which, :, :]  #[his_mem_slots,his_mem_size]
                his_mem_mask = np.sum(np.abs(one_his_mem),
                                      axis=1)  #[his_mem_slots]
                his_mem_mask = his_mem_mask != 0
                his_mem_mask = np.tile(his_mem_mask.astype(
                    np.float32), [beam_size, 1])  #[beam_size,his_mem_slots]

            sentence = self.tool.beam_get_sentence(trans[which])
            sentence = sentence.strip()
            ans.append(sentence)
            attn_aligns = align[which][0:trg_len, :]  #trg_len,key_slots
            topic_trace = self.get_new_topic_trace(self.sess,
                                                   topic_trace[which, :],
                                                   attn_aligns, key_states,
                                                   beam_size)
            global_trace = self.get_new_global_trace(self.sess, global_trace,
                                                     enc_states[which],
                                                     beam_size)

            sentence = self.tool.line2chars(sentence)
            sen = self.tool.chars2idxes(sentence)
            repeatidxes = list(set(repeatidxes).union(set(sen)))

        return ans, "ok"

    def pFilter(self, trans, costs, align, states, trg_len):
        new_trans, new_costs, new_align, new_states = [], [], [], []

        for i in range(len(trans)):
            if len(trans[i]) < trg_len:
                continue
            tran = trans[i][0:trg_len]
            sen = self.tool.idxes2chars(tran)
            sen = "".join(sen)
            if trg_len > 4 and self.dtool.checkIfInLib(sen):
                continue
            new_trans.append(tran)
            new_align.append(align[i])
            new_states.append(states[i])
            new_costs.append(costs[i])

        return new_trans, new_costs, new_align, new_states

Example #7

Show file

File: train.py Project: yw1991/nlp-journey

# coding=utf-8
# created by msgi on 2020/3/31 12:31 上午

from model import PoemModel

# 数据路径
DATA_PATH = './data/poetry.txt'
CONFIG_PATH = './config/config.pkl'

# 训练（有模型的时候直接家在）
model = PoemModel(DATA_PATH, CONFIG_PATH)