Python StateAction примеры использования

Язык программирования: Python

Пространство имен/Пакет: representations

Класс/Тип: StateAction

Примеров на hotexamples.com: 5

Python StateAction - 5 примеров найдено. Это лучшие примеры Python кода для representations.StateAction, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

StateAction(4)

get_action_rep_drqa(1)

get_obs_rep(1)

step(1)

Пример #1

Показать файл

Файл: env.py Проект: isyuanyin/SHA-KG

 def reset(self):
     # Initialize state_rep: containing graphs
     self.state_rep = StateAction(self.spm_model, self.vocab,
                                  self.vocab_rev, self.tsv_file,
                                  self.max_word_len)
     self.stuck_steps = 0
     self.valid_steps = 0
     self.episode_steps = 0
     obs, info = self.env.reset()
     info['valid'] = False
     info['steps'] = 0
     # Build initialized graph info with action "look"
     graph_info = self._build_graph_rep('look', obs)
     return obs, info, graph_info

Пример #2

Показать файл

Файл: env.py Проект: spencerfrazier/KG-A2C

 def reset(self):
     self.state_rep = StateAction(self.spm_model, self.vocab,
                                  self.vocab_rev, self.tsv_file,
                                  self.max_word_len)
     self.stuck_steps = 0
     self.valid_steps = 0
     self.episode_steps = 0
     obs, info = self.env.reset()
     info['valid'] = False
     info['steps'] = 0
     graph_info = self._build_graph_rep('look', obs)
     return obs, info, graph_info

Пример #3

Показать файл

Файл: env.py Проект: vishalbelsare/Q-BERT

 def soft_reset(self, gs, obs):
     self.stuck_steps = 0
     self.valid_steps = 0
     self.episode_steps = 0
     if self.clear_kg or gs is None:
         self.state_rep = StateAction(self.spm_model, self.vocab,
                                      self.vocab_rev, self.tsv_file,
                                      self.max_word_len, self.askbert,
                                      self.attr_file)
     else:
         graph_state, graph_state_rep = gs
         self.state_rep.graph_state = graph_state
         self.state_rep.graph_state_rep = graph_state_rep
     graph_info, _ = self._build_graph_rep('look', obs)
     return graph_info

Пример #4

Показать файл

Файл: env.py Проект: vishalbelsare/Q-BERT

 def clear_kgs(self):
     self.state_rep = StateAction(self.spm_model, self.vocab,
                                  self.vocab_rev, self.tsv_file,
                                  self.max_word_len, self.askbert,
                                  self.attr_file)

Пример #5

Показать файл

Файл: env.py Проект: isyuanyin/SHA-KG

class KGA2CEnv:
    '''
    KGA2C environment performs additional graph-based processing.
    '''
    def __init__(self,
                 rom_path,
                 seed,
                 spm_model,
                 tsv_file,
                 step_limit=None,
                 stuck_steps=10,
                 gat=True):
        random.seed(seed)
        np.random.seed(seed)
        self.rom_path = rom_path
        self.seed = seed
        self.episode_steps = 0
        self.stuck_steps = 0
        self.valid_steps = 0
        self.spm_model = spm_model
        self.tsv_file = tsv_file
        self.step_limit = step_limit
        self.max_stuck_steps = stuck_steps
        self.gat = gat
        self.env = None
        self.conn_valid = None
        self.conn_openie = None
        self.vocab = None
        self.vocab_rev = None
        self.state_rep = None

    def create(self):
        ''' Create the Jericho environment and connect to redis. '''
        self.env = jericho.FrotzEnv(self.rom_path, self.seed)
        self.bindings = jericho.load_bindings(self.rom_path)
        self.act_gen = TemplateActionGenerator(self.bindings)
        self.max_word_len = self.bindings['max_word_length']
        self.vocab, self.vocab_rev = load_vocab(self.env)
        self.conn_valid = redis.Redis(host='localhost', port=6381, db=0)
        self.conn_openie = redis.Redis(host='localhost', port=6381, db=1)

    def reset(self):
        # Initialize state_rep: containing graphs
        self.state_rep = StateAction(self.spm_model, self.vocab,
                                     self.vocab_rev, self.tsv_file,
                                     self.max_word_len)
        self.stuck_steps = 0
        self.valid_steps = 0
        self.episode_steps = 0
        obs, info = self.env.reset()
        info['valid'] = False
        info['steps'] = 0
        # Build initialized graph info with action "look"
        graph_info = self._build_graph_rep('look', obs)
        return obs, info, graph_info

    def step(self, action):
        self.episode_steps += 1
        obs, reward, done, info = self.env.step(action)
        info['valid'] = self.env.world_changed() or done
        info['steps'] = self.episode_steps
        if info['valid']:
            self.valid_steps += 1
            self.stuck_steps = 0
        else:
            self.stuck_steps += 1
        if (self.step_limit and self.valid_steps >= self.step_limit) \
           or self.stuck_steps > self.max_stuck_steps:
            done = True
        if done:
            graph_info = GraphInfo(
                objs=['all'],
                ob_rep=self.state_rep.get_obs_rep(obs, obs, obs, action),
                act_rep=self.state_rep.get_action_rep_drqa(action),
                graph_state=self.state_rep.graph_state,
                graph_state_rep=self.state_rep.graph_state_rep,
                graph_state_1_connectivity=self.state_rep.
                graph_state_1_connectivity,
                graph_state_rep_1_connectivity=self.state_rep.
                graph_state_rep_1_connectivity,
                graph_state_2_roomitem=self.state_rep.graph_state_2_roomitem,
                graph_state_rep_2_roomitem=self.state_rep.
                graph_state_rep_2_roomitem,
                graph_state_3_youritem=self.state_rep.graph_state_3_youritem,
                graph_state_rep_3_youritem=self.state_rep.
                graph_state_rep_3_youritem,
                graph_state_4_otherroom=self.state_rep.graph_state_4_otherroom,
                graph_state_rep_4_otherroom=self.state_rep.
                graph_state_rep_4_otherroom,
                graph_state_5_mask=self.state_rep.graph_state_5_mask,
                graph_state_rep_5_mask=self.state_rep.graph_state_rep_5_mask,
                admissible_actions=[],
                admissible_actions_rep=[])
        else:
            graph_info = self._build_graph_rep(action, obs)
        return obs, reward, done, info, graph_info

    def _build_graph_rep(self, action, ob_r):
        ''' Returns various graph-based representations of the current state. '''
        objs = [o[0] for o in self.env.identify_interactive_objects(ob_r)]
        objs.append('all')
        admissible_actions = self._get_admissible_actions(objs)
        admissible_actions_rep = [
            self.state_rep.get_action_rep_drqa(a.action)
            for a in admissible_actions
        ] if admissible_actions else [[0] * 20]
        try:  # Gather additional information about the new state
            save_str = self.env.save_str()
            ob_l = self.env.step('look')[0]
            self.env.load_str(save_str)
            ob_i = self.env.step('inventory')[0]
            self.env.load_str(save_str)
        except RuntimeError:
            print('RuntimeError: {}, Done: {}, Info: {}'.format(
                clean_obs(ob_r), done, info))
            ob_l = ob_i = ''
        ob_rep = self.state_rep.get_obs_rep(ob_l, ob_i, ob_r, action)
        cleaned_obs = clean_obs(ob_l + ' ' + ob_r)
        openie_cache = self.conn_openie.get(cleaned_obs)
        # Update
        if openie_cache is None:
            rules, tocache = self.state_rep.step(cleaned_obs,
                                                 ob_i,
                                                 objs,
                                                 action,
                                                 cache=None,
                                                 gat=self.gat)
            self.conn_openie.set(cleaned_obs, str(tocache))
        else:
            openie_cache = eval(openie_cache.decode('cp1252'))
            rules, _ = self.state_rep.step(cleaned_obs,
                                           ob_i,
                                           objs,
                                           action,
                                           cache=openie_cache,
                                           gat=self.gat)
        action_rep = self.state_rep.get_action_rep_drqa(action)
        return GraphInfo(
            objs=objs,
            ob_rep=ob_rep,
            act_rep=action_rep,
            graph_state=self.state_rep.graph_state,
            graph_state_rep=self.state_rep.graph_state_rep,
            graph_state_1_connectivity=self.state_rep.
            graph_state_1_connectivity,
            graph_state_rep_1_connectivity=self.state_rep.
            graph_state_rep_1_connectivity,
            graph_state_2_roomitem=self.state_rep.graph_state_2_roomitem,
            graph_state_rep_2_roomitem=self.state_rep.
            graph_state_rep_2_roomitem,
            graph_state_3_youritem=self.state_rep.graph_state_3_youritem,
            graph_state_rep_3_youritem=self.state_rep.
            graph_state_rep_3_youritem,
            graph_state_4_otherroom=self.state_rep.graph_state_4_otherroom,
            graph_state_rep_4_otherroom=self.state_rep.
            graph_state_rep_4_otherroom,
            graph_state_5_mask=self.state_rep.graph_state_5_mask,
            graph_state_rep_5_mask=self.state_rep.graph_state_rep_5_mask,
            admissible_actions=admissible_actions,
            admissible_actions_rep=admissible_actions_rep)

    def _get_admissible_actions(self, objs):
        ''' Queries Redis for a list of admissible actions from the current state. '''
        obj_ids = [self.vocab_rev[o[:self.max_word_len]] for o in objs]
        world_state_hash = self.env.get_world_state_hash()
        admissible = self.conn_valid.get(world_state_hash)
        if admissible is None:
            possible_acts = self.act_gen.generate_template_actions(
                objs, obj_ids)
            admissible = self.env.find_valid_actions(possible_acts)
            redis_valid_value = '/'.join([str(a) for a in admissible])
            self.conn_valid.set(world_state_hash, redis_valid_value)
        else:
            try:
                admissible = [
                    eval(a.strip())
                    for a in admissible.decode('cp1252').split('/')
                ]
            except Exception as e:
                print("Exception: {}. Admissible: {}".format(e, admissible))
        return admissible

    def close(self):
        self.env.close()