Python Episode.insert примеры использования

Язык программирования: Python

Пространство имен/Пакет: episode

Класс/Тип: Episode

Метод/Функция: insert

Примеров на hotexamples.com: 2

Python Episode.insert - 2 примера найдено. Это лучшие примеры Python кода для episode.Episode.insert, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Episode(30)

from_string(3)

tokenize(3)

title(3)

run(3)

player_wins(3)

compile_file_name(3)

generate(3)

Add(2)

update_file_meta(2)

opponent_wins(2)

insert(2)

guid(2)

getbyfeed(2)

get_last(2)

Clear(2)

url(2)

add(2)

Complete(2)

Episode2CSV(2)

_from_json(2)

enclosure_length(1)

Query(1)

show_name(1)

season(1)

scrap(1)

run_script(1)

_MigrateShare(1)

retime_subs(1)

retime_audio(1)

reset(1)

player_score(1)

play(1)

opponent_score(1)

episode(1)

description(1)

episodes_from_rss(1)

execute(1)

from_soup(1)

e_nr(1)

draw(1)

generate_symmetric(1)

demux(1)

mux(1)

get_title(1)

chapters(1)

cached(1)

add_step(1)

make_avs(1)

move_demuxed_files(1)

Пример #1

Показать файл

def collect_episode(bc, env):
    """
    :param bc: BehaviorCloning
    :param env: OpenAI gym environment
    """
    state = env.reset()
    episode = Episode(env.discount)
    done = False

    while not done:
        action, action_prob = bc.single_action(state)
        next_state, reward, done, _ = env.step(action)
        transition = Transition(state, action, action_prob, reward, next_state,
                                done)
        state = next_state
        episode.insert(transition)

    return episode

Пример #2

Показать файл

Файл: train_dqn.py Проект: geofragkos/discrete-off-policy-evaluation

def collect_episode(dqn, env, eps):
    """
    :param dqn: DQN
    :param env: OpenAI gym environment
    :param eps: rate of epsilon greedy exploration
    """
    state = env.reset()
    episode = Episode(env.discount)
    done = False

    while not done:
        action, action_prob = dqn.single_action(state, eps)
        next_state, reward, done, _ = env.step(action)
        transition = Transition(state, action, action_prob, reward, next_state,
                                done)
        state = next_state
        episode.insert(transition)

    return episode